Daten sind bares Geld und daher ist Big Data natürlich ein unermesslicher Reichtum — oder?
Die uneingeschränkte Sammelwut an Daten von Unternehmen bringt auch in Zeiten von Big Data nicht nur Vorteile, sondern vielmehr auch Probleme beim Datenschutz.
Doch was ist Big Data?
Big Data ist eine Ansammlung von Unmenge aus unstrukturierten Daten, welche mit herkömmlichen IT-Technologien nicht mehr beherrschbar sind.
Daher werden aus dieser Datensammlung mit Hilfe der vier Dimensionen
- Volume (Datenvolumen)
- Variety (Bandbreite an Datensourcen und Datentypen)
- Veracity (Echtheit der Daten)
- Velocity (Geschwindigkeit)
spezielle Information gezogen.
Algorithmen durchsuchen, analysieren und visualisieren die gewaltigen Datenmengen, um dadurch Antworten auf viele Fragen zu erhalten. Unter Umständen sogar auf welche, die zuvor so noch gar nicht gestellt wurden, weil dies nicht möglich war.
Big Data und die Sammelwut
Big Data wird oft auch als Industrie 4.0 verstanden, da die Daten das „neue“ Gold seien.
Das mag zwar sein, soweit die gesammelten und ausgewerteten Daten als Grundlage für Entscheidungsprozesse dienen oder sogar die Möglichkeit bieten, die Geschäftsfelder von morgen zu erkennen. Dies ist aber nicht immer der Fall.
Aus Big Data wird Smart Data
Durch intelligente Verarbeitung und Einsatz semantischer Technologien wird aus Big Data folglich Smart Data.
Mittels Smart Data wird die Geschwindigkeit und die Qualität der Entscheidungsgrundlagen erheblich verbessert. Dadurch erhält man zeitnah, in Echtzeit, ein geprüftes Wissen oder validiertes Ergebnis in Bezug auf die hinter der Abfrage stehende Fragestellung.
Das Unternehmen erfährt mittels Smart Data also bestenfalls nicht nur, was in seinem Unternehmen passiert, sondern auch, warum etwas passiert oder was demnächst passieren könnte.
Allerdings ist das nur dann der Fall, wenn die auszuwertenden Daten für die Fragestellung nutzbar und geeignet sind, Ergebnisse zu liefern.
Allein schon aus diesem Zusammenspiel von Big Data und Smart Data wird klar, dass die reine unsystematische Datensammlung nichts bringt.
Doch wo Licht ist, ist auch Schatten und so gibt es auch Probleme mit Big Data.
Das Speichern der Datenmasse führt nicht nur zu einem hohen CO2-Ausstoss, sondern verursacht letztendlich auch hohe Stromkosten sowie Kosten für die Speichermedien und die IT-Betreuung.
Dann können zusätzlich rechtliche Probleme und Bußgelder, die bei einer unrechtmäßigen Datenverarbeitung entstehen, hinzukommen und zu Buche schlagen.
Doch viel hilft nicht immer viel. Obwohl das Sammeln von Daten die Sammelwütigen zunächst nichts zu kosten scheint, wissen sie oftmals noch nicht einmal, ob und wofür die entsprechenden Daten jemals genutzt werden können.
Die Analyse inhaltlich nicht zusammenhängender Daten kann auch keine sinnhaften Ergebnisse liefern.
Die fleißigen Datensammler speichern Unmengen von Daten und nutzen diese aber nicht.
Es gilt der alte Grundsatz: Aus den Augen aus dem Sinn!
Zuerst belegen die Daten ungenutzt die Speichermedien und irgendwann weiß man gar nicht mehr, dass man sie hat, d.h. sie werden zu Dark Data. So nennt man die Daten, die nur noch beschränkt nutzbar sind.
Es kann nicht mehr vollständig auf diese zugegriffen werden, weil das Speichermedium nicht mehr gelesen werden kann (bspw. Diskette) oder weil sich keiner mehr an diese dunklen Daten erinnert.
Diese Fragestellung ist wohl die Wesentlichste von allen.
Denn auch wenn Dark Data nicht mehr zu lesen oder bereits sogar vergessen sind, bleiben diese doch von datenschutzrechtlicher Relevanz.
Die Vorgaben der DSGVO bei Big-Data-Anwendungen sind zu beachten!
Anders als Smart Data berücksichtigt die blinde Sammelleidenschaft bei Big Data, die wahllos Daten ermittelt, nicht den Datenminimierungsgedanken aus Art. 5 Abs. 1 lit. c DSGVO i.V.m. Art. 8 Abs. 2 EU-Grundrechtscharta.
Mit anderen Worten: Big Data ist grundsätzlich eine unzulässige Vorratsdatenspeicherung.
Teilweise werden die Daten präventiv ermittelt, ohne damit konkret einen Zweck zu verfolgen — ganz nach dem Credo “nur zur Sicherheit für alle Fälle”. In solchen Fällen ist auch ein Verstoß gegen den Zweckbindungsgrundsatz aus Art. 5 Abs. 1 lit. b DSGVO gegeben.
Zu beachten ist auch, dass unter Umständen eine Zweckänderung gem. Art. 6 Abs. IV DSGVO vorliegt.
Dieser Fall tritt ein, wenn Daten ursprünglich aufgrund einer Rechtsgrundlage erhoben wurden und dann mit Big Data oder Smart Data für einen anderen Zweck verwendet werden, soweit es sich nicht um eine privilegierte Verarbeitung handelt wie z.B. Forschung gem. Art. 5 Abs. 1 lit.b 2. HS i.V.m. Art. 89 Abs. 1 DSGVO.
In diesem Fall muss eine Rechtsgrundlage oder Einwilligung der betroffenen Person oder Personengruppe gegeben sein.
Jedoch dürfte es schwierig werden, Betroffene über die Zweckänderung gem. Art. 13 Abs. 3 DSGVO zu informieren sowie ggf. deren Einwilligung für den geänderten bzw. neuen Zweck einzuholen.
Im Verarbeitungsverzeichnis sind entsprechende Prozesse sowie die Datenverarbeitungen auch in der Datenschutzerklärung anzuführen. Doch bei der immensen Menge an Daten fällt ein Überblick oft schwer.
Was wäre aus der Sicht des Datenschutzes noch zu berücksichtigen?
Weniger ist oft mehr.
Dies zeigt sich gerade im Hinblick auf mögliche Bußgelder und den oftmals geringen Nutzen der Daten, insbesondere wenn diese überhaupt nicht genutzt werden.
Wichtiger wäre es, ganz bewusst für spezifische Fragestellungen konkrete Datengruppen zu erheben und dabei auch gleich an das Löschen der Daten zu denken.
In Bezug auf Löschvorgänge sind Unternehmen oft sehr großzügig. So fehlen meist geeignete Löschkonzepte, bereits vorhandene Strategien werden weder aktualisiert, geschweige denn tatsächlich auch umgesetzt.
Entscheidend für das erfolgreiche Löschen sind organisatorisch klare Zuständigkeiten. Es sollte eine Person geben, die auch die Entscheidung zum Löschen trifft und regelmäßig die Datenbestände kontrolliert.
Dabei sollte eine IT-Unterstützung im Datenmanagement herangezogen werden.
Die Haltung, sich erst im späteren Verlauf der Datenverarbeitung Gedanken zum Löschen zu machen, ist weit verbreitet: sich von etwas zu trennen, ist hart, auch wenn es “nur” Daten sind. Ein bestehendes Löschkonzept erleichtert dies und ist im Hinblick auf Big Data unerlässlich.
Also lassen Sie sich gut beraten!
1 Kommentar