Big Data

Daten sind bares Geld und daher ist Big Data natür­lich ein uner­mess­li­cher Reich­tum — oder? 

Die unein­ge­schränk­te Sam­mel­wut an Daten von Unter­neh­men bringt auch in Zei­ten von Big Data nicht nur Vor­tei­le, son­dern viel­mehr auch Pro­ble­me beim Datenschutz.

Doch was ist Big Data?

Big Data ist eine Ansamm­lung von Unmen­ge aus unstruk­tu­rier­ten Daten, wel­che mit her­kömm­li­chen IT-Tech­no­lo­gien nicht mehr beherrsch­bar sind.

Daher wer­den aus die­ser Daten­samm­lung mit Hil­fe der vier Dimensionen

  • Volu­me (Daten­vo­lu­men)
  • Varie­ty (Band­brei­te an Daten­sour­cen und Datentypen)
  • Ver­a­ci­ty (Echt­heit der Daten)
  • Velo­ci­ty (Geschwin­dig­keit)

spe­zi­el­le Infor­ma­ti­on gezogen.

Algo­rith­men durch­su­chen, ana­ly­sie­ren und visua­li­sie­ren die gewal­ti­gen Daten­men­gen, um dadurch Ant­wor­ten auf vie­le Fra­gen zu erhal­ten. Unter Umstän­den sogar auf wel­che, die zuvor so noch gar nicht gestellt wur­den, weil dies nicht mög­lich war.

Big Data und die Sammelwut

Big Data wird oft auch als Indus­trie 4.0 ver­stan­den, da die Daten das „neue“ Gold seien.

Das mag zwar sein, soweit die gesam­mel­ten und aus­ge­wer­te­ten Daten als Grund­la­ge für Ent­schei­dungs­pro­zes­se die­nen oder sogar die Mög­lich­keit bie­ten, die Geschäfts­fel­der von mor­gen zu erken­nen. Dies ist aber nicht immer der Fall.

Aus Big Data wird Smart Data

Durch intel­li­gen­te Ver­ar­bei­tung und Ein­satz seman­ti­scher Tech­no­lo­gien wird aus Big Data folg­lich Smart Data.

Mit­tels Smart Data wird die Geschwin­dig­keit und die Qua­li­tät der Ent­schei­dungs­grund­la­gen erheb­lich ver­bes­sert. Dadurch erhält man zeit­nah, in Echt­zeit, ein geprüf­tes Wis­sen oder vali­dier­tes Ergeb­nis in Bezug auf die hin­ter der Abfra­ge ste­hen­de Fragestellung.

Das Unter­neh­men erfährt mit­tels Smart Data also bes­ten­falls nicht nur, was in sei­nem Unter­neh­men pas­siert, son­dern auch, war­um etwas pas­siert oder was dem­nächst pas­sie­ren könnte.

Aller­dings ist das nur dann der Fall, wenn die aus­zu­wer­ten­den Daten für die Fra­ge­stel­lung nutz­bar und geeig­net sind, Ergeb­nis­se zu liefern.

Allein schon aus die­sem Zusam­men­spiel von Big Data und Smart Data wird klar, dass die rei­ne unsys­te­ma­ti­sche Daten­samm­lung nichts bringt.

Doch wo Licht ist, ist auch Schat­ten und so gibt es auch Pro­ble­me mit Big Data.

Die Kos­ten der Sammelwut

Das Spei­chern der Daten­mas­se führt nicht nur zu einem hohen CO2-Aus­stoss, son­dern ver­ur­sacht letzt­end­lich auch hohe Strom­kos­ten sowie Kos­ten für die Spei­cher­me­di­en und die IT-Betreuung.

Dann kön­nen zusätz­lich recht­li­che Pro­ble­me und Buß­gel­der, die bei einer unrecht­mä­ßi­gen Daten­ver­ar­bei­tung ent­ste­hen, hin­zu­kom­men und zu Buche schlagen.

Unge­naue Ant­wor­ten auf drän­gen­de Fragestellungen

Doch viel hilft nicht immer viel. Obwohl das Sam­meln von Daten die Sam­mel­wü­ti­gen zunächst nichts zu kos­ten scheint, wis­sen sie oft­mals noch nicht ein­mal, ob und wofür die ent­spre­chen­den Daten jemals genutzt wer­den können.

Die Ana­ly­se inhalt­lich nicht zusam­men­hän­gen­der Daten kann auch kei­ne sinn­haf­ten Ergeb­nis­se liefern.

Kei­ne genaue Kennt­nis über die vor­han­de­nen Daten

Die flei­ßi­gen Daten­samm­ler spei­chern Unmen­gen von Daten und nut­zen die­se aber nicht.

Es gilt der alte Grund­satz: Aus den Augen aus dem Sinn!

Zuerst bele­gen die Daten unge­nutzt die Spei­cher­me­di­en und irgend­wann weiß man gar nicht mehr, dass man sie hat, d.h. sie wer­den zu Dark Data. So nennt man die Daten, die nur noch beschränkt nutz­bar sind.

Es kann nicht mehr voll­stän­dig auf die­se zuge­grif­fen wer­den, weil das Spei­cher­me­di­um nicht mehr gele­sen wer­den kann (bspw. Dis­ket­te) oder weil sich kei­ner mehr an die­se dunk­len Daten erinnert.

Daten­schutz bei Big Data

Die­se Fra­ge­stel­lung ist wohl die Wesent­lichs­te von allen.

Denn auch wenn Dark Data nicht mehr zu lesen oder bereits sogar ver­ges­sen sind, blei­ben die­se doch von daten­schutz­recht­li­cher Relevanz.

Die Vor­ga­ben der DSGVO bei Big-Data-Anwen­dun­gen sind zu beachten!

Daten­mi­ni­mie­rung

Anders als Smart Data berück­sich­tigt die blin­de Sam­mel­lei­den­schaft bei Big Data, die wahl­los Daten ermit­telt, nicht den Daten­mi­ni­mie­rungs­ge­dan­ken aus Art. 5 Abs. 1 lit. c DSGVO i.V.m. Art. 8 Abs. 2 EU-Grundrechtscharta.

Mit ande­ren Wor­ten: Big Data ist grund­sätz­lich eine unzu­läs­si­ge Vorratsdatenspeicherung.

Zweck­bin­dung

Teil­wei­se wer­den die Daten prä­ven­tiv ermit­telt, ohne damit kon­kret einen Zweck zu ver­fol­gen — ganz nach dem Cre­do “nur zur Sicher­heit für alle Fäl­le”. In sol­chen Fäl­len ist auch ein Ver­stoß gegen den Zweck­bin­dungs­grund­satz aus Art. 5 Abs. 1 lit. b DSGVO gegeben.

Feh­len­de Rechts­grund­la­ge bzw. Einwilligung

Zu beach­ten ist auch, dass unter Umstän­den eine Zweck­än­de­rung gem. Art. 6 Abs. IV DSGVO vorliegt. 

Die­ser Fall tritt ein, wenn Daten ursprüng­lich auf­grund einer Rechts­grund­la­ge erho­ben wur­den und dann mit Big Data oder Smart Data für einen ande­ren Zweck ver­wen­det wer­den, soweit es sich nicht um eine pri­vi­le­gier­te Ver­ar­bei­tung han­delt wie z.B. For­schung gem. Art. 5 Abs. 1 lit.b 2. HS i.V.m. Art. 89 Abs. 1 DSGVO.

In die­sem Fall muss eine Rechts­grund­la­ge oder Ein­wil­li­gung der betrof­fe­nen Per­son oder Per­so­nen­grup­pe gege­ben sein.

Jedoch dürf­te es schwie­rig wer­den, Betrof­fe­ne über die Zweck­än­de­rung gem. Art. 13 Abs. 3 DSGVO zu infor­mie­ren sowie ggf. deren Ein­wil­li­gung für den geän­der­ten bzw. neu­en Zweck einzuholen.

Doku­men­ta­ti­on

Im Ver­ar­bei­tungs­ver­zeich­nis sind ent­spre­chen­de Pro­zes­se sowie die Daten­ver­ar­bei­tun­gen auch in der Daten­schutz­er­klä­rung anzu­füh­ren. Doch bei der immensen Men­ge an Daten fällt ein Über­blick oft schwer.

Was wäre aus der Sicht des Daten­schut­zes noch zu berücksichtigen?

Weni­ger ist oft mehr.

Dies zeigt sich gera­de im Hin­blick auf mög­li­che Buß­gel­der und den oft­mals gerin­gen Nut­zen der Daten, ins­be­son­de­re wenn die­se über­haupt nicht genutzt werden.

Wich­ti­ger wäre es, ganz bewusst für spe­zi­fi­sche Fra­ge­stel­lun­gen kon­kre­te Daten­grup­pen zu erhe­ben und dabei auch gleich an das Löschen der Daten zu denken.

In Bezug auf Lösch­vor­gän­ge sind Unter­neh­men oft sehr groß­zü­gig. So feh­len meist geeig­ne­te Lösch­kon­zep­te, bereits vor­han­de­ne Stra­te­gien wer­den weder aktua­li­siert, geschwei­ge denn tat­säch­lich auch umgesetzt.

Ent­schei­dend für das erfolg­rei­che Löschen sind orga­ni­sa­to­risch kla­re Zustän­dig­kei­ten. Es soll­te eine Per­son geben, die auch die Ent­schei­dung zum Löschen trifft und regel­mä­ßig die Daten­be­stän­de kontrolliert.

Dabei soll­te eine IT-Unter­stüt­zung im Daten­ma­nage­ment her­an­ge­zo­gen werden.

Die Hal­tung, sich erst im spä­te­ren Ver­lauf der Daten­ver­ar­bei­tung Gedan­ken zum Löschen zu machen, ist weit ver­brei­tet: sich von etwas zu tren­nen, ist hart, auch wenn es “nur” Daten sind. Ein bestehen­des Lösch­kon­zept erleich­tert dies und ist im Hin­blick auf Big Data unerlässlich.

Also las­sen Sie sich gut beraten!

Kommentar hinzufügen