Aus Daten Werte schöpfen

0
Teilen.

Über den Autor/ die Autorin

Andreas Brandenberg

Prof. Dr. Andreas Brandenberg ist Leiter des Instituts für Kommunikation und Marketing IKM und des Masters (MSc) in Applied Information and Data Science.

Die erste Welle der Big-Data-Euphorie hat sich hauptsächlich mit der Frage beschäftigt, wie der Daten-Ozean erschlossen werden kann. Die technische Verarbeitung dieser gigantischen Datenmengen ist jedoch nicht die eigentliche Herausforderung der Big-Data-Ökonomie. Viel entscheidender ist die intelligente Verwertung dieser Daten.

Das eigentliche Datenwachstum steht erst noch bevor. Der Grund ist einfach: Wir werden alle zu mobilen Sensoren, die mit anderen Sensoren immer intensiver kommunizieren. Egal wo Sie jetzt sind, sie ziehen eine breite Datenspur hinter sich her. Ihr Smartphone kommuniziert laufend mit ihrem Mobilfunkanbieter über Ihren Aufenthaltsort. Vielleicht tragen Sie an ihrem Handgelenk ein Fitbit, das laufend Ihr Bewegungsverhalten misst und Sie morgen in aller Herrgottsfrüh zum Lauftraining aufbietet. Dies sind Leistungen von mobilen Sensoren, die sich untereinander austauschen – ohne dass wir es mitbekommen.

Die Menge an Daten, die erstellt, vervielfältigt und konsumiert werden, liegt im Jahr 2020 bei etwa 40 Zettabytes.
Oder: Wenn ein Sandkorn ein Byte ist, dann entsprechen 40 Zettabyte etwa 57-mal der Menge aller Sandkörner an allen Stränden der Erde.

Wie entstehen eigentlich aus Daten Werte?

Google kündigte im Jahr 2004 ein unglaublich kühnes Vorhaben an: Jedes verfügbare Buch, das jemals geschrieben wurde, soll jedem Nutzer weltweit über Internet zugänglich sein.
Google Books ist nicht das erste Projekt, welches das schriftliche intellektuelle Erbe der Menschheit erschliessen wollte. Der entscheidende Unterschied von Google Books zu allen anderen Projekten besteht darin, dass Google die Bücher nicht nur «digitalisiert», sondern auch «datafiziert» hat.

«Digitalisierung» heisst, dass Google von jeder einzelnen Seite jedes verfügbaren Buches ein digitales Bild erstellt. Alles was Digitalisierung hervorbringt sind Bilder von Textseiten, die sich erst durch einen menschlichen Leser in nützliche Informationen verwandeln. Der eigentlich entscheidende Schritt bestand darin, eine optische Schriftenerkennungssoftware einzusetzen, die aus den Textbildern Buchstaben, Wörter, Sätze, Abschnitte usw. herauslesen konnte. Erst jetzt wurde der Text auch Computern und Algorithmen zugänglich. Erst dadurch werden die Datenmengen maschinell bearbeitbar.

Algorithmen lernen Menschen lesen

• Aufenthaltsorte («geo-loco»)
• Beziehungen (z.B. Facebook)
• Erlebnisse (z.B. Twitter)
• Stimmungen (z.B. Twitter)
• Gesundheit (z.B. Fitbit)
• Bildungswege und Jobperspektiven (z.B. LinkedIn, Xing)

Und wenn Sie im Sinne eines Selbstchecks Ihr Alter und Ihre visuelle Attraktivität bewerten lassen wollen, dann können Sie das mit www.how-old.net (Alter) oder www.faces.ethz.ch (Attraktivität).

Alles wird zu Daten…

Bilder gehören zu den Datenquellen mit der höchsten Informationsdichte. Hier finden aktuell die wahrscheinlich bahnbrechendsten Entwicklungen statt. Schauen Sie nur, was in der Automobilindustrie passiert: «Autonomes Fahren» wird die gesamte Automotive-Industrie – einschliesslich der für uns wichtigen Zulieferindustrie – umkrempeln. Fahrzeugbauer sind in Zukunft immer weniger Motoreningenieure oder Designer. Sie werden immer mehr zu «Big Data»- Spezialisten. Ohne Weltklasse-Knowhow im Bereich der ultraschnellen Verarbeitung von Bild-, Laser- und Radardaten wäre es nicht möglich, dass autonom gesteuerte Fahrzeuge nahezu die gleiche Performance aufweisen, wie Formel1-Weltmeister Sebastian Vettel.

Privatsphäre

«You have zero privacy anyway – get over it!»

(Scott Nealy, ehem. CEO Sun)

Mit der zunehmenden Digitalisierung ziehen Menschen eine zunehmend dichtere Datenspur hinter sich her. Anonymität ist immer schwieriger zu garantieren. Neue Experimente mit Mobilitäts-, Telefonie- oder Konsumdaten zeigen, dass es erstaunlich wenige Daten braucht, um Personen mit hoher Wahrscheinlichkeit zu identifizieren. Und diese Daten erzählen immer Intimeres über uns: Aus CDR Daten (Call Detail Records) lässt sich erstaunlich genau die psychologische Disposition von Menschen ablesen (z.B. depressive Neigung). Daten des Fahrdienstes Uber entlarven Seitenspringer. Einkaufsdaten zeigen Schwangerschaften an. Aus Facebook-Likes lässt sich mit fast 90% Trefferwahrscheinlichkeit die sexuelle Orientierung bestimmen.

IDS Datenwelten

Seit Ende Juni 2015 gibt es den interdisziplinären Schwerpunkt «Datenwelten», der sich mit der Wertschöpfung, den Anwendungsfeldern und mit den Rahmenbedingungen rund um Big Data auseinandersetzt:
• Innovation: An konkreten Beispielen soll aufgezeig und nachgewiesen werden, wie aus Daten Werte geschöpft werden können («proof of concept») Fokus: Wertschöpfung
• Vielfalt: Das Potenzial innovativer Datenanwendungen soll in möglichst unterschiedlichen Anwendungskontexten aufgezeigt werden Fokus: Anwendungsfelder
• Verantwortung: Erarbeitung von Frameworks, für eine nachhaltige und verantwortungsvolle Nutzung von Daten Fokus: Rahmenbedingung


Kommentar hinterlassen