6.6 min readPublished On: 2. September 2021By Categories: Bücher, Wissen

Was kann Big Data leisten und was nicht?

Wir wollen Data Scientisten werden.

Was es mit dem Begriff „Big Data“ auf sich hat, ist mir 2020 zum ersten Mal bewusst geworden, als ich in einem Raum voller Menschen saß, die gemeinsam mit mir einen Data-Science-Kurs absolvierten.

Was ist Big Data?

„Unter Big Data versteht man Daten, die in großer Vielfalt, in großen Mengen und mit noch höherer Geschwindigkeit anfallen. […] Diese Datensätze sind so umfangreich, dass klassische Datenverarbeitungssoftware sie nicht verwalten können.“

https://www.oracle.com/de/big-data/what-is-big-data/

Was genau Oracle mit „großen Mengen“ meint wird in meinen Augen anhand dieser Zahlen deutlich, die internetlivestats zur Verfügung stellt:

Jede Sekunde werden

  1. 9.618 Tweets auf Twitter versendet.
  2. 1.095 Fotos auf Instagram hochgeladen.
  3. 1.941 Posts auf Tumblr veröffentlicht.
  4. 5.958 Skype Anrufe geführt.
  5. 126.203 Gigabyte Daten im Internet bewegt.
  6. 94.732 Suchanfragen bei Google gestellt.
  7. 91.230 YouTube Videos angesehen.
  8. 3.059.006 E-Mails versendet.

Da ist eine Quellenangabe dran, das muss stimmen.

Vor meinem Data-Science-Kurs war ich der festen Überzeugung, dass alles, was eine auf Daten beruhende Quellenangabe hat, auch stimmt. Nach diesem Kurs hat sich diese Überzeugung in Luft aufgelöst. Es gibt zum einen nicht nur viele Wege, Daten absichtlich zu manipulieren, es gibt zudem auch viele unbeabsichtigte Fehler, die bei der Datenerhebung und -auswertung passieren können und damit das Ergebnis beeinflussen. Ein verantwortungsvoller Data Scientist ist sich dessen bewusst und arbeitet daher vorsichtig. Diese Vorsicht beginnt schon bei der Fragestellung an die Daten. Ein verantwortungsvoller Data Scientist weiß, dass er bestimmte Fragen gar nicht erst stellen muß, da er mittels Daten zwar Antworten auf diese Fragen erhält, aber diese lediglich eine Korrelation, aber keine Kausalität belegen.

Was kann Software dank Big Data leisten?

Big Data versetzt Software laut einem Google Kontakt Der Autor

Martin Lindstrom: Small Data. Was Kunden wirklich wollen – wie man aus winzigen Hinweisen geniale Schlüsse zieht, S. 25,

kommt zu dem Ergebnis, dass Big Data eine Software in die Lage versetzt, anhand

  1. der Dateneingabe und der Anzahl der Tippfehler zu 70 % einzuschätzen, wie Menschen sich fühlen,
  2. des Grads der Verwendung von Großbuchstaben mit 79 % Genauigkeit auf die Bonität des Nutzers schließen kann.

Ich war im Stress und hatte keine Zeit für die Korrektur.

Auf den ersten Blick scheint dies eine unglaublich beeindruckende Leistung zu sein. Doch mein Bauchgefühl sagt mir, dass der Mensch in Punkt 1 immer noch besser als die Software ist. Wenn mir ein Mensch, der normalerweise auf Rechtschreibung achtet, eine E-Mail voller Tippfehler sendet, weiß ich, dass dieser Mensch beim Schreiben dieser Mail nicht entspannt und gelassen war. Ich glaube, dass es nicht wenige Menschen gibt, die in der Lage sind, die Software in Punkt 1 zu schlagen. Auf den zweiten Blick ist die Leistung der Software also gar nicht so unglaublich beeindruckend.

Small Data

Unser heutiger Autor ist ein Experte in Sachen Small Data. Small Data sind winzige Datenmengen, die ihn als Berater in die Lage versetzen, Unternehmen ungewöhnliche Strategien für eine erfolgreiche Zukunft zu empfehlen. So erzählt unser Autor in seinem Buch die Geschichte von einem ausgelatschten Kinderschuh, der Lego vor dem Aus rettete. Diese Geschichte möchte ich hier mit Dir teilen, um die Idee von Small Data zu erklären.

Lange Zeit war Lego ein Verkaufsschlager. Doch dann hielt die Technik Einzug in die Welt der Spielzimmer. Immer mehr Kinder zockten lieber am Computer oder mit Konsolenspielen und ließen die bunten Bausteine in der Ecke liegen. In dieser Situation wandte sich Lego 2004 an unseren Autor und beauftragte ihn damit, eine übergreifende Markenstrategie zu entwickeln.

Die Schuhe beweisen, dass ich viel trainiere.

Der Autor besuchte einen elfjährigen Lego-Fan, um mehr über diese lukrative Zielgruppe zu erfahren. Dieser Junge zeigte dem Autor stolz ein paar Schuhe und erklärte, dass die Abnutzungen auf den Schuhen bewiesen, dass der Junge ein erfolgreicher Skateboarder war. Dieses Paar Skateboard-Schuhe inspirierte unseren Autor zu dem Gedanken, dass Kinder Herausforderungen lieben und ihre Fähigkeiten gern mit Beweisstücken wie den abgewetzten Schuhen belegen würden. Für die Abnutzungen an den Schuhen zu sorgen hatte den Jungen viel Arbeit und Zeit gekostet, und er war stolz darauf.

Ich frage mich schon lange, was mit Lego passiert ist. Ich hatte damals noch bunte Steine und genügend Fantasie, um alle möglichen Dinge mit den Steinen zu bauen, die mir ein Nachbarsjunge im Austausch für meine Barbies zur Verfügung stellte. Heute dagegen erlebe ich fasziniert Menschen, die Lego-Sets aus mehreren tausend Teilen zusammengebaut haben und diese stolz auf Twitter posten. Möglicherweise war es tatsächlich unser Autor, der dafür sorgte, dass Lego von Bausteinen auf Sets umstellte und so das Unternehmen in eine erfolgreiche Zukunft führte.

Bauchgefühl vs. datenbasierte Entscheidungen

Auf Facebook ist die Grundlage eines Unternehmens gewachsen.

Ich gehöre zu den Menschen, denen die Arbeit mit Daten schon immer schwer gefallen ist. Ich treffe gern schnelle Entscheidungen. Als ich sah, dass mir über 1.000 Menschen auf Facebook folgten, entschied ich, ich einen eigenen Blog zu starten. Den Impuls für diese Entscheidung lieferten die vielen Follower. Ich sparte mir die Zeit, weitere Daten zu Rate zu ziehen, um die Wahrscheinlichkeit zu prognostizieren, ob mein Blog in der Lage sein würde, finanziell profitabel zu werden. Ich beschloss einfach, das Risiko, das ich damals sah (ca. 50 € monatliche Kosten plus Arbeitszeit), auf mich zu nehmen und lief einfach los.

Menschen, die in der Lage sind, Entscheidungen datenbasiert zu treffen, faszinieren mich unglaublich. Lange Zeit dachte ich, ich würde ihnen nie das Wasser reichen können, weil meine Bauchentscheidungen nie so gut sein könnten, wie ihre datenbasierten Entscheidungen. Inzwischen habe ich verstanden, dass datenbasierte Entscheidungen nicht immer richtig sind. Auch erlebe ich immer wieder Menschen, die nicht in der Lage sind, Entscheidungen zu treffen, weil die Daten, die sie haben, keine eindeutigen Schlüsse zulassen.

Obwohl mir Themen wie Big Data, Small Data und Co. in den letzten Jahren vertrauter geworden sind, bin ich noch immer nicht in der Lage, datenbasierte Entscheidungen zu fällen. Allerdings kenne ich inzwischen Menschen, die über diese Fähigkeit verfügen und die gewillt sind, mir an dieser Stelle bei Bedarf unter die Arme zu greifen. Dank dieser Menschen bin ich in der Lage, bei Entscheidungen das Beste aus beiden Welten zu nutzen. Für Entscheidungen, die schnell gefällt werden müssen, nutze ich mein Bauchgefühl. Für langfristige Entscheidungen vertraue ich auf die Expertise meiner Datenjunkies.

Fazit

Big Data ist ein unglaublich faszinierendes Thema. Meine Vorstellungskraft reicht nicht, um mir auszumalen, was die Menschheit mit Hilfe von Big Data in Zukunft alles anstellen wird. Meine Fähigkeiten und mein Wissen reichen auch nach diesem Blogbeitrag noch immer nicht, um Big Data produktiv in meinem Alltag einsetzen zu können.

Zu meiner großen Freude bin ich mit dieser Unfähigkeit aber gar nicht so allein, wie ich bis heute dachte. Unser Autor kommt zu dem Ergebnis, dassselbst Su chmaschinen aktuell mit Hilfe von Big Data zwar ungewöhnliche Korrelationen aber keine Kausalitäten finden können. In meinen Augen ist das ein wichtiger Punkt in Sachen Big Data, den wir uns immer vor Augen halten sollten. Eine Korrelation mag spannend, beeindruckend oder auch amüsant sein. Eine Korrelation mit einer Kausalität zu verwechseln kann allerdings fatale Folgen haben.

Die Frage „Was kann Big Data leisten und was nicht?“ beantworte ich daher für mich wie folgt: Big Data kann uns dabei helfen, gute Entscheidungen zu treffen. Doch Big Data ist nicht in der Lage, uns vor falschen Entscheidungen zu bewahren.

An dieser Stelle bin ich neugierig: Wie sind Deiner Erfahrungen mit Big Data?