[HTTP410] Trendforschung mit Google Books Ngrams

Ich war letzte Woche auf der Developer Conference 2013 in Hamburg. Es war eine gute Konferenz. Der vielseitige Mix aus Themen und Vorträgen bot genug Denkfutter für Entwickler und Nicht-Entwickler gleichermaßen. Wer an ein paar guten Zusammenfassungen interessiert ist, wird hier, hier und hier fündig.

Einer der interessanteren Vorträge, die ich in Erinnerung behielt, wurde von Dr. Felix Marczinowski  (Blue Yonder GmbH) zum Thema “Predictive Analytics in der Praxis” gehalten (hier eine etwas ältere Version des Vortrags). Nein, es folgen jetzt keine Details aus dem Vortrag. Es kommen auch keine Lobeshymnen auf BigData usw. Ich möchte Euch lediglich daran erinnern, nicht zu vergessen, dass DATEN auch in unserem Bereich eine wichtige Rolle spielen (und noch spielen werden). Also, liebe Recruiting-Statistik-Freunde da draußen, sammelt bitte bewusst Daten in Eurem Bereich: Klicks, Quellen, Verbleib auf den Stellenanzeige, Conversions usw. Eines Tages wird sich das garantiert auszahlen.

Warum Daten Spaß machen, wenn man erst einmal genug davon gesammelt hat, zeigt eine Entdeckung aus dem oben erwähnten Vortrag. Der Euch sicherlich bekannte Dienst Google Books erfasst und speichert ja seit einiger Zeit alle möglichen Bücher in digitaler Form. Was ich nicht wusste, ist, dass es ein Tool Namens “Ngrams” gibt, mit dem Wörter und Phrasen in dem Bestand von Google Books ausgezählt werden können. Ist das cool?! Man kann also z.B. analysieren, wann welche Themen auf besonderes Interesse gestoßen sind. Nach möglichen Korrelationen mit anderen Themen suchen. Und letztendlich sogar Prognosen erstellen.

Leider, leider gibt’s aktuell Daten nur bis 2008. Was soll’s, es ist trotzdem eine feine Sache. Hier ein paar schnelle Beispiele aus unserem Themenfeld:

Nicht übel. Was haltet Ihr davon?