Google Analytics: Sitzungen vs. Klicks

Sitzungen, Nutzer, Seitenaufrufe – gerade Neulinge und Gelegenheitsnutzer in der Welt von Google Analytics haben nach unserer Erfahrung oft Schwierigkeiten, sich in der Begriffswelt dieses Tools zurecht zu finden.

Die Beantwortung der vermeintlich einfachen Frage, wieviele Menschen besuchen nun meine Seite, erweist sich in der Praxis als gar nicht so trivial.

Seitenaufrufe und Sitzungen in Google Analytics

Ist es darüber hinaus erforderlich, eine logische Brücke zu einem weiteren Tracking-System (z. B. einer Werbe-Plattform) zu schlagen, wird’s noch problematischer. Denn dort stößt man auf Begriffe wie Klicks, Website Klicks, Aufrufe, die als Hauptmetrik fungieren (so bei Google AdWords, Facebook Ads usw.), jedoch bei Google Analytics nicht auftauchen.

Kennwerte in Google Analytics auseinanderhalten

Was ist der Unterschied zwischen Klicks und Sitzungen?

Der Versuch, die “Klicks” aus Google Adwords oder die “Website Clicks” aus Facebook Ads in den Berichten von Google Analytics 1 zu 1 wiederzufinden, scheitert so regelmäßig. Denn Google Analytics verwendet durchgehend die sogenannten “Sitzungen” als Hauptmetrik.

Google Analytics verständlich erklärt

Ein Klick und eine Sitzung sind jedoch zwei fundamental unterschiedliche Konzepte. Dies ist bei Weitem nicht jedem GA-Nutzer bewusst und darüberhinaus nicht einfach zu verinnerlichen. Wir versuchen nun, mithilfe einer einfachen Analogie, etwas mehr Klarheit zu schaffen.

Denkt bitte an Die Fressbude um die Ecke, mit ein paar Tischen, an denen man sich die Speise- sowie die Getränkekarte geben und sich bedienen lassen kann. Du betrittst das Lokal und setzt Dich an den Tisch, der Wirt bemerkt Dich. In der Google Analytics Welt startet in diesem Augenblick eine “Sitzung”.

Ein Sitzung ist für eine begrenzte Zeit aktiv. (Irgendwann weiß der Wirt nämlich nicht mehr genau, dass Du Du bist und kein neuer Gast. Für unsere Analogie nehmen wir der Einfachheit halber bis 00:00 Uhr. Alle Deine Handlungen, die in dieser Zeitspanne stattfinden, sind Bestandteil dieser einen Sitzung, die Dir (dem Gast = “Nutzer”) eindeutig zugeordnet werden kann.

Mehrere Seitenaufrufe pro Sitzung

Du schaust Dir nun die Speisekarte an. Das ist vergleichbar mit einem “Seitenaufruf”.

[su_note note_color=”#fff” text_color=”#000″ radius=”0″]Unser imaginärer Google Analytics Zähler zeigt aktuell an:

1 Sitzung
1 Nutzer
1 Seitenaufruf.

(Ein Gast war heute zu Besuch und hat sich die Speisekarte angeschaut.)

[/su_note]

[promotional-banner id=”43316″]

Nachdem Du die Speisekarte überflogen hast, verlässt Du den Tisch und gehst vor die Tür zum Telefonieren. Nach 5 Minuten kommst Du wieder rein, setzt Dich zurück an Deinen Platz und schaust Dir nun die Getränkekarte an.

[su_note note_color=”#fff” text_color=”#000″ radius=”0″]Unser imaginärer Google Analytics Zähler zeigt aktuell an:

1 Sitzung
1 Nutzer
2 Seitenaufrufe.

(Ein Gast war heute zu Besuch und schaute sich die Speisekarte und anschließend die Getränkekarte an.)[/su_note]

Wichtig: Obwohl Du das Lokal kurz verlassen hast, läuft die ursprüngliche Sitzung weiter. Macht auch irgendwie Sinn. Obwohl Du das Lokal faktisch zwei Mal betreten hast, warst Du ja praktisch an dem besagten Tag nur ein mal zu Besuch.

Man merke sich: Ein Gast kann einem Lokal mehrere Besuche abstatten und dabei jeweils mehrere Handlungen ausüben. Oder in der GA-Welt, ein Nutzer kann einer Webseite mehrere Besuche abstatten und dabei jeweils mehrere Handlungen ausüben.

Sitzung vs Klick

Was ist jetzt ein Klick?

Ok, soweit die Logik von Google Analytics. Doch wie/wo dockt jetzt die Logik mit den “Klicks” an, die von Werbe-Plattformen und anderen Traffic-Lieferanten verwendet wird. Wo finden sich die Klicks in unserer  Analogie wieder?

Du gehst morgens an dem besagten Lokal vorbei. Davor steht ein Promoter und drückt Dir einen Werbe-Flyer in die Hand. Er sagt zu Dir, dass wenn Du diesen Flyer dem Wirt zeigst und nach der Getränkekarte fragst, der erste Drink umsonst sei. Du betrittst das Lokal, zeigst den Flyer und fragst nach der Getränkekarte. Der Promoter setzt in seine Strichliste zufrieden einen Strich, denn er wird vom Wirt pro generiertes Interesse bezahlt. Das ist vergleichbar mit dem “Klick” in der Welt der Online-Werbung. Ein Nutzer wurde dazu gebracht, einen ihn interessierenden Inhalt gezielt aufzurufen.

[su_note note_color=”#fff” text_color=”#000″ radius=”0″]Unser Google Analytics Zähler zeigt in dieser Situation:

1 Sitzung
1 Nutzer
1 Seitenaufruf.

Die Werbeplattform X, über die geworben wurde zeigt an: 1 Klick.[/su_note]

Du verlässt nun das Lokal wieder. Läufst um die Ecke und triffst einen weiteren Promoter. Der Wirt hat nämlich mehrere engagiert. Gleiches in Grün. 15 min später bist du mit dem neuen Flyer zurück im Lokal und forderst die Getränkekarte an. Zum zweite Mal wurde Dein Interesse geweckt.

[su_note note_color=”#fff” text_color=”#000″ radius=”0″]Unser Google Analytics Zähler zeigt in dieser Situation:

1 Sitzung
1 Nutzer
2 Seitenaufrufe.

Die Werbeplattform X, über die zum ersten Mal geworben wurde, zeigt an: 1 Klick.
Die Werbeplattform Y, über die zuletzt geworben wurde, zeigt an: 1 Klick.
Der Wirt muss bis jetzt insgesamt für 2 Werbeklicks zahlen.[/su_note]

Ein Nutzer, zwei Seitenaufrufe

In der Online-Welt könnte die komplette Story so aussehen. Ein potentieller Käufer sucht nach einem Produkt bei Google. Er klickt auf eine Anzeige und landet direkt auf der Produktseite. Er informiert sich, möchte aber das Angebot vergleichen. Er verlässt die Seite und recherchiert weiter. Einige Minuten später gibt er seine Suchanfrage erneut ein (er hat den Namen der Produktseite vergessen), klickt auf die bereits bekannte Anzeige und landet zum zweiten Mal auf der Produktseite, um evtl. den Kauf nun abzuschließen.

[su_note note_color=”#fff” text_color=”#000″ radius=”0″]Im Ergebnis erfasst Google Analytics:

1 Sitzung
1 Nutzer
2 Seitenaufrufe.

Google AdWords erfasst 2 Klicks, die der Werbende bezahlen muss.[/su_note]

Die gleiche Logik gilt auch im Bereich des Klick basierten Personalmarketings, wie im Fall unserer Lösung Jobspreader.

Verschiedene Kanäle führen den Jobsuchenden zur Webseite

Sitzungen sind keine Klicks!

Merkt Euch: Sitzungen sind keine Klicks! Sitzungen werden in den allermeisten Fällen recht deutlich von den Seitenaufrufen (und Klicks) nach unten abweichen. Wollt Ihr die Klick-Zahlen, die von den Werbeplattformen als Basis für die Abrechnung eingesetzt werden, mit den Google Analytics Zahlen abgleichen, verwendet, falls nichts anderes verordnet, Seitenaufrufe.

###promotional-banner###

Doch auch bei diesem Verfahren werdet Ihr keine 100% Übereinstimmung feststellen können. Aus technischen Gründen ergeben sich immer Unterschiede zwischen verschiedenen Messpunkten. Woran das liegt, werde ich in einem separaten Post erläutern.

Google Analytics Nutzer-Explorer: Bewerber-Verhalten analysieren

Das Web-Analyse Tool Google Analytics hat vor einigen Tagen eine neue Funktion freigeschaltet. Der sogenannte “Nutzer-Explorer” ermöglicht völlig neue Einblicke in das Verhalten der Besucher einer Webseite.

Sind bisher ausschließlich segmentierte Betrachtungsweisen möglich gewesen, also z. B. “wie viele Besucher kamen von wo?”, wird es ab jetzt möglich, die Handlungen !einzelner! Besucher über mehrere Aufenthalte (Sitzungen) hinweg zu betrachten.

Wie funktioniert das? Wie Ihr vielleicht wisst, verwendet Google Analytics (und andere Web-Analyse Tools) s.g. Cookies. Kleine Code-Stückchen, die beim ersten Besuch einer Webseite auf dem Rechner des Besuchers abgelegt werden, um ihn beim nächsten Besuch wieder identifizieren zu können. Mithilfe solcher Cookies lässt sich jedem Besucher im Grunde eine individuelle (anonymisierte) ID zuweisen. Unter dieser ID können dann alle Handlungen des Besuchers, bei jedem seiner Aufenthalte auf der Webseite registriert werden.

Ruft man den Nutzer-Explorer in Google Analytics, auf erhält man die Liste aller registrierten IDs (Client-ID) für den ausgewählten Zeitraum angezeigt. So sähe das für die Webseite wollmilchsau.de aus. In der letzten Woche wurden 5287 Nutzer eindeutig identifiziert.

Nutzer-Explorer: Bewerber-Verhalten

Jede Zeile stellt faktisch die “Akte” einer Person (bzw. ihres Rechners) da. Dazu erhalten wir gleich einige wichtige Daten, wie z.B. die Zahl der Aufenthalte (Sitzungen) oder die durchschnittliche Sitzungsdauer. Das ist schon mal ganz nett.

Richtig interessant wird es aber erst, wenn man so eine “Akte” aufmacht. Ich habe ein recht spannendes Beispiel für diesen Post ausgesucht.

Nutzer-Akten: einzelne Besuche analysieren

Hier haben wir jemanden, der sich bei uns beworben hat. Auf der linken Seite sehen wir, wann der Besucher (bzw. de Bewerber) erstmalig identifiziert wurde, den Akquisitionskanal sowie die Gerätekategorie. Auf der rechten Seite sehen wir die Interaktionen des Besuchers mit unserer Seite (samt Zeitpunkt).

In diesem konkreten Fall landete der Bewerber zunächst auf der Anzeige auf unserer Karriere-Webseite, besuchte dann den “über uns” Bereich, kehrte zurück zur Anzeige, informierte sich über das Team und schickte schließlich seine Bewerbung ab. Das Ganze dauerte 22 Minuten.

Ab hier sind unterschiedlichste, interessanteste Anwendungsszenarien solcher Daten (zur Analyse des Bewerber-Verhaltens) denkbar. Betrachtet man z. B. eine Gruppe von Nutzern, die ähnliche Verhaltensmuster aufweisen, lassen sich Hypothesen über die Gruppe bzw. über die Inhalte, mit denen sie interagiert, aufstellen. Daraus können Ideen zur Verbesserung der Inhalte (z. B. Aufbau der Karriere-Webseite) oder der Ansprache auf den jeweiligen Akquisitionskanälen entstehen.

Oder ein ganz anderer praktischer Gedanke. Da ich über den Zeitstempel der Bewerbung den Bewerber eindeutig identifizieren kann, sehe ich anhand seiner “Akte”, wie gut er/sie sich über mein Unternehmen informiert hat. Diese Erkenntnis kann ich in die Vorauswahl bzw. in das Vorstellungsgespräch mitnehmen. Auch nicht schlecht.

Ihr seht, mit Google Analytics geht eine ganze Menge. Der Nutzer-Explorer ist eine wirklich tolle Erweiterung, die Ihr Euch auf jeden Fall anschauen solltet. Macht Spaß!

Und falls Ihr Hilfe mit Google Analytics braucht, füllt einfach das kurze Formular unter dem Artikel aus, und wir helfen Euch gerne.

###promotional-banner###

Vom heißen Trend zur Realität: HR Analytics

Schon in den letzten Jahren wurde HR Analytics als eines der heißesten Themen der Branche gehandelt. Bekanntlich dauert es jedoch etwas, bis solche Trends auch im realen Leben ankommen. Laut des umfangreichen Global Human Capital Trend 2016 Report, der Anfang letzter Woche von dem Wirtschaftsprüfungsunternehmen Deloitte veröffentlicht wurde, ist es jedoch langsam soweit. Dort wird dem Thema People Analytics ein eigenes Kapitel gewidmet – und siehe da, es tut sich etwas.

###promotional-banner###

Zur Erinnerung, People Analytics (hierzulande eher unter dem Begriff HR Analytics bekannt) soll subjektive Entscheidungen in Personal- und Organisationsfragen mithilfe von Daten fundierter und zielgerichteter machen. Interne und externe Daten rund um ein Unternehmen können vor dem Hintergrund von Sozial- oder Motivationspsychologie, Verhaltenswissenschaften oder Business Intelligence analysiert werden und mithilfe von statistischen Mitteln untersucht und weiterverwendet werden (z.B. durch die Umwandlung in Algorithmen etc.).

Während in den vergangenen Jahren viel und ausführlich über das Thema gesprochen wurde, nimmt die reale “People Analytics Revolution” nun tatsächlich im globalen Rahmen Fahrt auf. Von den knapp 7100 befragten Unternehmen und HRlern gaben letztes Jahr nur 4% an, tatsächlich in der Lage zu sein, anhand von Analytics HR-bezogene Vorhersage-Modelle erstellen zu können. Dieses Jahr sind es immerhin doppelt so viele. 32% der Unternehmen glauben, sie seien (in welcher Form auch immer) bereit für Analytics, immerhin ein Drittel mehr als im Jahr zuvor.

Dazu trägt laut Deloitte neben der steigenden Akzeptanz für das Thema auch der vereinfachte Zugang bei, da Analytics Technologie immer häufiger von vornherein in ERP-oder Bewerbersysteme integriert ist. Vor allem Cloud-basierte Systeme mit integrierten Analytics Tools erlauben es den Unternehmen, HR-Daten im Großen und Ganzen zu sehen. Nahezu 40% der befragten Unternehmen planen die Anschaffung neuer HR-Systeme über den Zeitraum der nächsten 2 Jahre oder haben ihr altes System bereits kürzlich ersetzt. Mit der Nachfrage wächst auch das Angebot, nicht nur auf technischer Ebene, sondern auch an Arbeitskräften.

Companies are now bringing industrial and organizational psychologists, statisticians, and analysts from other domains into HR; they are attracted to analytics because it is an exciting, new, and still-fluid area.

Die Zahlen sprechen für sich: Im Durchschnitt halten 77% der Teilnehmer People Analytics für wichtig.

Verwunderlich ist das nicht. So kann People Analytics in den verschiedensten Bereichen, abhängig etwa von der jeweiligen Branche, nutzbringend sein. Im Report werden eine ganze Reihe von Beispielen aufgeführt, von denen hier nur wenige aufgegriffen werden sollen:

  • Ein High-Tech Unternehmen konnte erfolgreich ein Analytics Modell erstellen, dass präzise voraussagt, welche Bewerber sich als “giftige Mitarbeiter” erweisen sollten (also solche, die lügen, betrügen und auch sonst jede Menge kriminelle Energie haben).
  • Automobilhersteller studieren die Muster von ungeplanter Abwesenheit ihrer Mitarbeiter, um voraussagen zu können, wann sich die Mitarbeiter wahrscheinlich einen Tag freinehmen. Dies ermöglicht ihnen, anschließend zusätzliche Arbeitskräfte für eine bekannte Zeitperiode von Abwesenheit einzuplanen und so abzufedern.
  • In Zusammenarbeit mit einer Softwarefirma analysiert ein Pharmakonzern Daten von LinkedIn und anderen sozialen Netzwerken, um unter ihren “high potential employees” diejenigen zu identifizieren, bei welchen ein wahrscheinlich hohes “Flucht-Risiko” zu erwarten ist.

Die Einsatzmöglichkeiten sind vielfältig, erstrecken sich von Recruiting, Produktivität, Einhaltung ethischer Grundsätze (etwa bei Banken) bis hin zu firmenkulturellen Belangen.

Trotzdem bleibt natürlich noch jede Menge Raum für Verbesserungen. 62% der befragten Unternehmen schätzen sich selbst bei der Nutzung von Big Data zu Recruiting-Zwecken als “schwach” ein. Aber die HRler haben die Bedeutung von Analytics grundsätzlich erkannt: 82% von ihnen stufen das Thema als “wichtig” oder “sehr wichtig” ein, während das im Vergleich nur 69% der Geschäftsleute aus anderen Bereichen tun.

Wie aber sieht das bei deutschen Unternehmen und HRlern aus? Leider müssen wir hier einmal mehr mit weniger prickelnden Neuigkeiten aufwarten. Die 209 befragten deutschen Unternehmen bieten im Vergleich ein doch eher enttäuschendes Bild:

HR Analytics Umfrage

Weit abgeschlagen hinter Australien, Südost-Asien und Nord- und Südamerika zeigt West-Europa (mit den erfreulichen Ausnahmen von Italien und den Niederlanden), im Verhältnis zu anderen Regionen, nur erschreckend wenig Interesse an der Materie. Deutschland darf sich hier neben Frankreich zu den ganz schwarzen Schafen zählen.

Wären wir hoffnungslose Zyniker, könnten wir natürlich schreiben, das wäre mal wieder klar gewesen – “das war ja mal wieder klar”.

Wir haben eingesehen, dass neue Entwicklungen in der hiesigen HR-Szene nicht von heute auf morgen adaptiert werden. Außerdem ist gerade hierzulande alles, was mit Big Data in Berührung kommt, ein empfindliches Thema – Stichwort Datenschutz. Da es bei People Analytics um personenbezogene Daten geht, fallen sie meist unter das Bundesdatenschutzgesetz und verlangen überdies eine betriebsrätliche Mitbestimmung.

Eine Rechtfertigung für mangelndes Interesse ist das aber nicht. Wir können nur hoffen, dass das gewaltige Potential von HR Analytics nicht an deutschen Unternehmen vorbeizieht.

[HTTP410] People Analytics zum Anfassen

Im seinem Artikel über Personalarbeit bei Google hat Jan im Juli das Thema “People Analytics” als “eines der heißesten HR-Trendthemen” bezeichnet. Daran hat sich auch in den letzten Monaten nichts geändert. Analysiert man die weltweiten Suchbegriff-Trends, stellt das laufende Jahr den Höhepunkt des Interesses für die Begriffe People Analytics und HR Analytics dar.

Das Interesse an Begriffen wie HR Analytics und People Analytics steigt stetig an.

Auch wenn der deutschsprachige Raum etwas hinterher hängt, dieser Trend wird sich nicht so schnell ändern. Große Unternehmen entdecken das Thema und positionieren sich gerade. Zuletzt kaufte Microsoft die Firma VoloMetrix, die den E-Mail Verkehr und die Kalender der Mitarbeiter auswertet, um die Produktivität zu analysieren und Verbesserungen vorzuschlagen. Die Kauf-Begründung des Microsoft CEOs:

Even small improvements in a person’s day-to-day effectiveness can add up to significant value for an organization and greater employee happiness. … Giving people access to real data and objective, personalized feedback can lead to a virtuous cycle of improvement for both individuals and their company.

Das hört sich toll an. Alles soll besser und alle sollen happy werden. Doch ich kann mir vorstellen, dass nicht jeder Bewohner der Arbeitswelt, den neuen Möglichkeiten offen gegenüber steht. Gerade hierzulande dürfte die Vorstellung einer systematischen Sammlung und Auswertung von Mitarbeiterdaten noch bei vielen von Euch, ob Arbeitgeber oder Arbeitnehmer, vorsichtige Zurückhaltung, Misstrauen oder gar Angst und Schrecken auslösen.

Christopher Mims von der New York Times stellt sich die “düstere” nahe Zukunft in etwas so vor und spricht wohl vielen Skeptikern aus der Seele:

Imagine a top corporate executive of the future. Instead of finding out what’s going on in her company by asking her subordinates, she consults a digital dashboard that tells her everything from who is at their desk to how happy they are about it.

The result is something academics have dubbed “people analytics,” and it treats the humans in an organization just like any other asset in the supply chain: as something that can be monitored, analyzed and reconfigured.

Ich bin mir persönlich jedoch nicht so sicher, ob die negativ anmutende, unmenschliche Interpretation der Technologie tatsächlich die treffende ist.

Ein einfaches Beispiel: In vielen Unternehmen werden die Krankheitstage erfasst. Am Ende des Jahres schaut sich der Manager seine Excel-Tabelle an und stellt fest, dass der Mitarbeiter A – X Krankheitstage aufweist. Ohne zusätzliche Kennzahlen, wie z. B. Durchschnitt nach Alter, Position, Branche und sonstige Leistungsmerkmale, könnte die Beurteilung zu einer recht subjektiven Angelegenheit werden. Gerade wenn der Manager dem Mitarbeiter gegenüber voreingenommen ist. Das Ergebnis kann auf diese Weise “unmenschlicher” ausfallen, als bei einer emotionslosen “People Analytics Maschine”, die einfach alle relevanten Werte zur Verfügung hat und einbezieht, um eben eine möglichst objektive Empfehlung auszusprechen.

Technologie und Systematik muss nicht zwangsläufig böse und unmenschlich sein. Ich denke, das menschliche Misstrauen wird oft dadurch bedingt, dass wir einfach nicht genau wissen, wovon wir reden. Wir lesen etwas von Überwachung und malen uns die schlimmsten Szenarien aus.

Der People Analytics Software Anbieter Talent Lab sieht das wohl ähnlich. Auf ihrer Seite kann jeder ihre Software auf spielerische Weise erkunden und besser nachvollziehen, was der Einsatz in der Praxis bedeutet und bringen kann. Es stehen mehrere ausführliche Datasets zur Verfügung. Politiker Sportler und sogar Superhelden können quasi als Mitarbeiter unter die Lupe genommen werden. Eine schöne Idee. Probiert’s aus. Vielleicht hilft es dabei, etwas Misstrauen abzubauen. Vielleicht aber auch nicht.

People Analytics Software Anbieter Talent Lab zeigt sein Dashboard

Hier habe ich z. B. das Superhelden-Unternehmen nach den Kriterien Gute/Böse sowie Intelligenz geclustert. Viel Spaß beim Spielen!

Maschinelles Lernen und HR: Eine Einführung

Im Rahmen des HR-Battles auf persoblogger.de verteidigte Jan Kirchner vor kurzem die These, dass Algorithmen zukünftig menschliche Recruiter ersetzen können. Seine offenbar polarisierenden Statements zogen einige Aufmerksamkeit auf sich und ernteten nicht allzu viel Beifall. Es folgten einige Debatten. Geht das? Geht das nicht, dass Maschinen den (Vor-)Auswahlprozess übernehmen usw.?

Die skeptischen, teils gar ängstlich anmutenden Reaktionen sind womöglich auf fehlendes Wissen Bereich künstliche Intelligenz und maschinelles Lernen zurückzuführen. Ich möchte mit dieser Aussage niemandem zu nahe treten. Ich finde einfach, dass es uns allen helfen kann, etwas tiefer in das Thema einzutauchen – damit wir etwas besser verstehen, worüber wir da debattieren. (Das Thema wird uns noch eine Weile begleiten). Wenn wir wissen, wie Maschinen lernen, können wir besser einschätzen, wo die Möglichkeiten und wo die Grenzen liegen.

Wie gerufen kommt das wunderbare experimentelle Projekt R2D3, das uns “normalen Menschen” die Funktionsweise des Maschinellen Lernens auf eine einfache, visuelle Weise erklären möchte. Das Ergebnis gefällt mir so gut, dass ich es hier gerne ein wenig angepasst ins Deutsche übertragen möchte. Die wunderschöne Animation in englischer Sprache kann hier abgerufen werden.

* * *

“Maschinelles Lernen” beschreibt den Vorgang, bei dem Computer, unterstützt von statistischen Methoden und Modellen, die Erkennung von Mustern (Gesetzmäßigkeiten) “erlernen”. Das so erlangte künstliche Wissen, kann zur Generierung von Vorhersagen eingesetzt werden.

Im Folgenden wird am Beispiel eines Wohnraum-Datensatzes ein maschinelles Lernmodell aufgebaut, das selbständig entscheiden soll, ob sich ein Mietobjekt in New York oder in San Francisco befindet.

Übertragung in den HR-Kontext: Wir bringen der Maschine bei, auf Basis von alten Bewerbungen zu unterscheiden, welcher Bewerber passt und welcher nicht.

Schauen wir uns diese beiden “Stapel” an. Links haben wir die Höhenlage der Häuser in SF und rechts der Häuser in NY.

Aufbau eines maschinellen Lernmodells

Müssten wir jetzt intuitiv eine eindeutige Regel für zukünftige Unterscheidungen anhand eines einzigen Kriteriums (Höhenlage) definieren, würden wir vermutlich festlegen, dass alles, was höher als 73 Fuß liegt, sich in SF befindet.

HR-Kontext: Stellt Euch vor, dass es sich um zwei Bewerber-Stapel handelt. Links – passend, rechts – unpassend. Ersetzen wir mal gedanklich das Kriterium Höhenlage durch Berufserfahrung (Jahre). Alle die über z.B. 5 Jahren Berufserfahrung liegen, müssten mit Sicherheit passen.

Nun fügen wir ein weiteres Kriterium hinzu: den Preis pro Fläche. Es lässt sich eine weitere Gesetzmäßigkeit erkennen. Wohnraum ab einem Preis von $1776/sqft aufwärts liegt eindeutig nur in New York.

Komplexer werdende Gesetzmäßigkeiten
Je mehr Kriterien hinzugefügt werden, desto komplexer werden die erkennbaren Gesetzmäßigkeiten.

Ein gewisser Teil unserer Daten ließe sich also gemäß unseren bisherigen Erkenntnissen anhand der Höhenlage und des Preises der einen oder anderen Stadt zuordnen.

HR: Ersetzen wir gedanklich den Preis durch die Länge der Studiendauer. Es würde sich bei unserem hypothetischen Beispiel die folgende Gesetzmäßigkeit ergeben: Alle Bewerber, die mehr als 5 Jahren Berufserfahrung vorweisen, passen auf jeden Fall, und alle, die länger als 10 Jahre studiert haben, passen nicht.

So weit, so gut. Problematisch wird es bei der Unterscheidung des “gemischten” Teils des Datensatzes im weißen Rechteck – also Wohnraum in einer Höhenlage unter 73ft und in der Preiskategorie unter $1776/sqft, der sowohl in SF als auch in NY vorkommen kann.

HR: Bei unseren Bewerbern wäre es die Teil-Gruppe, in der die Bewerber mit unter 5 Jahren Erfahrung dennoch angenommen wurden und Bewerber mit unter 10 Jahren Studienzeit dennoch abgelehnt. 

Wir benötigen offensichtlich weitere Kriterien. Insgesamt enthält der Wohnraum-Datensatz 7 Kriterien. Setzen wir sie alle jeweils ins Verhältnis zueinander, wie im oberen Chart, ergibt sich das folgende Bild, in dem eindeutig weitere Zusammenhänge vorherrschen, die jedoch mit bloßem Auge, Logik oder Intuition nicht mehr zu erkennen sind.

Scatterplot
Der Scatterplot zeigt Zusammenhänge, die mit dem bloßen Auge oder mit Intuition längst nicht mehr identifizierbar wären.

Spätestens jetzt kommt maschinelles Lernen zum Einsatz. Als Methode wird hier ein Entscheidungsbaum eingesetzt. Der Datensatz wird anhand eines Kriteriums nach dem anderen und anhand des dazugehörigen Entscheidungswertes (split point) immer wieder in zwei Gruppen gesplittet.

“Wenn die Höhenlage höher als X ist, dann ist das Haus vermutlich in SF, der Rest liegt in NY”.  Dann geht’s weiter, “wenn der Preis über Y liegt, befindet sich das Haus in NY, der Rest liegt in SF”. Beim Lernprozess wird dabei bei jeder Spaltung ein optimaler Entscheidungswert gesucht, der den Datensatz möglichst sauber in zwei homogene Gruppen aufteilt.

HR: Stellt Euch vor, dass wir unsere Kriterien Berufserfahrung und Studienzeit nun um SAP HR Kenntnisse (1-10), die englische Sprache (1-10) und die Abschlussnote (4-1) ergänzen. Dann nehmen wir uns jedes Kriterium vor, das wir jeweils anhand eines Entscheidungswerts in passend und unpassend aufteilen.  

Denken wir nun an unsere erste intuitive Schätzung in der ersten Abbildung zurück. Wir haben angenommen, dass alle Objekte in einer Höhenlage ab 73Ft in SF liegen. Lässt man nun den gesamten Datensatz anhand des Kriteriums Höhenlage bei X=73Ft aufteilen, ergibt sich folgendes Bild.

Segmentierung
Unzureichende differenzierte Segmentierung kann Fehlschlüsse zur Folge haben.

Der Wohnraum, der höher als 73Ft liegt (als faktisch ab 74Ft), befindet sich zwar zu 100% in SF, aber wir vermissen eben eine ganze Menge Häuser, die fälschlicherweise in der NY Gruppe gelandet sind, obwohl sie doch in SF liegen.

HR: Vergleichbar wäre hier die Vorstellung, dass wir z. B. im Fall des Kriteriums Berufserfahrung zunächst intuitiv angenommen haben, dass 5 Jahre eine gute Grenze ist, um Passende von Unpassenden zu trennen. Bei der Aufteilung im Entscheidungsbaum fällt jedoch auf, dass wir so zu viele passende verlieren. Der Entscheidungswert muss wohl nachjustiert werden.

Mithilfe zusätzlicher mathematischer Methoden kann ein optimaler Entscheidungswert gesucht werden.  Die Maschine lernt und findet für das Kriterium Höhenlage einen besseren Entscheidungswert (ab 28 Ft), der eine höhere Homogenität der Ergebnisse verspricht. Dennoch ist die Genauigkeit mit 82% noch zu schlecht.

Optimaler Entscheidungswert
Mithilfe zusätzlicher mathematischer Methoden kann ein optimaler Entscheidungswert gesucht werden.

Führt man nun mehrere Aufteilungen unter Berücksichtigung der optimalen Entscheidungswerte nach einander durch, erhöht sich die Genauigkeit der Schätzung sukzessive. Wir teilen z.B. zunächst nach der Höhenlage, dann die beiden Ergebnis-Gruppen nach dem Preis, dann nach dem Baujahr usw.

Maschinelles Lernen = Aufbau eines Entscheidungsbaums

Die sauberen Gruppen werden aufgesammelt und zu SF oder NY zusammengefasst. Die Maschine hat gelernt, den vorhandenen Datensatz exakt aufzuteilen.

Ergebnis des Decision Tree

HR: Wer bis hier meine Übertragungen einordnen konnte, wird das Prinzip auf die passenden und die unpassenden Bewerber sicher übertragen können. Wir teilen zunächst z. B. nach Berufserfahrung bei dem optimierten Wert von 4 Jahren auf und erhalten nicht ganz aber fast homogene Gruppen. Die Gruppe der Unpassenden, die ein paar Passende enthält und die Gruppe der Passenden, die wiederum ein paar Unpassende enthält unterteilen wir jeweils wieder anhand von einem anderen Kriterium. Am Ende hat die Maschine die Bewerber sauber aufgeteilt.

Im nächsten Schritt muss das Model anhand von noch nicht bekannten Daten (neuer Datensatz) getestet werden, um zu prüfen, wie gut es für die Praxis geeignet ist. Bei größeren Abweichungen, kann an verschieden Stellen nachjustiert werden. Und so weiter und so fort. Ich denke, hier sollten wir erstmal Pause machen.

So kann maschinelles Lernen jedenfalls funktionieren. Ich hoffe, dass Ihr diese Darstellung interessant fandet und meine HR-Übertragungen einigermaßen nachvollziehen konntet. So viel Zauberei ist hier wohl doch nicht dabei, oder? Werden die Maschinen nun alles übernehmen oder nicht?

Eins ist klar, ohne eine vernünftige Datenbasis läuft hier so oder so nix. Sammelt fleißig Daten, wenn Ihr von Maschinen übernommen werden wollt 🙂 Oder zumindest, um zu belegen, dass Ihr eben besser als die Maschinen seid.

(Liebe Mathematiker und Informatiker, sollten mir hier unverzeihliche sachliche Fehler unterlaufen sein, bitte ich um freundliche Hinweise.)

People Analytics: wie Google Daten für die Personalarbeit nutzt

People Analytics ist aktuell eines der heißesten HR-Trendthemen. Wie so häufig, ist Google dabei einer der Pioniere, was nicht zuletzt an der datengetriebenen Ingenieurskultur bei Google liegt. Letztes Jahr habe ich Euch schon vorgestellt, wie Google-Verantwortliche im Bestreben um Gerechtigkeit mit einer Formel über Beförderungen entscheiden. Heute möchte ich Euch drei weitere Cases vorstellen, in denen Google mithilfe von Datenanalysen bessere HR-Entscheidungen trifft.

Die Kerneigenschaften erfolgreicher Manager

Eine der zentralen Kernfragen in der Führungskräfteentwicklung lautet: Was zeichnet einen guten Manager aus? Ausgehend von der kulturgetriebenen Hypothese, dass einen guten Manager vor allem umfassende Fachkenntnis auszeichnet, hat Google tausende Feedbackgespräche ausgewertet, in denen Mitarbeiter ihre Manager beurteilt haben und deren Aussagen mit Performance-Werten angereichert. Herausgekommen ist dabei folgende Liste mit 8 Eigenschaften erfolgreicher Führungskräfte.

8 Eigenschaften erfolgreicher Google Manager

Diese Liste mag für viele von Euch keine großen Überraschungen enthalten. Aber anders als das durchschnittliche Personaler-Bauchgefühl basieren sie eben auf Daten tausenden von Feedback-Gesprächen und Performance-Reviews, was zumindest in meinen Augen mehr Substanz verleiht.

Welche Einstellungspolitik ist am besten für die Organisationsentwicklung?

Im Rahmen des organisatorischen Reifeprozesses kam bei Google die Frage auf, wie sich die Einstellungspolitik auf die weitere Organisationsentwicklung auswirken würde. Konkret gingen die People Analytics Manager bei Google dabei der Frage nach, ob es strategisch besser für die Organisation wäre, Mitarbeiter, die das Unternehmen verlassen, durch Neueinstellungen auf demselben Senioritätslevel zu ersetzen oder stattdessen lieber auf jüngere Neueinstellungen zu setzen.

[promotional-banner id=”43316″]

Angesichts der finanziellen Erfolgsbilanz gehe ich davon aus, dass diese Frage nicht wie in vielen anderen Unternehmen vom Controlling angeregt wurde, und es dabei um ein besseres Verständnis der Steigerung von Motivationsanreizen und Mitarbeiterperformance ging. Als Ausgangshypothese dienten dabei folgende drei Szenarien:

Zusammenhang von Beförderungen, Organisationsentwicklung und Einstellungspolitik

Das Ergebnis der Analyse führte dann zu einer Änderung der Einstellungspolitik zugunsten jüngerer Mitarbeiter, denen man so eine bessere Perspektive bieten konnte, als das im Falle der Nachbesetzung von Mitarbeitern gleichen Senioritätsgrade der Fall war. Auswirkungen der Einstellungspolitik

Mythbusters oder warum werden immer die anderen befördert?

Der dritte Bereich, dem Google mittels Daten an den Kragen gegangen ist, sind Mitarbeiter-Mythen. Dabei handelt es sich um Thesen wie “Immer werden bei der Beförderung die Kollegen aus der Zentrale bevorzugt” und ähnlich gelagerte Vorurteile, die die Mitarbeitermotivation beeinträchtigen und sich schlimmstenfalls in einer höheren Fluktuationquote niederschlagen.

Mitarbeiter-Mythen bei Google

Um dem Wahrheitsgehalt dieser Vorurteile auf den Grund zu gehen, kam dabei wie auch bei den anderen Fragestellungen folgender Prozess zum Einsatz: Analyseprozess datengetriebener HR-Entscheidungen

Das Ergebnis hat die Vorurteile nicht nur widerlegt, sondern dank fokussierte Mitarbeiterkommunikation grundsätzlich damit aufgeräumt. Die folgende Folie zeigt dabei gleich nochmal den Gesamtprozess von People Analytics anhand dieses einfach nachvollziehbaren Falles.

Mythbuster Ergebnis

Wenn Ihr noch besser verstehen wollt, wie Google an People Analytics herangeht, empfehle ich Euch folgendes Vortragsvideo.

Bei Klick wird dieses Video von den YouTube Servern geladen. Details siehe Datenschutzerklärung.

LinkedIn und Bitkom Studie zu Big Data im Personalmanagement

Wenn selbst die Bundesregierung mit Begriffen wie „Arbeit 4.0“ um sich wirft, deutet wohl alles daraufhin, dass sich Digitalisierung und Big Data zukünftig nicht so leicht ignorieren lassen werden. Offen ist die Frage, welche Veränderungen das eigentlich mit sich bringt. LinkedIn und Bitkom liefern mit ihrer Studie „Big Data im Personalmanagement“ wichtige Einblicke in den digitalen Wandel der klassisch analogen Personalabteilung.

Befragt wurden 408 Personalentscheider und Mitglieder der Geschäftsführung oder des Vorstands von deutschen Unternehmen mit mindestens 50 Mitarbeitern. In den Interviews ging es insbesondere um die derzeitige Nutzung, die geplante Nutzung, den Kenntnisstand und die Art der Nutzung im Zusammenhang mit Big Data.

Teilweise kamen dabei (für mich) überraschende Ergebnisse zum Vorschein. Vorerst möchte ich mich auf zwei Erkenntnisse beschränken und jeweils ein vorsichtiges „Warum?“ in die Runde werfen:

1. Größere Unternehmen (ab 500 Mitarbeitern) stehen dem Thema Big Data im Personalwesen deutlich offener gegenüber als kleinere Unternehmen.

Warum?

Meinungen zu Big Data im Personalmanagement
Quelle: LinkedIn-/Bitkom-Studie “Big Data im Personalmanagement”

Klar, größere Unternehmen verfügen auch im Personalmanagement meist über die größeren personellen und monetären Ressourcen. Der Personaler, der mit 30 Kollegen in einem Büro sitzt und eh gerade Zeit hat, beschäftigt sich vermutlich bereitwilliger mit der „neuen“ Thematik als die ohnehin überforderten zweieinhalb Leute in der kleinen Personalabteilung um die Ecke.

Allerdings sollte auch den kleineren Unternehmen daran gelegen sein, Schritt zu halten. Auch die Beschränkung der IT-gestützten Analyse auf unternehmensinterne Daten (Stammdaten, Krankheitstage, etc.) ist schon einmal ein großer Schritt um sich „Big Data“ zu nähern. Und je nach Umfang sollte „ein kleines bisschen Big Data“ zeitlich und finanziell für jede Unternehmensgröße erschwinglich sein.

2. Fast 80% der befragten Unternehmen nutzen bereits unternehmensinterne Daten für Analysen im Personalwesen, allerdings kaum im Zusammenhang mit der Personalbeschaffung.

Warum?

Nutzung interner Daten im Personalmanagement
Quelle: LinkedIn-/Bitkom-Studie “Big Data im Personalmanagement”

Die Top 3 der intern gesammelten und analysierten Daten bilden die Stammdaten, Krankheitstage und Daten zur Entlohnung von Mitarbeitern. Sicherlich lassen sich hiermit beispielsweise aktuelle Strukturen und Entwicklungen hinsichtlich der eigenen Mitarbeiter und möglicherweise nötige Maßnahmen des Personalmanagements ableiten.

Wieso sollte man sich aber auf solche Analysen beschränken, wenn man auch das Recruiting vorantreiben kann? Die Aspekte des Rekrutierungs- und Marketingbudgets, der genutzten Rekrutierungskanäle und der Bewerbungen belegen die letzten Plätze bei der Frage nach der digitalen Datensammlung und –verarbeitung. Dabei sollte insbesondere Personalern eines mit Sicherheit bewusst sein: Recruiting kostet Geld. Zwar sind Budgets für Recruiting sinnvoll angelegte Kostenpunkte, doch wer beispielsweise genutzte Rekrutierungskanäle kennt, analysiert und differenziert, wird in der Lage sein Kosten einzusparen und noch sinnvoller zu investieren.

Natürlich lassen sich aus der umfangreichen Befragung noch zahlreiche weitere Erkenntnisse ableiten. Festhalten möchte ich zunächst nur Folgendes: „Big Data“ ist ein „Big Topic“ und die Verantwortlichen in Personalmanagement und Führungsebene scheinen sich darüber zunehmend im Klaren zu sein. Wenn sich diese Bereitschaft auch auf kleinere Unternehmen ausweitet und das Recruiting etwas mehr in den Fokus rückt, können endlich auch Unternehmen und Bewerber von diesen Entwicklungen profitieren.

Datengetriebene Direktansprache: Eine praktische Anleitung von LinkedIn

Daten sind in. Dabei sind sie mal das Schwert und mal das Öl des 21. Jahrhunderts. Einig sind wir uns aber alle darin, dass wir mit ihrer Hilfe unsere Entscheidungen, unser Handeln und die daraus resultierenden Ergebnisse verbessern können. Wie datengetriebene Direktansprache funktioniert, hat Brendan Browne, VP Global Talent Acquisition bei LinkedIn, letzte Woche in drei einfachen Schritten auf der SourceCon vorgestellt.

1. Erwartungsmanagement zwischen Hiring Manager und Talent Pool:

Die Anforderungsliste der Fachbereiche ist häufig lang und die gewünschte Skill-Kombination selten. Die Einigung auf ein realistisches Anforderungsprofil ist häufig langwierig und führt zu Frust bei (abgesagten) Kandidaten, Recruitern und Hiring Managern. Brendan empfiehlt eine Datenschau in Echtzeit, um Diskrepanzen zwischen Wunsch und Wirklichkeit frühzeitig aufzuzeigen. So kann der Recruiter dem Hiring Manager schon bei der Abstimmung des Anforderungsprofils mithilfe einer Live-Suche aufzeigen, welche Muss-Kriterien die Erfolgsaussichten stark einschränken und besser Kann-Kriterien sein sollten. Wie das geht, zeigt er anhand des Profils eines Data Center Operation Managers…

Mithilfe eines Datensatzes werden die Erwartungen abgesteckt.

für das er dem Hiring Manager je nach Anforderungsliste die Zahl passender Suchtreffer zeigt:

Hohe Erwartungen führen zu wenigen Ergebnissen.

2. Versteckte Talentpools finden

Nachdem die Erfolgsaussichten intern gesteigert wurden, geht es nun um die Analyse der externen Erfolgsparameter. Hier empfiehlt Brendan eine absolute regionale Analyse des gesuchten-Fachkräftepools…

Wo sind Talent Pools verfügbar?

sowie den anschließenden regionalen Abgleich mit der Zahl der jeweils ausgeschriebenen Stellen. Das Ergebnis wird in einem Angebots-Nachfrage-Quadranten abgetragen:

Diese Matrix stellt Angebot und Nachfrage gegenüber.

Die Werte errechnet Ihr am Besten mit dieser kleinen Hilfstabelle:

Datengetriebene Direktansprache orientiert sich am regionalen Angebot im Verhältnis zur Nachfrage.

3. Vernetzungsanalyse des eigenen Unternehmens:

Nachdem man nun weiß, in welchen Städten bzw. Regionen das Angebot-Nachfrage-Verhältnis am günstigsten ist, empfiehlt Brandon als letzten Vorbereitungsschritt noch zu analysieren, an welchen Orten die Mitarbeiter des eigenen Unternehmens am besten vernetzt sind und die Arbeitgebermarke am bekanntesten ist. Dazu analysiert man einfach die 10 oder 20 größten Zielfirmen vor Ort:

Mitarbeiter-Vernetzungsanalyse

Anhand des Vernetzungsgrades weiß man nun, in welcher Stadt die Aussichten besser sind und kann mit der Ansprache loslegen.

Hier findet Ihr den Artikel von Brendan.

Google Analytics und die Signifikanz Deiner Entscheidungen

Auch in dieser Woche wenden wir unsere Aufmerksamkeit Google Analytics zu. Es ist eben ein wichtiges und gerade im Bereich HR ein hochaktuelles Thema. Wer seine Analytics-Hausaufgaben ordentlich macht, ist grundsätzlich im Vorteil – bei der Entscheidungsfindung, Einleitung und Kontrolle von Optimierungsmaßnahmen.

In der Praxis wird allerdings klar, dass nicht immer jede Entscheidung bzw. Maßnahme und deren Resultate sich 100% genau messen und eindeutig nachvollziehen lassen. Es kann  schon mal vorkommen, dass man eine rein zufällige Tendenz für das Resultat einer vermeintlich klugen Entscheidung hält (Buchempfehlung: Fooled by Randomness).

Die Gefahr der Verzerrung durch den Zufall

Im Fall von Web-Analytics besteht diese Gefahr z.B., wenn Ursache und Wirkung nicht eindeutig zuzuordnen sind. Oder wenn die zahlenmäßige Auswirkung einer vermeintlichen Ursache sich nicht gerade im eindeutigen Bereich bewegt – “von 0 auf täglich 180”.

Beispiele für nicht ganz eindeutige, je nach Fall schwer messbare, Zuordnungen wären:

  • Offline-Event (z.B. Azubi-Messe) -> Veränderung der Zahl “neuer Besucher” auf der Seite
  • SEO-Optimierung des Seitenaufbaus -> Veränderung der Verweildauer auf der Seite
  • Anpassung des mobilen Bewerbungs-Formulars -> Veränderung der Zahl der mobilen Bewerbungen
  • Neues Kommunikationskonzept der Webseite -> Wie viel hat das in Zahlen gebracht?

uvm.

Also, stellt Euch vor, Ihr macht ein schönes Azubi-Event, bemerkt in der gleichen Woche ein paar mehr Nutzer auf der Seite und sagt, “Cool, das Event hat’s voll gebracht. Machen wir nächstes Mal wieder”. In Wirklichkeit handelte es sich bei dem Anstieg aber um eine ganz normale, rein zufällige Schwankung, die bei Euch auf der Seite hin und wieder vorkommt.

Und auch wenn Ihr ganz tolle Analytiker seid und wisst, Eure Daten ordentlich zu “sezieren”, ist der pure Zufall mit dem bloßen Auge nicht immer ganz einfach zu erkennen. Zumal wir uns ja insgeheim wünschen, dass unsere Entscheidungen gut sind.  Daher sind wir bei der Beurteilung der Ergebnisse voreingenommen.

Beispiel in eigener Sache

Wir haben zu Beginn des Jahres einige SEO-Maßnahmen auf dieser Seite umgesetzt, die unter anderem darauf zielten, mehr neue Besucher zu generieren. Hier die kurzfristige Auswertung.

In der Detailansicht wirkt die Zahl der neugewonnen Besucher signifikant.

“Da bewegt sich doch tendenziell was nach oben. Sieht gut aus, fühlt sich gut an. Läuft”, könnte ich meinen. Schauen wir uns nun ein größeres Zeitintervall an.

Aus der Vogelperspektive sehen die Besucherzahlen schon wieder ganz anders aus.

Aha. Und nu? Die zweite Darstellung lässt meine ursprüngliche Euphorie etwas schwinden. Denn ganz so eindeutig wie vorhin sehen und fühlen sich die Auswirkungen unserer Maßnahmen doch nicht an. Ist die positive Entwicklung seit Anfang des Jahres das Ergebnis unsere Maßnahmen oder nicht bzw. gibt es überhaupt ein “Ergebnis”? Und wenn ja, wie gut ist es ausgefallen im Vergleich zu dem was, vorher war. Wie kann ich das, was da passiert ist, genau beziffern?

Mark Edmondosn von der Seite online-behavior hat heute eine Methode vorgestellt, um schnell und einfach die statistische Signifikanz der von Google Analytics erfassbaren Daten zu bestimmen. Dabei können Nicht-Statistiker mithilfe seines selbst-entwickeltes Tool “GA-Effects” schätzen, wie wahrscheinlich es ist, dass die Auswirkungen ihrer Maßnahmen keine Zufälle sind. (Für Statistiker unter Euch – das Verfahren basiert auf Bayesscher Statistik und wurde im Jahr 2014 in einer Veröffentlichung  ausführlich beschrieben.)

Nun übertrage ich seine Schritt für Schritt Anleitung, die ich wegen weiterführender Erläuterungen im Original empfehle, auf unseren Fall.

Wie starten mit der Hypothese:

“Haben die SEO-Maßnahmen in der ersten Januar Woche signifikant zum Anstieg der neuen Besucher auf der Seite beigetragen und falls ja, in welchem Maße?”

Folgende Schritte sind notwendig, um die Hypothese zu prüfen:

  1. Ich rufe die Seite https://mark.shinyapps.io/ga-effect/ auf und erlaube den Zugriff auf mein GA-Konto (natürlich habe ich entsprechende GA-Rechte).Mit GA Effect lässt sich die statistische Signifikanz von Veränderungen überprüfen.
  2. Ich wähle ein Unterkonto aus.
  3. Nun wird der Zeitraum bestimmt. Mark empfiehlt die Daumenregel 7:3 (vor:nach der Maßnahme)
  4. Segment wählen. In unserem Fall “Search Traffic”. Denn unsere Erwartung war, dass sich die Maßnahmen vor allem in diesem Bereich auswirken würden.
  5. Metrik wählen. In unserem Fall “New Users”. Wir wollten ja möglichst die Zahl der neuen Nutzer positiv beeinflussen.Das GA Effect Setup ist relativ unkompliziert.
  6. Nun setze ich den Zeitpunkt der Maßnahme fest.
  7. Zum Schluss kann ich mit der Festlegung der bekannten regelmäßigen Schwankungen für mehr Präzision sorgen. Auf unserer Seite gibt es jedes Wochenende einen deutlichen Rückgang der Besucher.

Das Tool berücksichtigt saisonale Schwankungen auf Wunsch automatisch.

Das Ergebnis

Der Klick auf “Results” in der Sidebar führt uns zu der Schätzung entsprechend unseren Einstellungen.

Die Ergebnisse zeigen, dass die Veränderungen signifikant sind.

Wir sehen in dieser Ansicht, dass der Effekt der Maßnahme als Signifikat eingestuft wird. Es wird geschätzt, dass die Maßnahme bis heute etwa 7000 mehr neue Nutzer eingebracht hat und wir durchschnittlich 130% mehr neue Nutzer über die Suchmaschinen (Search-Traffic) generieren, als vor der Maßnahme. Der Chart zeigt das erwartete/geschätzte Intervall (grüne Fläche) und die tatsächliche Entwicklung (blaue Linie).

Zusätzlich können wir noch die kumulierte Darstellung des Effekts betrachten bzw. die Verknüpfung der tatsächlichen Werte vor und nach der Maßnahme mit den erwarteten Werten.

In der kumulierten Darstellung werden tatsächliche und erwartete Werte gegenübergestellt.

Zu guter Letzt kann man sich die statistische Beweisführung genau durchlesen. Dazu gibt es den schriftlichen Report.

Die statistische Beweisführung kann im Tool genau nachverfolgt werden.

Klar ist das hier eine statistische Schätzung, klar entspricht auch sie nicht zu 100% der Realität. Statistik sollte auch nicht als die ultimative Wahrheit gehandelt werden. Falls möglich, sollte so eine Schätzung nochmals mit dem gesunden Menschenverstand hinterfragt bzw. wenn möglich mit Hilfe anderer Daten verifiziert werden.

Fazit

In meinem konkreten Beispiel sagt mir meine Logik, dass die Schätzung der erwarteten Werte zu niedrig ausgefallen ist, da sie durchgehend leicht unter dem tatsächlichen Niveau aus der Vergangenheit liegt. Die Ursache liegt in dem extrem schwachen Monat Dezember, der die Schätzung verzerrt. Mir ist also klar, dass das tatsächliche Ergebnis meiner Maßnahme unter den angegebenen +7000 bzw. +130% liegen wird. Allerdings auch nicht allzu weit weg.

Insgesamt finde ich die Methode und das Tool GA-Effects faszinierend, denn sie erlauben mir nun für bestimmte Fragestellungen wesentlich konkretere Aussagen zu treffen, die auf nachvollziehbaren Zahlen und nicht auf dem Gefühl basieren. Ich hoffe, Ihr seht das ähnlich und seid auch ein wenig begeistert von Mark Edmondsons Arbeit. Viel Spaß beim Spielen und Arbeiten mit diesem Tool. Ich freue mich auf Kommentare.

Für weitergehende Fragen zum Thema Web-Analytics und Google-Analytics im HR Kontext steht unser Team wie immer zur Verfügung.

Google Analytics Datenschutz

Im letzten Jahr haben wir bereits versucht, Euch mit unseren Grundlagen zu Google Analytics und unserem Artikel über Analytics Dashboards als Arbeitserleichterung von Google Analytics zu überzeugen.

Viele von Euch haben jedoch Bedenken bzgl. Google Analytics und der Einhaltung des Bundesdatenschutzgesetzes. Deshalb wollen wir Euch heute mit einer ausführlichen Anleitung zeigen, wie Ihr Google Analytics datenschutzkonform in Eure Webseite einbinden könnt. Wir hoffen mit diesem trockenen, aber spannenden Thema auch die letzten Skeptiker unter Euch von Google Analytics zu überzeugen. Das Thema Google Analytics und Datenschutz wurde schon in vielen verschiedenen Foren und Blogs behandelt, jedoch waren viele Artikel entweder nicht mehr aktuell genug, oder nicht ausführlich genug. Deshalb haben wir uns dazu entschieden, für Euch eine aktuelle Anleitung zusammenzustellen.

Wenn Ihr im Nachgang noch Fragen zu diesem Thema habt oder Unterstützung bei der Umsetzung braucht, meldet Euch gerne bei uns. Los geht’s.

Da Google erfasste Daten in Ländern hostet, in denen es so gut wie keinen oder auch gar keinen Datenschutz gibt, ist es zwingend erforderlich, die folgenden Arbeitsschritte durchzuführen, um Google Analytics trotzdem datenschutzkonform nutzen zu können:

1. Vertrag zur Auftragsdatenverarbeitung von Google (nach §11 BDSG)

Fangen wir mit dem einfachsten Schritt an:

Dem Unterzeichnen des Vertrags zur Auftragsdatenverarbeitung. Den Vertrag könnt Ihr Euch über diesen Link herunterladen: Google Analytics Vertrag zur Auftragsdatenverarbeitung.

Bitte druckt diesen Vertrag 2x aus, lasst beide Exemplare von Eurem Webseiten-Betreiber unterzeichnen und sendet die Verträge, zusammen mit einem frankierten Rückumschlag, an die Google Rechtsabteilung in Dublin. I. d. R. wird dieser Vertrag von Google innerhalb von 8 – 12 Arbeitstagen unterschrieben an Euch zurück gesendet.

Übrigens: Besteht dieser Vertrag nicht, müsste jeder Besucher Eurer Webseite explizit der Erhebung seiner Daten zustimmen!

2. Anonymisierung der IP Adressen durch Anpassen des Google Analytics Codes

Nach diesem einfachen Schritt geht’s nun ans Eingemachte. Der Google Analytics Code (auch „Code-Snippet“ genannt) muss so verändert werden, dass die letzten Zeichen der IP Adresse maskiert werden. Durch die Maskierung der IP Adresse ist es anschließend nicht mehr möglich, die genaue geografische Lokalisierung eines Besuchers ausfindig zu machen. Der Standort des Webseiten-Besuchers kann dann nur noch sehr ungenau, anhand des letzten Einwahlknotens, lokalisiert werden. Die (ungenaue) Lokalisierung eines Benutzers anhand des letzten Einwahlknotens ist übrigens datenschutzrechtlich unbedenklich. Diese Methode der Datenerfassung wird von deutschen Datenschutzbehörden anerkannt und akzeptiert.

Um den Analytics Code so zu verändern, dass dieser die IP Adressen maskiert, bietet sich die sog. IP Masken Methode „anonymizeIp()“ an, die bei Google seit Mai 2010 verfügbar ist. Diese Funktion stellt Google in der JavaScript-Bibliothek ga.js und auch in ga(‘set’, ‘anonymizeIp’, true) in der Bibliothek analytics.js zur Verfügung. Nähere Informationen dazu könnt Ihr hier aufrufen.

Durch diese Funktion zur Anonymisierung der IP Adressen in Google Analytics werden bei IP Adressen vom Typ IPv4  die letzten 8bit der Adresse verschlüsselt, bei IP Adressen vom Typ IPv6 die letzten 80bit. Nach der Einrichtung dieser Funktion werden alle Daten kurz vor der Übermittlung an das Analytics-Datenerfassungsnetzwerk verschlüsselt. Das bedeutet, dass die vollständige IP des Nutzers nie auf einer Festplatte gespeichert wird.

Um den Google Analytics Datenschutz zu wahren, werden IP-Adressen nur anonymisiert erfasst.
Quelle: https://support.google.com/analytics/answer/2763052?hl=de

Da der standardmäßig von Google vorgegebene Tracking Code nicht die Anforderungen an den Datenschutz erfüllt, muss der Tracking Code zwingend durch „anonymizeIp()“angepasst werden. Aktuell werden zwei Varianten des Tracking Codes genutzt: Universal Analytics und Klassisches Analytics.

Die folgenden Code Beispiele sollen Euch dabei helfen, Euren Tracking Code korrekt anzupassen:

Datenschutz mit „Universal Analytics“:

<script>

(function(i,s,o,g,r,a,m){i[‘GoogleAnalyticsObject’]=r;i[r]=i[r]||function(){

(i[r].q=i[r].q||[]).push(arguments)},i[r].l=1*new Date();a=s.createElement(o),

m=s.getElementsByTagName(o)[0];a.async=1;a.src=g;m.parentNode.insertBefore(a,m)

})(window,document,’script’,’//www.google-analytics.com/analytics.js’,’ga’);

ga(‘create’, ‘UA-XXXXXXX-X’, ‘website.de’);

ga(‘set’, ‘anonymizeIp’, true);

ga(‘send’, ‘pageview’);

</script>

Tiefergehende Informationen zur Anpassung des Codes findet Ihr hier.

Datenschutz mit „Klassischem Analytics“:

 <script type=”text/javascript”>

var _gaq = _gaq || [];

_gaq.push([‘_setAccount’, ‘UA-XXXXXXX-X’]);

_gaq.push([‘_gat._anonymizeIp’]);

_gaq.push([‘_trackPageview’]);

(function() {

var ga = document.createElement(‘script’); ga.type = ‘text/javascript’; ga.async = true;

ga.src = (‘https:’ == document.location.protocol ? ‘https://ssl’ : ‘http://www’) + ‘.google-analytics.com/ga.js’;

var s = document.getElementsByTagName(‘script’)[0]; s.parentNode.insertBefore(ga, s);

})();

</script>

Weitere Informationen zur Anpassung des Codes im klassischen Google Analytics, findet Ihr hier.

3. Aufklärung der Besucher über den Einsatz von Google Analytics in der Datenschutzerklärung der Unternehmens-Webseite

Für die datenschutzkonforme Nutzung von Google Analytics hat Google Analytics Bedingungen generiert, die von Webseitenbetreibern innerhalb der Datenschutzerklärung auf der Webseite hinterlegt werden müssen.

Den folgenden Text (übernommen von und nachlesbar auf dr-datenschutz.de) müsst Ihr in die Datenschutzerklärung Eurer Webseite integrieren:

Diese Website benutzt Google Analytics, einen Webanalysedienst der Google Inc. („Google“). Google Analytics verwendet sog. „Cookies“, Textdateien, die auf Ihrem Computer gespeichert werden und die eine Analyse der Benutzung der Website durch Sie ermöglichen. Die durch das Cookie erzeugten Informationen über Ihre Benutzung dieser Website werden in der Regel an einen Server von Google in den USA übertragen und dort gespeichert. Im Falle der Aktivierung der IP-Anonymisierung auf dieser Website, wird Ihre IP-Adresse von Google jedoch innerhalb von Mitgliedstaaten der Europäischen Union oder in anderen Vertragsstaaten des Abkommens über den Europäischen Wirtschaftsraum zuvor gekürzt. Nur in Ausnahmefällen wird die volle IP-Adresse an einen Server von Google in den USA übertragen und dort gekürzt. Im Auftrag des Betreibers dieser Website wird Google diese Informationen benutzen, um Ihre Nutzung der Website auszuwerten, um Reports über die Websiteaktivitäten zusammenzustellen und um weitere mit der Websitenutzung und der Internetnutzung verbundene Dienstleistungen gegenüber dem Websitebetreiber zu erbringen. Die im Rahmen von Google Analytics von Ihrem Browser übermittelte IP-Adresse wird nicht mit anderen Daten von Google zusammengeführt. Sie können die Speicherung der Cookies durch eine entsprechende Einstellung Ihrer Browser-Software verhindern; wir weisen Sie jedoch darauf hin, dass Sie in diesem Fall gegebenenfalls nicht sämtliche Funktionen dieser Website vollumfänglich werden nutzen können. Sie können darüber hinaus die Erfassung der durch das Cookie erzeugten und auf Ihre Nutzung der Website bezogenen Daten (inkl. Ihrer IP-Adresse) an Google sowie die Verarbeitung dieser Daten durch Google verhindern, indem Sie das unter dem folgenden Link (http://tools.google.com/dlpage/gaoptout?hl=de) verfügbare Browser-Plugin herunterladen und installieren.

 Sie können die Erfassung durch Google Analytics verhindern, indem Sie auf folgenden Link klicken. Es wird ein Opt-Out-Cookie gesetzt, das die zukünftige Erfassung Ihrer Daten beim Besuch dieser Website verhindert:

<a href=”javascript:gaOptout()”>Google Analytics deaktivieren</a>

 Nähere Informationen zu Nutzungsbedingungen und Datenschutz finden Sie unter http://www.google.com/analytics/terms/de.html bzw. unter https://www.google.de/intl/de/policies/. Wir weisen Sie darauf hin, dass auf dieser Website Google Analytics um den Code „gat._anonymizeIp();“ erweitert wurde, um eine anonymisierte Erfassung von IP-Adressen (sog. IP-Masking) zu gewährleisten.

Solltet Ihr auch noch Erweiterungen von Google Analytics verwenden um zusätzliche Daten auszuwerten, müsst Ihr auch hierauf hinweisen. Für die Auswertung von Daten aus Adwords oder dem DoubleClick-Cookie könnt ihr bspw. den folgenden Hinweistext (mit Angabe der Quelle) verwenden:

Wir nutzen Google Analytics zudem dazu, Daten aus AdWords und dem Double-Click-Cookie zu statistischen Zwecken auszuwerten. Sollten Sie dies nicht wünschen, können Sie dies über den Anzeigenvorgaben-Manager (http://www.google.com/settings/ads/onweb/?hl=de) deaktivieren.

Übrigens:  Bitte beachtet auch, dass Besucher Eurer Webseite die Datenschutzerklärung (wie auch das Impressum) von jeder Seite Eurer Homepage aus, zu jeder Zeit mit nur einem Klick erreichen können. Auch das ist eine Vorgabe des BDSG.

4. Löschen der (eventuell) bereits durch Google Analytics erfassten Daten

Nun sind wir auch schon beim letzten Schritt angekommen. Um Google Analytics datenschutzkonform nutzen zu können, müssen nun noch alle bisher durch Analytics erfassten, nicht datenschutzkonformen Daten gelöscht werden.

Dieser Schritt wird zwingend von der Datenschutzbehörde gefordert, weil sämtliche durch Analytics erfasste Daten erst durch die Anonymisierung der IP Adressen datenschutzkonform gespeichert werden. Das bedeutet konkret, dass Daten, die vor der Einrichtung der IP-Verschlüsselung erfasst wurden, nicht-anonymisiert bleiben und somit gegen die Datenschutzvorgaben verstoßen.

Um die Alt-Daten zu löschen, müsst Ihr über Euer Google Analytics Konto eine neue Property (ehemals Profil) anlegen und gleichzeitig die alte Property, die nicht-datenschutzkonforme Daten enthält, löschen.

Tiefergehende Informationen zum Anlegen neuer Properties findet Ihr über diesen Link.

Fazit

Alle diese Punkte sind Inhalte des Vertrags zur Auftragsdatenverarbeitung nach §11 des BDSG. Habt Ihr alle diese Punkte erfolgreich ausgeführt, könnt Ihr Google Analytics ab sofort datenschutzrechtlich ohne Bedenken benutzen.

Ich hoffe, wir konnten mit diesem Artikel für mehr Vertrauen bezüglich Google Analytics und dessen datenschutzkonforme Nutzung sorgen und vor allem nachvollziehbar machen, wie das Thema konkret anzugehen ist.

Nun seid Ihr dran. Es ist jetzt auch Zeit für Euch, Google Analytics, dieses funktionsreiche und sehr hilfreiche Tool, auszuprobieren. Oder, was sagt Ihr?