Personalisierungsgrad der Google-Suchtreffer anhand des Suchbegriffes "Sankt Pauli"


Hausarbeit, 2017

60 Seiten, Note: 1,3


Leseprobe


Inhaltsverzeichnis

1. Einleitung

2. Theoretische Grundlagen
2.1 Filter Bubble nach Eli Pariser
2.2 Google
2.3 Forschungsstand

3. Empirische Untersuchung
3.1 Erkenntnisinteresse und Operationalisierung
3.2 Ablauf der Fallstudie

4. Analyse und Auswertung der Ergebnisse
4.1 Allgemeine Unterschiede Testphasen 1/3/4
4.2 Analyse Suchergebnisse Testphasen 1/3/4
4.3 Analyse Schlagzeilen Testphase 3 & 4
4.4 Analyse verwandte/ähnliche Suchanfragen 1/3/4

5. Interpretation und Ergebnisdarstellung Ergebnisse

6. Schlussbetrachtung

Bibliographie

Anhang

Screenshots Testphase 1

Screenshots Testphase 3

Screenshots Testphase 4

Suchergebnisschlüssel

Schlagzeilenschlüssel

Proband_Innen Fragebögen

Proband_Innen Einweisung

1. Einleitung

Mit einem Marktanteil von über 90 Prozent ist Google die am häufigste genutzte Such- maschine in Deutschland (vgl. Statista Report 2016). Eine Umfrage des Hans-Bredow- Institutes für Medienforschung ermittelte, dass 47% der Internetuser_Innen Onlinenach- richten hauptsächlich über Suchmaschinen, vor allem über Google aufrufen. Ein Großteil der gesamten Internetnutzung und Informationssuche beginnt mit Suchmaschinen (Stark 2014, 3). Begründet durch die hohen Nutzungszahlen wird Google demzufolge eine tra- gende Rolle als „Informationsgatekeeper“ in der Informationsbeschaffung der Nutzer_In- nen zuteil (Stark 2014, 5). Laut der repräsentativen Befragung des Hans-Bredow-Institu- tes „Informationsrepertoire der Deutschen“ von 2012 rangiert Google sogar auf Platz zwei der meinungsbildenden Medien bei politischen Themen, direkt hinter der Tages- schau.

Google hat demzufolge einen nicht zu unterschätzenden Einfluss auf das Wissen, die in- tellektuelle Weiterentwicklung und die (politische) Meinungsbildung seiner User_Innen. Diese füttern Google mit sensiblen Daten, stellen intime Fragen und vertrauen darauf, dass Google ein „neutraler Berater“ ist, der allen auf die gleiche Frage die gleiche Ant- wort beziehungsweise die gleichen Suchergebnisse gibt (Pariser 2012, 10). Einem Groß- teil der Nutzer_Innen dürfte dabei nicht bewusst sein, dass Google alle Nutzungsdaten erhebt und speichert um maßgeschneiderte Inhalte, z.B.: Suchergebnisse oder Werbean- zeigen, anzubieten (vgl. Datenschutzerklärung Google 01. März 2017). Google ist kein neutraler Berater.

Algorithmische Personalisierung ist, wenn auch ein junges, ein omnipräsentes Phänomen im Nutzer_Innen-Alltag. Es besitzt daher große gesellschaftliche Bedeutsamkeit. Trotz- dem sind weder Funktionsmechanismen noch Wirkung algorithmischer Selektion und Personalisierung bislang geklärt (Jürgens et al. 2015, 253). Konzerne wie Google halten ihren Algorithmus geheim. Um präzise Antworten auf die Fragen nach Einfluss, Funkti- onsweise oder auch Wirkung algorithmischer Personalisierung geben zu können, erfährt das Themenfeld aktuell verstärkt wissenschaftliche Zuwendung (vgl. Hosanagar et al. 2017; Jürgens et al. 2015; Madsen 2016; Stark 2014; Hogan 2015) aus diversen Fachbe- reichen (z.B.: Medienwissenschaft, Kommunikation, Didaktik).

Ein viel diskutiertes Konzept, das sich mit den Konsequenzen algorithmischer Personali- sierung befasst, stammt von Eli Pariser. Dieser skizziert in seinem 2011 erschienen Buch „T he Filter Bubble: What the Internet ist Hiding from You“ wie User_Innen durch per- sonalisierte Inhalte in Filterblasen gedrängt werden. In diesen sind sie nur Inhalten aus- gesetzt, die ihren, algorithmisch berechneten, Interessen entsprechen (Pariser 2012, 69).

Teil dieser Filterblase sind personalisierte Google-Suchergebnisse.

Der Grad der interessenzentrierten Personalisierung von Google-Suchergebnisse, wie deutlich sich diese also unterscheiden, soll in der vorliegenden Hausarbeit anhand einer Fallstudie erforscht werden. Mittels der Fallstudie wird untersucht, ob Usern, die sich für Fußball interessieren, bei der Google-Suche nach dem neutralen Begriff „Sankt Pauli“ an- dere Suchergebnisse generiert werden als Nutzer_Innen, die sich nicht für Fußball, son- dern für Sightseeing und Reisen interessieren. Ermittelt wird dies, indem Proband_Innen, eingeteilt in eine Kontrollgruppe und eine Versuchsgruppe, den Begriff „Sankt Pauli“ googlen. Ihre Suchergebnisse werden mit Screenshots festgehalten (Anhang: Screenshots, IX-XX). Diese Screenshots werden in der vorliegenden Arbeit verglichen und auf Unterschiede untersucht. Erhalten Fußballfans nur Suchtreffer mit Bezug zum Fußballclub? Und werden Nutzer_Innen, die sich für Reisen interessieren, eher Ergeb- nisse zu einem Aufenthalt und Sightseeing-Optionen im Viertel Sankt Pauli und der Ree- perbahn generiert? Ausgehend von den ermittelten Unterschieden lassen sich Rück- schlüsse auf die Intensität der interessenzentrierten Personalisierung ziehen.

Nach der theoretischen Einbettung des Forschungsgegenstandes (Kapt. 2) folgt eine ge- nauere Erläuterung der Fallstudie (Kapt. 3). Im Anschluss erfolgen Analyse und Auswer- tung der vier Testphasen (Kapt. 4/5). Die daraus resultierenden Schlussfolgerungen und Ergebnisse werden in Kapitel 6 erörtert und diskutiert. In der vorliegenden Arbeit wurde durchgehend gegendert. Der Lesbarkeit sollte dies keinen Abbruch tun.

2. Theoretische Grundlagen

2.1 Filter Bubble nach Eli Pariser

„The Filter Bubble. What the Internet Is Hiding from You“ von Eli Pariser erschien 2011. Der Internetaktivist führt in seinem Buch aus, wie Google Inhalte unter Einsatz von Al- gorithmen filtert (Content-Kuration) (2012, 186). Diese algorithmisch gefilterten Webin- halte erzeugen eine personalisierte Filter Bubble (dt.: Filterblase), in die die Nutzer_Innen eingeschlossen sind (Pariser 2012, 17f.). In diesen Filterblasen sind die User_Innen nur den Informationen ausgesetzt, für die sie sich laut Berechnung der Algorithmen bereits interessieren (Pariser 2012, 69).

[Der] Internetfilter schaut sich an, was Sie zu mögen scheinen – wie Sie im Netz aktiv waren oder welche Dinge oder Menschen Ihnen gefallen – und zieht ent- sprechende Rückschlüsse. Prognosemaschinen entwerfen […] eine Theorie zu Ih- rer Persönlichkeit und sagen voraus, was Sie als Nächstes tun und wollen. Zusam- men erschaffen diese Maschinen ein ganz eigenes Informationsuniversum für je- den von uns – das, was ich die Filter Bubble nenne (Pariser 2012, 18).

Nicht mehr das populärste Ergebnis steht an erster Stelle der Auflistung der Suchergeb- nisse, sondern das Ergebnis, welches der/die jeweilige Nutzer_In am ehesten anklickt (Pariser 2012, 10). Parisers viel diskutiertes Konzept stößt auch auf Kritik1.

Im Buch geht Pariser unter anderem darauf ein, wie Personalisierung im Internet vonstat- tengeht, warum sie mehr Nach- als Vorteile hat und wie aus Nutzer_Innen-Daten Profit generiert wird.

Als potentielle Gefahren der Filter Bubble nennt Pariser, dass User_Innen alleine in ihrer Blase sind (2012, 17), dass diese Blase unkontrollierbar und nicht greifbar für die Nut- zenden ist (2012, 229) und dass diese nicht bewusst entscheiden, in einer Filterblase durch das Internet zu surfen (Pariser 2012, 228). Eigentlich, so Pariser, sei kein anderer Ort so geeignet, „die Verantwortung zum Verstehen und Verwalten unserer Welt auf alle Schul- tern zu verteilen“ wie das Internet (2012, 227). Algorithmische Personalisierung verhin- dere dies jedoch (Pariser 2012).

Ausgehenden von Parisers Überlegungen wird in der vorliegenden Hausarbeit der Ver- such unternommen, Inkonsistenzen, also Abweichungen, beim Ranking der Suchergeb- nisse unterschiedlicher Proband_Innen nachzuweisen. Davon ausgehend können Aussa- gen über die Intensität einer auf Interessen basierenden, personalisierten Filter Bubble getroffen werden.

Kritik übt Pariser besonders an Google. Der Konzern weigere sich, das algorithmische Verfahren preiszugeben, anhand dessen er Informationen individuell selektiere (2012, 239). Pariser fordert Transparenz, um den Google-Nutzer_Innen Kontrolle über und Ver- ständnis von Personalisierung zu ermöglichen (2012, 239). Kritisch merkt Pariser weiter an, dass die Funktionsweise des Algorithmus auch seinen Ingenieuren unerklärlich sei und der Algorithmus somit unkontrollierbar ist (2012, 212).

„Ein Google-Mitarbeiter, der sich mit dem Programmiererteam unterhalten hat, gibt folgende Auskunft: »Da wird justiert und abgeglichen, und sie wissen selbst nicht genau, was warum funktioniert […] (Pariser 2012, 212).

2.2 Google

Lawrence Page und Sergey Brin entwickelten 1995 die Suchmaschine Google. Diese er- mittelte damals mithilfe des Algorithmus PageRank die Relevanz einzelner Webseiten im Web (Google 2017c). Der Konzern entwickelte sich von einer Suchmaschine zu einem der einflussreichsten und mächtigsten Konzerne der Welt. Im Laufe der Jahre kaufte Google zahlreiche andere Firmen (z.B.: 2009 YouTube) und entwickelte ein eigenes Smartphone Betriebssystem, Android (Fricke/Novak 2015, 177). All diese Dienste gene- rieren Nutzungsdaten, die Google speichert und unter anderem zum Zwecke der Perso- nalisierung von Suchergebnissen nutzt (Fricke/Novak 2015, 158). Denn nicht nur der Konzern hat sich entwickelt, sondern auch der Google-Algorithmus.

Algorithmische Selektion der Suchergebnisse

„Algorithmen sind Computerprogramme, die über Signale herausfinden, was die besten Ergebnisse für Ihre Anfrage sind“ (Google 2017a). Bei der Ermittlung der Trefferrelevanz berücksichtigt Google über 200 Signale - PageRank ist eines von ihnen (Google 2017a). PageRank ist der Algorithmus, der Suchergebnisse anhand ihrer ermittelten Relevanz in einer bestimmten Reihenfolge sortiert (Haußer/Luchko 2010, 231). Die Nutzer_Innen entscheiden anhand der Links, auf die sie klicken, welche Internetseiten Relevanz besit- zen. Je mehr Klicks ein Link erfährt desto populärer ist er (Rousseau et al. 2008, 293). Je relevanter eine Seite ist, desto höher ist die Wahrscheinlichkeit, auf der ersten Sucher- gebnisseite angezeigt zu werden. Google filtert Suchergebnisse nicht mehr nur mit Page- Rank, sondern mit einer Mischung aus PageRank und interessenbasierter Personalisie- rung (Pariser 2012, 187).

Personalisierung bei Google

Im Kontext computervermittelter Kommunikation werden unter dem Begriff „Personalisierung“ Verfahren zusammengefasst, die digitale Inhalte in Abhängig- keit von bestimmten Merkmalen eines Nutzers anpassen (Jürgens at al. 2015, 255).

Bislang wurden zahlreiche wissenschaftliche Versuche unternommen, die Funktionswei- sen von Personalisierungsalgorithmen aufzuklären. Jedoch ist über die exakten Funkti- onsmechanismen der Personalisierungs-Algorithmen bei Google wenig bekannt, weswe- gen sie in der Forschung häufig als „Black Box“ bezeichnet werden (vgl. Xing et al. 2014; Machill et al. 2007; Jürgens et al. 2015). In der aktualisierten Version der Google-Daten- schutzerklärung bestätigt Google, mit personalisierten Suchtreffern zu arbeiten:

Unsere automatisierten Systeme analysieren Ihre Inhalte (einschließlich E-Mails), um Ihnen für Sie relevante Produktfunktionen wie personalisierte Suchergebnisse, personalisierte Werbung sowie Spam- und Malwareerkennung bereitzustellen (Google 2017d).

Daten, die im Zuge der Personalisierung Relevanz besitzen, sind laut der Datenschutzer- klärung unter anderem: die Art der Nutzung, gerätebezogene Informationen, Suchanfra- gen, Standort, IP-Adresse, Browserprotokolle, Erfassung und Speicherung (einschließ- lich personenbezogener Daten) lokal auf dem Gerät sowie sensible Kategorie (Rasse, Re- ligion, sexuelle Orientierung) – um einen Ausschnitt der Daten zu nennen, die Google von den Nutzer_Innen speichert. Alle Daten, die Aufschluss über die Präferenzen und Interessen der User_Innen geben, sind von Relevanz, besonders der Standort und die Suchhistorie (Xing et al. 2014, 2). Eli Parisers Hauptaugenmerk bei der Erklärung von relevanten Daten für personalisierte Inhalte sind die Interessen und Vorlieben eines Men- schen, aus denen auf ihre Persönlichkeit geschlossen wird (Pariser 2012, 18).

Ebenso wenig wie geklärt ist, wie Personalisierungsalgorithmen arbeiten, ist erforscht, welche Auswirkungen Personalisierung auf Gesellschaft und Individuen hat. Pariser geht davon aus, dass die Filter Bubble auf fundamentale Weise verändert, wie Menschen an Informationen und Ideen gelangen und wie sie die Welt sehen (2012, 18). Allerdings bie- tet die Personalisierung von Webinhalten und Suchergebnisse Vorteile, vor allem für Google.

Nutzen der Personalisierung

Anzeigen, die über Google AdWords publiziert werden, platziert Google, möglichst exakt auf die Interessen der Nutzer_Innen abgestimmt, auf den Suchergebnisseiten (Xing et al. 2014, 2). Die Wahrscheinlichkeit, dass die Nutzer_Innen die Werbeanzeigen anklicken, wenn sie als Ergebnis auf eine Suchanfrage zutreffen, wird durch diese Strategie erhöht (Pariser 2012, 15). Und mit jedem Klick auf eine Werbeanzeige verdient Google Geld. Auch Firmen und Konzerne können Suchmaschinen nutzen, um Werbung zu schalten oder zur Suchmaschinenoptimierung (engl. SEO: Search Engine Optimization). SEO be- deutet, dass Unternehmen Google und die Funktionsweise des Rankings nutzen, um ihre Onlinepräsenzen mittels Schlüsselwörtern (engl. Keywords) prominenter zu platzieren (Weber 2014). Suchmaschinen sichten Millionen Informationen und machen diese für die Nutzer_Innen zugänglich und nutzbar. Sie „reduzieren die Komplexität des Webs“ auf einige wenige Informationen (Machill et al. 2007, 7). Davon profitieren nicht nur Privat- personen, sondern auch Konzerne und Journalist_Innen. Auch in der hier kritisierten Vor- selektion liegt ein Vorteil. Denn indem Suchmaschinen nach Wahrscheinlichkeit und/o- der Interesse die am ehesten relevanten Internetseiten selektieren, sparen sie den Nut- zer_Innen viel Zeit und Arbeit. Die Vorteile der Personalisierung bilden auch das Funda- ment für diverse Kritikpunkte.

Nachteile der Personalisierung

Einer der am häufigsten genannten Kritikpunkte im Zusammenhang mit Filterblasen ist die Fragmentierung der Nutzer_Innen in Filter Bubbles (vgl. Bozdag/Van den Hoven 2015; Pariser 2011; Hosanagar et al. 2017; Emmer/Strippel 2015). Die algorithmische Selektion fragmentiere die Internetnutzer_Innen anhand ihrer Gesinnung, Meinung oder ihrer Interessen in Filterblasen. In diesen seien sie mehrheitlich mit Inhalten konfrontiert, die ihnen gefallen oder ihre Meinung bestätigen. Ausgehend von der konstanten Kon- frontation mit den eignen (politischen) Einstellungen in ihrer Blase entstehe zunehmend Intoleranz, Ablehnung und Abwertung gegenüber anderen Positionen (Bozdag/Van den Hoven 2015, 249). Hosanagar et al. und Lanier (2010) befürchten zudem Einschnitte in der persönlichen Entwicklung der Nutzenden, wenn sie in Filterblasen und „Echo Cham- bers“, in denen sie neuen Impulsen nicht ausgesetzt sind, eingeschlossen werden (2017, 5).

People tend to get into this echo chamber where more and more of what they see conforms to the idea of who some software thinks they are […] You start to become more and more like the image of you because that is what you are seeing (Lanier 2010, 5).

Gegenstand von Kritik ist weiter das mangelnde Bewusstsein über die Funktionsmecha- nismen der Personalisierungsalgorithmen und die mangelnde Kontrolle der Nutzer_Innen (Bozdag/Van den Hoven 2015, 254; Pariser 2012, 212). Außer dem Konzern Google selbst kenne nahezu niemand die Muster, nach denen der Algorithmus arbeitet (Pariser 2012, 21; Hogan 2015, 103).

Auch dass die Entscheidungsfreiheit stark beschnitten würde, wenn User_Innen nicht mehr selbst wählen können, da sie ihre Möglichkeiten nicht wahrnehmen können, ist ein oft angeführter Kritikpunkt (vgl. Pariser 2012; Bozdag/Van den Hoven 2015; Hosanagar et al. 2017). Netzinhalte, die Google nicht anzeigt, sind quasi nicht auffindbar und somit inexistent (Stark 2014, 1). Davon ausgehend werden Nachteile für die Bildung fundierter Meinungen und damit negative Konsequenzen für politische Teilhabe in Demokratien befürchtet. Denn selektierte Informationen verhindern, dass Menschen gleich informiert sind (Bozdag/Van den Hoven 2015, 251). Google könnte außerdem die persönlichen In- teressen und Vorlieben falsch berechnen, nichtzutreffende Rückschlüsse auf die Persön- lichkeit anstellen und ein falsches Interessenprofil erstellen. Nutzer_Innen könnten so in Filterblasen eingeordnet werden, die nicht zu ihnen passen. Ausgehend von diesen Kri- tikpunkten und Einflüssen, die Filterblasen auf Nutzer_Innen haben, besteht Interesse aus breit gefächerten Wissenschaftssparten.

2.3 Forschungsstand

Aus verschiedenen Forschungsströmungen gibt es inzwischen Ansätze, das Vorhanden- sein, die Entstehung und die Konsequenzen von algorithmischer Selektion, Personalisie- rung und Filter Bubbles zu untersuchen.

Mit Experimenten untersucht der Forscher Anders Koed Madsen das Phänomen „Filter Bubble“. Er kann nachweisen, dass es personalisierte Selektion basierend auf Algorith- men bei Google-Suchergebnissen britischer User_Innen gibt (2016). Ein ähnliches Expe- riment führte das Forscher_Innen-Team Jürgens et al. bereits 2014 durch. Sie versuchten mittels Stimuli die Google Suchergebnisse zu manipulieren. Die Forscher_Innen-Gruppe kam jedoch zu dem Ergebnis, dass „[...] auch nach vierwöchiger Simulation keine nen- nenswerten, insbesondere keine mit dem Stimulus zusammenhängenden Personalisierun- gen nachgewiesen werden [kann]“ (Jürgens et al., 2014). In einer Folgestudie lieferten Jürgens et al. gegenteilige Ergebnisse und Hinweise auf die Höhe des Beeinflussungsgra- des der Suchergebnisse (2015). Diese Ergebnisse stellen das Bild von Suchmaschinen als neutrale Informationsvermittler wiederum in Frage (Jürgens et al. 2015, 250). Welche Faktoren Einfluss auf das Ranking der Suchergebnisse haben könnten, untersuchten Hil- debrandt et al. Die Forscher_Innen-Gruppe untersuchte den Einfluss von Social Signals (Likes, Shares etc.) auf die Positionierung von Websites in der Google-Trefferseite haben (Hildebrandt et al. 2015). Die Forscher_Innen ermittelten den positiven Einfluss von Social Signals auf die Positionierung von Websites in der Google-Trefferseite (Hilde- brandt et al. 2015, 224).

Die Forschungsgruppe Bozdag und Van den Hoven widmete sich den Auswirkungen von Filter Bubbles. Sie analysierten theoretische Auswirkungen von Filter Bubbles auf poli- tische Teilhabe in divergierende Demokratie-Modelle (Bozdag/Van den Hoven 2015). Die Wissenschaftler_Innen kamen zu dem Schluss, dass:

[…] different democracy theories emphasize different aspects of the filter bubble, whether it is the loss of autonomy, the decrease in the epistemic quality of infor- mation, losing the ability for effective contestation or losing effective channels that display the performance of the governing bodies (Bozdag/Van den Hoven 2015, 263).

Valentine und Wukovitz (2013) testeten den Mehrwert der Online Personalisierung, um das Interesse der Studierenden an Close Reading zu wecken und deren Testverständnis zu vertiefen. In dieser Fallstudie fanden die Forscher_Innen heraus, dass ein Großteil ihrer Proband_Innen personalisierte Onlineinhalte als hilfreiche und positiv bei der Informati- onsgewinnung empfand (2013, 28), obwohl sie über die Konsequenzen aufgeklärt waren.

Xing et al. entwickelten das Chrome-Browser-Add-On „Bobble“ welches Googles Su- chergebnisse vergleicht und Filter Bubbles visualisiert (Xing et al. 2014, 1). Als Haupt- ursachen für Abweichungen in den Suchergebnissen ermittelten Xing et al. die Suchhis- torie und den geographischen Standpunkt. Ein Google-Profil erhöhe die Inkonsistenz der Suchergebnisse (Xing et al. 2014, 8).

Zahlreiche weitere Forschungen (vgl. Hannak et al. 2013; Emmer/Strippel 2015; Eslami et al. 2015) kamen zu dem Ergebnis, dass Personalisierung, Selektion und Filter Bubbles, konstruiert durch Personalisierungsalgorithmen, omnipräsent im Nutzer_Innen-Alltag sind. Inwiefern sich interessenzentrierte Personalisierung in den Suchergebnissen von Google ablesen lässt, soll in der folgenden Fallstudie untersucht werden.

3. Empirische Untersuchung

3.1 Erkenntnisinteresse und Operationalisierung

Ein experimentelles Untersuchungsdesign und eine qualitative, explanative und deskrip- tive Methodik bietet sich zum Identifizieren von Kovariationen an (Brosius et al. 2012, 5). Wenn Google Suchergebnisse personalisiert, dann haben verschiedene Proband_In- nen mit unterschiedlichen Interessen voneinander abweichende Suchergebnisse bei der Recherche nach dem gleichen Suchbegriff. Die Hausarbeit und die zur Verfügung ste- henden Mittel gewähren es nicht, die Forschungsfrage mittels einer groß angelegten em- pirischen Studie mit großem Sample, welches reproduzierbare, repräsentative Ergebnisse erzielen kann, zu untersuchen. Aus diesen Gründen wurde als Untersuchungsdesign die Fallstudie gewählt. Fallstudien ermöglichen über ein exploratives, deskriptives qualitati- ves Untersuchungsdesign tiefergehende Erkenntnisse über ein schwer zugängliches For- schungsfeld (Mayring 1997, 32; Lamneck 2005, 6).

Personalisierung bei Google ist ein schwer zugängliches Forschungsfeld. Viele Variable im Zusammenhang mit dem Ranking und der Personalisierung von Suchergebnissen bei Google sind unbekannt. Beispielsweise welche Daten zum Zwecke der Personalisierung wie gewichtete werden, welchen Einfluss das genutzte Gerät hat oder die Funktionsme- chanismen des Personalisierungsalgorithmus.

Der Fokus der vorliegenden Fallstudie richtet sich auf das Auftreten von Inkonsistenzen bedingt durch interessenbasierte Personalisierung in der Auflistung der Google-Sucher- gebnisse verschiedener Proband_Innen zum Suchbegriff „Sankt Pauli“. Diese Inkonsis- tenzen werden anhand der in einem Experiment erhobenen Daten ermittelt. Die Daten sind Screenshots der Suchergebnisseiten der Proband_Innen, die in einer Analyse be- schrieben, erklärt und verglichen werden. Über den Vergleich lassen sich Abweichungen in den Suchergebnissen ermitteln.

Das zentrale Erkenntnisinteresse lässt sich in folgende Forschungsfrage und Hypothesen zerlegen:

„ Ist die Personalisierung der individuellen Google -Suchergebnisse deutlich er- kennbar, in Form von Inkonsistenzen im Ranking der Suchergebnisse, bei der Su- che nach dem Begriff „Sankt Pauli“? Werden Fans des FC Sankt Pauli 1910 bei der Suche nach dem Suchbegriff Sankt Pauli andere Suchergebnisse angezeigt als keinen Fußballfans?“

Die Forschungsfrage lässt sich in folgende Hypothesen zerlegen, die es im Anschluss zu beantworten gilt.

H1: Je interessenzentrierter die bisherige Recherche bei Google war, desto per- sonalisierter/ näher am Interessenbereich fallen die Suchergebnisse aus.
H2: Wenn eine Person Fan des Vereins FC Sankt Pauli 1910 ist, den Verein schon über die Suchmaschine Google recherchiert hat und den Suchbegriff Sankt Pauli in die Google Suche eingibt, dann erhält sie andere Suchergebnisse als eine Per- son, die sich nicht für Fußball interessiert und noch nicht unter Rückgriff auf die Google Suche nach Fußball-Themen recherchiert hat

Um die Forschungsfrage zu beantworten und die aufgestellten Hypothesen zu prüfen, wurden folgende Merkmale der ersten Suchergebnisseite in den Fokus genommen.

Merkmale im Fokus

Personalisierung bei Google ist an den Suchergebnissen ablesbar. Diese unterscheiden sich, wenn sie personalisiert sind, inhaltlich in ihrer Quantität und in ihrer Platzierung. Als Suchergebnisse werden im Folgenden nur Links auf der ersten Google-Ergebnisseite definiert. Diese sind blaue Überschriften, der dazugehörige Link ist in grün unter ihnen fixiert. Wie viele dieser Suchergebnisse einer/m Proband_In aufgelistete werden, worauf ihr inhaltlicher Fokus liegt, ob auf Fußball oder einem anderen Thema, und wo auf der Seite die Suchergebnisse platziert sind, wird in der Analyse herausgearbeitet und be- schrieben.

Anzeigen, Schlagzeilen, Bildergebnisse oder Spieltabellen sind per Definition auch Su- chergebnisse bzw. Suchtreffer auf die gestellte Suchanfrage. Diese werden in der vorlie- genden Hausarbeit jedoch explizit benannt als bspw. „Schlagzeilen“ oder allgemeiner als Items oder Suchtreffer. Auch sie werden analysiert und mit den Ergebnissen der anderen Teilnehmenden verglichen. Inwieweit die Suchergebnisse von den algorithmisch festge- stellten Interessen beeinflusst sind, soll weiter durch eine Analyse der „ähnlichen Such- anfragen“ untersucht werden. Denn diese, so die hier vertretene Annahme, selektiert der Google Algorithmus auch anhand der vermuteten Interessen. Sie werden im Folgenden „Vorschläge“ oder „ähnliche/verwandte Suchanfragen“ genannt. Nicht nur für den Google Algorithmus, auch für die Proband_Innen-Auswahl spielten die Interessen eine tragende Rolle.

Kriterien Proband_Innen-Auswahl

Der Fokus bei der Auswahl der vier Proband_Innen lag auf möglichst unterschiedlichen Merkmalsausprägungen der Merkmale Geschlecht, Beruf, Hobbys und Interessen, Tages- ablauf, Suchmaschinen-Nutzung, Nutzung der Google-Produkte. Diese Merkmalsausprä- gungen wurden vorab durch einen Fragebogen erfasst (Anhang: Fragenbögen, XXVII - XXX). Anhand der Angaben aus den Fragebögen wurden die Proband_Innen in eine Ver- suchs- und eine Kontrollgruppe eingeteilt. Die Proband_Innen der Versuchsgruppe wer- den in der vorliegenden Hausarbeit mit PV abgekürzt, die Proband_Innen der Kontroll- gruppe mit PK.

Bei den Proband_Innen der Kontrollgruppe, bestehend aus PK2 und PK4, lag besonderes Augenmerk auf der Merkmalsausprägung „fußballinteressiert“, „Fußballfan“ und „Fan des FC Sankt Pauli“. Über eine Selbstauskunft in Form eines Fragebogens (Anhang: Fra- genbögen, XXVIII/XXX) wurde überprüft, ob die Proband_Innen bereits im Vorfeld über Google nach dem Verein FC St. Pauli gesucht hatten und somit angenommen werden konnte, dass Google bereits ein Nutzer_Innen-Profil mit der Merkmalsausprägung „Sankt Pauli Fan“ angelegt hatte. Anhand dieses Nutzungsprofils würde Google, so die Annahme, hauptsächlich Suchtreffer mit Bezug zum Fußballverein St. Pauli auflisten. Für die Aus- wahl der Proband_Innen der Versuchsgruppe, bestehend aus PV1 und PV3, war hingegen ausschlaggebend, dass sie sich nicht für Fußball interessierten, sondern für das Merkmal „Hobbys & Interessen“ die Merkmalsausprägung „Reisen“ aufwiesen. Über einen Frage- bogen wurde festgestellt, dass die Proband_Innen weder Google als Standard-Suchma- schine nutzen, noch über Google nach Fußball im Allgemeinen und Sankt Pauli im Spe- ziellen gesucht hatten. So sollte gewährleistet werden, dass Google kein ausdifferenzier- tes Nutzungsprofil angelegt hatte, in dem Sankt Pauli versehen war. Wegen dieses weni- ger stark zugeschnittenen Nutzungsprofils würde Google, so die Annahme, bei der Re- cherche nach dem Suchbegriff „Sankt Pauli“ hauptsächlich Suchtreffer zum Bezirk, der Reeperbahn und eventuell dem Fußballverein als Highlight von Sankt Pauli, präsentieren.

Begründung Suchbegriff

Die Auswahl des Suchbegriffes erfolgte anhand seiner Ambivalenz. Sankt Pauli ist zum einen ein beliebtes Wohnviertel und Szeneviertel mit vielen touristischen Highlights (Hamburg Tourismus 2017) in Hamburg. Gleichzeitig ist Sankt Pauli auch der Name des populären Hamburger FC Sankt Pauli 1910, einem Fußballverein der zweiten Bundesliga (Sportschau 2017). Der Suchbegriff Sankt Pauli eignet sich aufgrund dieser Vielschich- tigkeit, um inkonsistente Suchergebnisse zu generieren und die Hypothese, dass Google Suchergebnisse personalisiert, zu prüfen. Die konkrete Annahme, auf der die Fallstudie fußt, lautet, dass Fans des FC. St. Pauli Suchergebnisse bei der Google-Suche nach „Sankt Pauli“ generiert werden, die von den Suchergebnissen derjenigen die sich nicht für Fuß- ball interessieren abweichen. Diese Forschungsfrage wird wie folgt versucht zu beant- worten.

3.2 Ablauf der Fallstudie

Anhand der erörterten Merkmale wurden die vier Teilnehmenden in eine Versuch- und eine Kontrollgruppe eingeteilt. Die Proband_Innen der Versuchsgruppe werden im Fol- genden PV genannt, die der Kontrollgruppe PK. Die Kontrollgruppe bestand aus den Pro- band_Innen PK2 und PK4. Ihr Interessenspektrum war auf Fußball zentriert. Das Interes- senspektrum der Versuchsgruppe, bestehend aus PV1 und PV3, bestand hingegen aus Reise-, Sightseeing- und Tourismusthemen.

Die Fallstudie ist in vier Testphasen unterteilt. In diesen vier Testphasen sollen Daten in Form von Screenshots generiert werden, die miteinander vergleichbar sind. Über diesen Vergleich sollen thematische Abweichungen und Inkonsistenzen in der Platzierung der Suchtreffer ermittelt werden. Über die ermittelten Inkonsistenzen lässt sich auf den Grad der interessenzentrierten Personalisierung der Google-Suchtreffer rückschließen. Zu die- sem Zweck werden die Ergebnisse der Auswertung des ersten Testlaufes mit den Ergeb- nissen aus den Testläufen 3 und 4 verglichen. Testphase 1 hält die Suchtreffer zum Zeit- punkt vor der Manipulation des Google Algorithmus fest. Während Testphase 2 wird der Versuch unternommen, den Google Algorithmus zu manipulieren, indem die Pro- band_Innen der Versuchsgruppe Interesse an Sightseeing in St. Pauli vorgeben. In Test- phase 3 werden die Suchtreffer nach der Manipulation festgehalten. Testphase 4 wurde etabliert, um den Einfluss von Störvariablen besser kontrollieren zu können. Als „Störva- riablen“ sind unter anderem Proband_Innen-Verhalten, technische Probleme beim Anfer- tigen der Screenshots und Versenden dieser oder auch unvorhergesehen Ereignisse in Zusammenhang mit dem Verein Sankt Pauli (z.B.: Trainer_Innen-Wechsel) oder dem Vier- tel Sankt Pauli (z.B.: Großdemonstration) definiert. Da Testphase 2 nicht in Form von Screenshots dokumentiert wurde, kann sie nicht ausgewertet werden und findet in der Analyse nur theoretische Erwähnung.

Die Hypothesenprüfung findet anhand der ermittelten Ergebnissen und Abweichungen statt. Vor Beginn der ersten Testphase wurden alle Teilnehmenden schriftlich unterwie- sen, wie die verschiedenen Testphasen ablaufen sollten (Anhang Proband_Innen Einwei- sung, XXXI).

Testphase 1

Am 21. Januar 2017 um 16 Uhr MEZ googleten alle Teilnehmenden den Suchbegriff „Sankt Pauli“. Vorgesehen war es, diesen Prozess über den privaten Laptop/PC und das eigene WiFi durchzuführen. Die Proband_Innen sollte nach öffnen ihres Standardbrowser die Homepage der Suchmaschine Google anwählen. Dort gaben sie in die Suchleiste den Suchbegriff Sankt Pauli ein. Im Anschluss fertigten sie Screenshots der gesamten ersten Suchseite an (ca. vier Screenshots), und schickten diese per Email an die Versuchsleiterin (Anlage: Screenshots Testphase 1; III.VI). Über die erste Testphase sollte ermittelt wer- den, wie sich die Suchergebnisse der Proband_Innen vor der Manipulation unterscheiden, um in Testphase 3 und 4 eventuelle Veränderungen feststellen zu können.

Die Einheitlichkeit des Suchzeitpunkts war hierbei wichtig, damit regionale und interna- tionale Ereignisse (z.B.: Großdemonstration auf St. Pauli), die eventuell als Störvariable die Suchergebnisse beeinflussen könnten, bei allen Proband_Innen die gleiche Ausstrah- lung auf die Suchergebnisse haben. Obwohl im Verlauf der ersten Testphase einige tech- nische Probleme die Ergebnisse der ersten Testphase beeinflussten, werden diese trotz- dem in der Ergebnisdarstellung und Analyse beachtet. Dies geschieht, um den Erfolg der Manipulation des Suchalgorithmus feststellen zu können, indem Vergleichswerte zum Zeitpunkt vor der Manipulation (Testphase 1) generiert werden. Während Testphase 2 war Einheitlichkeit nicht vonnöten.

Testphase 2

Im Zeitraum zwischen Testphase 1 (21.01.2017) und Testphase 3 (28.02.2016) sollten die Proband_Innen mehrmals pro Woche nach dem Suchbegriff „Sankt Pauli“, ergänzt durch frei wählbare Zusatzbegriffe aus den Feldern „Fußball“ oder „Reise und Touris- mus“ suchen. Während dieser Testphase 2 sollten bereits bestehende Nutzer_Innen-Pro- file manipuliert werden. Der Google-Algorithmus sollte durch die wiederholte Recherche nach dem Thema „Sightseeing etc. auf St. Pauli“ das Interessenprofil der Proband_Innen der Versuchsgruppe um das durch den Suchbegriff vorgegebene Interesse „Sightseeing etc. auf St. Pauli“ erweitern. Das Nutzungsprofil der Kontrollgruppe wurde durch die intensive Recherche nach Begrifflichkeiten mit Bezug zum FC St. Pauli nicht manipuliert, sondern gefestigt. Zu diesem Zweck sollten die Teilnehmenden ein möglichst authenti- sches Such- und Surfverhalten zeigen. So sollte die Wahrscheinlichkeit erhöht werden, dass der Algorithmus von keiner gezielten Manipulation ausgeht, sondern die neuen The- men als echtes Interesse verzeichnet. Weder Zeiten noch verwendete Geräte waren vor- gegeben. Ab wann der Google Algorithmus neue Interessen in bestehende Nutzungspro- file integriert, konnte nicht herausgefunden werden. Darum wurde für die manipulative Testphase 2 der im Rahmen der Hausarbeit längst mögliche Zeitraum von ca. fünf Wo- chen gewählt.

Testphase 3 und 4

Im Anschluss an die knapp fünfwöchige Testphase 2 sollte mithilfe von Testphase 3 und 4 überprüft werden, ob der Google-Algorithmus auf die Manipulation reagiert und die Suchergebnisse personalisiert hatte. In diesem Fall, so die Annahme, müssten sich die Suchergebnisse der Versuchsgruppe auf das Interessengebiet „Sightseeing und Touris- mus“ zentriert haben. Über einen Vergleich der thematischen Ausrichtung und Platzie- rung der Suchtreffer aus den Testläufen 1,3 und 4 müsste sich diese Personalisierung feststellen lassen. Zu erwarten wäre, dass der Kontrollgruppe hauptsächlich Suchtreffer mit dem Schwerpunkt „FC St. Pauli 1910“ angezeigt werden. Die Proband_Innen der Versuchsgruppe hingegen Suchergebnisse mit dem Schwerpunkt „Reise und Sightsee- ing“ erhielten.

Testphase 3 fand am 28. Februar 2017 um 17.50 Uhr MEZ statt. Alle Teilnehmenden googleten den Suchbegriff „Sankt Pauli“. Wie schon in der ersten Testphase war Einheit- lichkeit von höchster Priorität, um eventuelle Störvariablen besser kontrollieren zu kön- nen. Wieder sollte die Suche über den privaten Laptop/PC und das eigene Wlan durchge- führt werden. Die Ergebnisseiten wurden wieder per Screenshot festgehalten und an die Versuchsleiterin geschickt (Anhang: Screenshots Testphase 3; XIII -XII). Was bei der Terminwahl keine Relevanz besaß, war das Spiel des FC St. Pauli gegen den Karlsruher SC am 27.02.2017. Bei diesem „Kellerduell“ gewann Sankt Pauli, bis dato auf dem letz- ten Tabellenplatz der zweiten Bundesliga und damit im Inbegriff abzusteigen, fünf zu null, so die Sportschau. Dieser unerwartet hohe Sieg wurde von zahlreichen Medien be- handelt, wie die Suchergebnisse zeigen. Dass die Berichterstattung über diesen Sieg als Störvariable auf die Suchergebnisse ausstrahlte und die Ergebnisse verzerrt, ist anzuneh- men.

[...]


1 Vgl. Weisberg (2011); Boutin (2011)

Ende der Leseprobe aus 60 Seiten

Details

Titel
Personalisierungsgrad der Google-Suchtreffer anhand des Suchbegriffes "Sankt Pauli"
Hochschule
Rheinische Friedrich-Wilhelms-Universität Bonn  (Medienwissenschaft)
Note
1,3
Autor
Jahr
2017
Seiten
60
Katalognummer
V504370
ISBN (eBook)
9783346049490
ISBN (Buch)
9783346049506
Sprache
Deutsch
Anmerkungen
Inklusive 25 Seiten Anhang
Schlagworte
Algorithmen, Algorithmische Selektion, Fallstudie, Experiment, Personalisierung, Google, Datenschutz, Filter Bubble, Interessenzentrierten Personalisierung
Arbeit zitieren
Felicitas Schneider (Autor:in), 2017, Personalisierungsgrad der Google-Suchtreffer anhand des Suchbegriffes "Sankt Pauli", München, GRIN Verlag, https://www.grin.com/document/504370

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Personalisierungsgrad der Google-Suchtreffer anhand des Suchbegriffes "Sankt Pauli"



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden