Entwicklung eines Empfehlungsrasters für Personalisierungsverfahren und Anwendung auf ein mobiles Video‐Service


Diplomarbeit, 2008

148 Seiten, Note: 1,0

Walter Kalunder (Autor:in)


Leseprobe


INHALTSVERZEICHNIS

1. Einleitung
1.1. Ausgangssituation
1.2. Zielsetzung
1.3. Methodische Vorgehensweise

2. Personalisierung
2.1. Der Begriff „Personalisierung“ – Einführung und Zielsetzung
2.1.1. Personalisierungsgrade
2.1.2. Sinn und Zweck der Personalisierung
2.2. Die Ebenen der Personalisierung
2.3. Benutzerprofilierung
2.3.1. Profilierung als Basis der individualisierten Personalisierung
2.3.1.1. Der Prozess der User-Profilierung
2.3.1.2. Explizite, implizite oder bereits vorhanden Daten
2.3.1.3. Benutzer-Identifikation
2.3.1.4. Speicherung der Profildaten – Client- oder Serverseitig
2.3.1.5. Ergebnisse der User-Profilierung - Profiltypen
2.3.2. Logfiles
2.3.3. Web (Usage) Mining
2.3.3.1. Web Mining Kategorien
2.3.3.2. Der Prozess des Web Usage Mining
2.3.4. Problemfelder in der User-Profilierung
2.4. Matching – (Match Making)
2.4.1. Nicht individualisierte Personalisierung
2.4.2. Checkbox Personalisierung
2.4.3. Rule-Based Filtering (Regelbasiertes Filtern)
2.4.4. Formularbasiertes Filtern
2.4.5. Einfache Filterung
2.4.6. Content-Based Filtering (Inhaltsbasiertes Filtern)
2.4.7. Collaborative Filtering (Kollaboratives Filtern)
2.4.8. Hybride Systeme
2.5. Personalisierte Werbung

3. Best Practice Beispiele aus dem Bereich der Personalisierung im WWW
3.1. Entwicklung des Analyserasters
3.2. Einordnung der Personalisierungsanbieter, -beispiele in den Analyseraster
3.3. Erkenntnisse aus dem Analyseraster
3.3.1. WWW-Allgemein
3.3.2. Personalisierte Werbung
3.3.3. Personalisierte Musik
3.4. Auswahl und Darstellung der Best-Practice Beispiele für die WWW-Plattform
3.4.1. Kriterien für die Auswahl der Best-Practice Beispiele
3.4.2 Darstellung der Best-Practice Beispiele
3.4.2.1. Criteo
3.4.2.2. Taste
3.4.2.3. wunderloop
3.4.2.4. nugg.ad AG

4. Best-Practice Beispiele aus dem Bereich Personalisierung im mobilen Internet
4.1. Herausforderungen, Grenzen und Möglichkeiten des mobilen Internets
4.1.1. Potentiale des mobilen Internets
4.1.2. Mobile Advertising
4.1.3. Gefahren des mobilen Internets – das Handy als Teil der Persönlichkeit
4.2. Entwicklung eines Analyserasters
4.3. Einordnung der Personalisierungsanbieter und -beispiele in den Analyseraster
4.4. Erkenntnisse aus dem Analyseraster
4.5. Auswahl und Darstellung der Best-Practice Beispiele
4.5.1. Blyk
4.5.2. Choicestream
4.5.3. Regisoft

5. Leitfaden für die Wahl des richtigen Personalisierungsverfahrens
5.1. Ablauf der Identifikation des richtigen Personalisierungsverfahrens
5.2. Literaturzusammenfassung: Wann sich welche Personalisierungsmethoden eignen
5.3. Bestimmungsfaktoren für die Wahl des richtigen Personalisierungsverfahrens
5.3.1. Erörterungen zum Empfehlungsraster
5.3.2. Betriebswirtschaftliche Ergänzungen zum Empfehlungsraster

6. Personalisierung am Beispiel einer mobilen Videoplattform
6.1. Servicebeschreibung zur mobilen Videoplattform
6.2. Ziel der Personalisierung auf der mobilen Videoplattform
6.3. Entwicklung einer Personalisierungsstrategie für die mobile Videoplattform
6.3.1. Phase 1: Fokus - Nicht individualisierte Personalisierung
6.3.2. Phase 2: Fokus - Individualisierte Personalisierung
6.3.3. Personalisierte Werbung auf der mobilen Videoplattform

7. Resümee

A. Anhang - Aufzählung von Logfile-Analyzer-Anbietern

B. Anhang – Überblick über den Kategorisierungsraster Allgemein/Werbung/Musik

C. Anhang Überblick über den Kategorisierungsraster Mobile

D. Literaturverzeichnis

ABBILDUNGSVERZEICHNIS

Abbildung 1: Entwicklung der Webseiten-Anzahl im Zeitraffer. Quelle: http://news.netcraft.com/archives/web_server_survey.html, Stand 25.01.2008

Abbildung 2: Personalisierungsgrade. Quelle: Schubert/Ginsburg (2000)

Abbildung 3: Vom Massenmarkt zur Individualität. Quelle: Scharl (2000)

Abbildung 4: Positive Effekte der Benutzermodellierung. Quelle: Mertens/Höhl (1999)

Abbildung 5: Die 3 Ebenen der Personalisierung. Quelle: In Anlehnung an Klossek (2006); Schemion/Koenemann/Reichert (2003); Runte (2000)

Abbildung 6: Customer Profile Life Cycle. Quelle: Schubert / Leimstoll (2002)

Abbildung 7: A technical view on personalization. Quelle: Schubert (2006)

Abbildung 8: Checkliste: Profile für Personalisierungsfunkionen. Quelle: Schubert/Leimstoll (2002)

Abbildung 9: Ablauf einer Anfrage vom Client-Rechner zum Webserver. Quelle: Appl/Meier (2001)

Abbildung 10: Kategorisierung des Web Mining. Quelle: Zaiane (2001)

Abbildung 11: Personalisierungsprozess. Quelle: In Anlehnung an Schemion/Koenemann/Reichert (2003)

Abbildung 12: Personalisierungsmethoden (Algorithmusebene). Quelle: In Anlehnung an Runte (2000)

Abbildung 13: Nicht individualisierte Personalisierung auf Youtube. Quelle: http:www.youtube.com, Stand 25.01.2008

Abbildung 14: Beispiel für Checkbox-Personalisierung auf iGoogle. Quelle: http://www.google.at/ig, Stand 05.01.2008

Abbildung 15: Regelbasiertes Filtern auf www.garden.com. Quelle: http://www.garden.com, Stand 05.01.2008

Abbildung 16: Personalisierte Suche auf Google. Quelle: http://www.google.com/history, Stand 05.01.2008

Abbildung 17: Personalisierte Startseite auf My Yahoo! Quelle: http://www.my.yahoo.com, Stand 05.01.2008

Abbildung 18: Content-Based Filtering. Quelle: http://www.contentmanager.de/magazin/artikel_47-print_wenn_es_persoenlich_wird_webpersonalisierung.html, Stand 25.01.2008

Abbildung 19: Beispiel einer Inhaltsbeschreibung. Quelle: Eigene Darstellung

Abbildung 20: Beispiel Vektorraum-Modell. Quelle: Eigene Darstellung

Abbildung 21: Linear-additives Präferenz-Modell. Quelle: in Anlehnung an Runte (2000)

Abbildung 22: Content-Based Filtering bei Musiktiteln. Quelle: http://musicminer.sourceforge.net/, Stand 05.01.2008

Abbildung 23: Collaborative Filtering. Quelle: http://www.kamishima.net/research.htm, Stand 05.01.2008

Abbildung 24: Klassifikation von Collaborative Filtering. Quelle: Dörner (2000)

Abbildung 25: Manuel (active) collaborative Filtering. Quelle: http://www.diepresse.at, Stand 04.01.2008

Abbildung 26: links: Ähnlichkeitstabelle, rechts: Datenmatrix. Quelle: Lehmann (2004)

Abbildung 27: Automated Collaborative Filtering. Quelle: http://www.amazon.de, Stand 05.01.2008

Abbildung 28: Einordnung des Item-Based Collaborative Filtering. Quelle: In Anlehnung an Runte (2000)

Abbildung 29: Evolution der Zielgruppen Ansprache. Quelle: http://www.onlinemarketingbuch.info/targeting.html, Stand 25.01.2008

Abbildung 30: Ergebnisse Kategorisierungsraster: Eingesetzte Empfehlungs-Algorithmen der 39 Anbieter aus dem Bereich „WWW-Allgemein“. Quelle: Eigene Darstellung

Abbildung 31: Ergebnisse Kategorisierungsraster: Eingesetzte Algorithmen der 20 Anbieter aus dem Bereich „Fokus Werbung“. Quelle: Eigene Darstellung

Abbildung 32: Ergebnisse Kategorisierungsraster: Eingesetzter Empfehlungs-Algorithmen der 11 Anbieter/Services aus dem Bereich „Fokus Musik“. Quelle: Eigene Darstellung

Abbildung 33: Wunderloop Integrated Targeting Plattform. Quelle: http://www.wunderloop.com/de, Stand 25.01.2008

Abbildung 34: Beispiel einer nugg.ad Befragung. Quelle: http://derstandard.at, Stand 07.12.2007

Abbildung 35: Unterschiede zwischen mobiler und Festnetz-Internet Nutzung. Quelle: Link (2003)

Abbildung 36: Ergebnisse Kategorisierungsraster: Eingesetzte Targeting-Varianten und Empfehlungs-Algorithmen der 15 Anbieter aus dem Bereich: Mobile. Quelle: Eigene Darstellung

Abbildung 37: Beispiele für personalisierte Werbung auf Blyk. Quelle: http://www.blyk.co.uk/about/tour, Stand 05.01.2008

Abbildung 38: Choicestream Produktbeschreibung. Quelle: http://www.choicestream.com/solutions/mobile/, Stand 05.01.2008

TABELLENVERZEICHNIS

Tabelle 1: Methoden der Identifizierung nach Dörner. Quelle: Dörner (2003)

Tabelle 2: Arten von Kundenprofilen. Quelle: Schubert / Leimstoll (2002)

Tabelle 3: Varianten des Online-Targeting. Quelle: In Anlehnung an Henning (2007)

Tabelle 4: Vergleich der Personalisierungsverfahren. Quelle: Klossek (2006)

Tabelle 5: Personalisierungsverfahren orientiert am Website-Typ. Quelle: http://www.ibm.com/developerworks/websphere/library/techarticles/hipods/personalize.html, Stand 25.01.2008

Tabelle 6: Technologisch empfehlenswerte Personalisierungsverfahren, orientiert an ausgewählten Bestimmungsfaktoren. Quelle: Eigene Darstellung

Tabelle 7: Technologisch empfehlenswerte Personalisierungsverfahren, orientiert an ausgewählten Bestimmungsfaktoren. Quelle: Eigene Darstellung

Tabelle 8: Vor- und Nachteile der einzelnen Personalisierungsverfahren aus Usersicht. Quelle: Eigene Darstellung

Tabelle 9: Potentielle Partner für die Personalisierung von Werbung auf einer mobilen Videoplattform. Quelle: Eigene Darstellung

ABKÜRZUNGSVERZEICHNIS

Abbildung in dieser Leseprobe nicht enthalten

Geschlechterneutrale Formulierung

Aus Gründen der Lesbarkeit wird in dieser Arbeit auf eine geschlechterneutrale

Formulierung verzichtet. Es sind jedoch immer beide Geschlechter angesprochen.

„Customers, whether consumers or businesses, do not want more choices. They want exactly what they want – when, where, and how they want it – and technology now makes it possible for companies to give it to them.”

(Pine/Peppers)

1. Einleitung

Die Personalisierung im Bereich der interaktiven Medien bietet schon heute ein enormes wirtschaftliches Potential für die Betreiber von Webangeboten der unterschiedlichsten Kategorien und dieses wirtschaftliche Potential wird aufgrund des Trends hin zum mobilen Internet noch eine wesentliche Steigerung erfahren. Diese Einleitung soll nun erklären, warum eben dieser Personalisierung ein immer höherer Stellenwert zukommen wird und wie in dieser Magisterarbeit die theoretische Basis für den praxisbezogenen Teil der Erarbeitung einer Personalisierungsstrategie für eine mobile Videoplattform geschaffen wird.

1.1. Ausgangssituation

Die inhaltlichen Angebote, welche uns die digitale Welt des Internets zu bieten imstande ist, scheinen schon heute unvorstellbar vielfältig und umfangreich zu sein und angesichts des Trends hin zum User-Generated-Content, wird die Zukunft weder eine Verringerung des Umfangs, noch der Vielfalt der Internet-Inhalte mit sich bringen. Ein Begriff, welcher in diesem Zusammenhang wohl sehr schnell an Bedeutung gewinnen wird, stellt der „Information Overload“, oder auf Deutsch, die „Informationsüberflutung“ dar.[1] Angesichts der Tatsache, dass Netcraft[2] in seiner monatlichen Internet-Untersuchung bereits die unglaubliche Anzahl 155.230.051 verschiedener Webseiten erhoben hat (davon werden rund 70 Millionen Webseiten aktiv betrieben - Stand Dezember 2007)[3] und man sich zudem die zukünftige Entwicklung der Webseiten-Anzahl anhand der in Abbildung 1 gezeigten Grafik sehr gut herleiten kann, wird die Informationsüberflutung wohl auch in Zukunft nicht abnehmen.[4]

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Entwicklung der Webseiten-Anzahl im Zeitraffer. Quelle: http://news.netcraft.com/archives/web_server_survey.html, Stand 25.01.2008

Als Website-Betreiber muss man Mittel und Wege finden, sich aus dieser Masse an Webseiten heraus zu lösen und einen signifikanten Mehrwert für seine Kunden anbieten können. Die logische Konsequenz ist, dass sich Anbieter im Bereich des Internets verstärkt Gedanken darüber machen werden müssen, wie sie es zukünftig schaffen, ihren Kunden die richtigen Inhalte zur richtigen Zeit und in der richtigen Art und Weise anzubieten. Die Potentiale der Anpassung von Inhalten, Produkten, gesamter Webseiten, sowie der Art der Kommunikation an die Bedürfnisse identifizierter Kunden werden verstärkt in den Mittelpunkt rücken.

Neue mobile Dienste wie das Mobile-Internet, Mobile-Video und auch e-Mail am mobilen Endgerät werden erst dann den Massenmarkt erobern können, wenn deren Kosten z.B. über Werbung gegenfinanziert und die Preise für diese Dienste damit signifikant gesenkt werden können.[5] Fox Interactive Media geht diesbezüglich davon aus, dass personalisierten Werbung die Chance auf einen Kontakt mit dem Benutzer um durchschnittlich 80 Prozent erhöht.[6] Der CEO von Blyk, einem werbefinanzierten Mobilfunkanbieter aus Großbritannien, meinte wiederum: „Die Nutzer sollen im Idealfall gar nicht darüber nachdenken, dass sie Werbung gegen Telefonminuten oder SMS tauschen“ und sprach damit das Ziel an, dass die Werbung innerhalb des Blyk-Netzwerkes derart zielgenau und altersgerecht gestaltet werden soll, dass sich die junge Zielgruppe sogar daran erfreut und die Werbung nicht mehr als solche wahr nimmt, sondern vielmehr als einen weiteren Content, welcher den persönlichen Interessen entspricht.[7] Diese Aussage wird letztlich auch von einer Gartner-Studie[8] aus dem Jahr 2005 unterstützt, in welcher 53 Prozent der befragten Personen angegeben haben, sich für den Erhalt „relevanter mobiler Werbung“ im Gegenzug für kostenlose Musik- oder Video-Inhalte zu interessieren.[9]

Zusammenfassend lässt sich also festhalten, dass die Sinnhaftigkeit von Personalisierungsmaßnahmen, als eindeutig gegeben angenommen werden kann. Es ist ein ökonomisches Potential für den Einsatz von Personalisierungsverfahren hinsichtlich Content und vor allem der Werbung gegeben und speziell der Bereich des mobilen Internets kann einen großen Nutzen aus den Möglichkeiten der personalisierten Werbung ziehen. In weiterer Folge gilt es nun konsequenterweise, die Zielsetzung dieser Magisterarbeit genauer zu definieren und darauf aufbauend, einen kurzen Einblick über die methodische Vorgehensweise zu bieten.

1.2. Zielsetzung

Das Endziel der Magisterarbeit „Entwicklung eines Empfehlungsrasters für Personalisierungsverfahren und Anwendung auf ein mobiles Video-Service“ ist die Identifizierung von aussagekräftigen Bestimmungsfaktoren, anhand welcher man die technische Eignung einzelner Personalisierungsverfahren für spezifische Webangebote abschätzen kann. Diese Bestimmungsfaktoren werden in einem Empfehlungsraster zusammengefasst, welcher in der Folge dazu dienen soll, eine intersubjektiv nachvollziehbare Personalisierungsstrategie für eine mobile Videoplattform zu entwickeln.

Um dieses Ziel zu erreichen, wird es erst notwendig sein, sich eine fundierte theoretische Basis zum Gebiet der Personalisierungsmöglichkeiten im Bereich des Internets zu erarbeiten. Auf diesem Wissen aufbauend, sollen folglich einzelne Bestimmungsfaktoren für die Wahl des richtigen Personalisierungsverfahrens identifiziert werden. Letztlich gilt es, die bis dahin erworbenen Erkenntnisse auf die mobile Videoplattform umzulegen und eine entsprechende Personalisierungsstrategie zu erarbeiten.

Folgende 4 Teilprodukte werden demnach im Rahmen dieser Magisterarbeit entwickelt werden:

1. Ein Überblick über den State-of-the-Art der unterschiedlichen Personalisierungsverfahren im Bereich des World Wide Webs.
2. Eine Analyse und Kategorisierung der derzeit am Markt für Personalisierungstechnologie vertretenen Anbieter und deren Produkte.
3. Die Erarbeitung eines Empfehlungsrasters/Fragenkatalogs, welcher anhand von wenigen Bestimmungsfaktoren eine Empfehlung abgibt, welches Personalisierungsverfahren für welchen Dienst/Service am geeignetsten erscheint.
4. Eine empfohlene Personalisierungsstrategie für eine mobile Videoplattform.

1.3. Methodische Vorgehensweise

Aufbauend auf die in Punkt 1.2 genannte Zielsetzung lässt sich folgende methodische Vorgehensweise skizzieren:

Der erste Teil der Arbeit wird einen fundierten theoretischen Überblick über den derzeitigen State-of-the-Art im Bereich der Personalisierung interaktiver Medien bieten. Eine ausführliche Literaturrecherche soll Auskunft über die Möglichkeiten, Potentiale und die unterschiedlichen technologischen Komponenten von Personalisierungssystemen geben und helfen, ein Verständnis über die Einsatzmöglichkeiten dieser Software zu gewinnen.

Aufbauend auf dieses Wissen, werden eine Analyse und Kategorisierung der derzeit am Markt anzutreffenden Personalisierungsanbieter dazu dienen, den globalen Markt für Personalisierungssoftware kennen zu lernen, die einzelnen Anbieter vergleichbar zu machen und Trends hinsichtlich der derzeit gängigsten technologischen Lösungen zu erkennen. Hierzu soll ein Kategorisierungsraster mit einer Reihe an aussagekräftigen Attributen entwickelt und über eine umfassende Web-Recherche aufgefüllt werden. Die notwendigen Inputdaten für die Erhebung relevanter Anbieter werden aus wissenschaftlichen Arbeiten, aus Artikeln in facheinschlägigen Zeitschriften sowie aus der eigenen Web-Recherche gewonnen werden.

Nach der Erstellung des Analyserasters gilt es letztlich die Ergebnisse aus der Literaturrecherche sowie der Analyse des Markts für Personalisierungssoftware zusammen zu fassen und aus diesen Informationen die Bestimmungsfaktoren für die Wahl des richtigen Personalisierungsverfahrens logisch nachvollziehbar abzuleiten.

Letztlich dient eine mobile Videoplattform dazu, die abgeleiteten Bestimmungsfaktoren und den entwickelten Empfehlungsraster in der Praxis zu erproben und in diesem Rahmen eine Personalisierungsstrategie zu entwickeln.

„Ich bin was ich bin, weil ich getan habe, was ich getan habe.“

(Elia Kazan)

2. Personalisierung

Bevor nun in dieser Arbeit die Personalisierung im Bereich der interaktiven Medien einer eingehenden Untersuchung unterzogen werden soll, scheint zunächst eine Abgrenzung des Begriffs „Personalisierung“ selbst notwendig. Diese Begriffsabgrenzung, eine kurze Darstellung der Personalisierungsgrade sowie eine Ergänzung zu Kapitel 1 hinsichtlich dem Sinn und Zweck der Personalisierung, bieten die Grundlage für dieses umfangreiche Kapitel.

Darauf aufbauend werden die drei Ebenen der Personalisierung vorgestellt. Detaillierte Informationen zu den einzelnen Phasen des Personalisierungsprozesses sollen dazu dienen, ein grundsätzliches Verständnis für dieses so weitreichende Forschungsgebiet zu schaffen. Diese fundierte theoretische Basis wird notwendig sein, um letztlich die in den nächsten Kapiteln folgenden Praxisschwerpunkte objektiv bewerten zu können.

2.1. Der Begriff „Personalisierung“ – Einführung und Zielsetzung

Schubert stellte schon 2002 fest, dass es schwierig sei, den Begriff der Personalisierung in der Literatur zu beleuchten, da er einerseits sehr viele verschiedene Facetten aufweist und andererseits nicht in eine spezifische Domäne einzuordnen ist.[10] Letztlich verweist die Autorin auf zwei primäre Linien in der Literatur, dies sind Publikationen zur „Mass Customization“, sowie Publikationen zur „Personalization“. Während die Mass Customization eher den Produktionsprozess fokussiert (z.B. konfigurierbare Rechner von Dell) und die Thematik aus der Sicht von Ingenieuren betrachtet, so zielt der Bereich der Personalisierung stärker auf den Kommunikationsaspekt ab und fällt damit eindeutig in den Kompetenzbereich der Marketing- und Kommunikations-Experten. Chiu formuliert Personalisierung in einem IBM-Whitepaper (2001) wie folgt:

„Personalization is a process of gathering and storing information about site visitors, analyzing the information, and, based on the analysis, delivering the right information to each visitor at the right time.“[11]

Schubert definiert Personalisierung eher aus einer technischen Perspektive:

„From a technical point of view, meta-information of products or information object is matched against meta-information users (stored in the customer profile).“[12]

Diese Arbeit wird sich an eine sehr weite Abgrenzung von Personalisierung halten und unter diesem Begriff jede unternehmerische Aktion, welche auf den Einsatz interaktiver Medien gestützt wird und die darauf ausgerichtet ist, eine individuelle Anpassung betrieblicher Vorgänge auf den Kunden zu erreichen, verstehen.[13] Demnach bezieht sich der Begriff „Personalisierung“ in dieser Arbeit sowohl auf die Anpassung von Produkten, als auch die Anpassung der Kommunikation dem Kunden gegenüber.

2.1.1. Personalisierungsgrade

Sind sich die Autoren hinsichtlich der Definition von Personalisierung noch durchwegs einig, so finden sich bei den unterschiedlichen Personalisierungsgraden bereits klare Abweichungen. Schubert/Ginsburg unterscheiden drei unterschiedliche Stufen der Personalisierung und identifizieren die Individualisierung als die höchste Stufe der Personalisierung (siehe Abbildung 2).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Personalisierungsgrade. Quelle: Schubert/Ginsburg (2000)

Scharl weicht von dieser Einstufung ab und bezeichnet die Personalisierung selbst als die höchste zu erreichende Stufe. Die Individualisierung sieht er lediglich als eine „Personalisierung für einzelne Sektoren“, nicht aber für einzelne Individuen an (siehe Abbildung 3).

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Vom Massenmarkt zur Individualität. Quelle: Scharl (2000)

Logisch nachvollziehbarer scheint freilich die Kategorisierung nach Schubert/Ginsburg, da das Eigenschaftswort „individualisiert“ im deutschen Sprachgebrauch wohl immer mit einem Individuum, also einer einzigen Person und nicht einem ganzen Sektor assoziiert wird.

2.1.2. Sinn und Zweck der Personalisierung

Wie in Kapitel 1 dieser Arbeit bereits eingehend beschrieben, stellt die Informationsüberflutung in der heutigen Zeit ein nicht von der Hand zu weisendes Problem, vor allem im Bereich der interaktiven Medien dar. Computersysteme und Datenbanken verarbeiten heute unvorstellbar große Mengen an Daten und Informationen. Diese überfordern den menschlichen Geist nicht nur global gesehen, sondern oft reicht schon die Informationsmenge auf der lokalen Terabyte-Festplatte[14] des Familienrechners aus, um den User mit fragenden Blicken zu hinterlassen.[15]

Das Internet wird mit der von Netcraft beschriebenen Explosion an Webseiten[16] jedoch nicht nur in seiner Breite umfangreicher, sondern auch in seiner Tiefe. Die damit verbundene Steigerung der Komplexität führt letztlich zu einer Überforderung der Benutzer und muss und kann anhand geeigneter technologischer Maßnahmen reduziert werden.[17] Die Lieferung personalisierter Informationen stellt eindeutig einen kritischen Erfolgsfaktor für die Effektivität einer Website dar. Die Anbieter haben damit nicht nur die Möglichkeit, ihre Kunden basierend auf den bisherigen Transaktionen personalisiert anzusprechen, sondern vielmehr sogar eine „customization“ der eigenen Ressourcen (Produkte, Informationen, Services) durchzuführen und damit den Wünschen der einzelnen Kunden noch besser zu entsprechen.[18] Natürlich sind diese Möglichkeiten der „Personalization“ und der „Customization“ nicht nur alleine auf den Bereich der interaktiven Medien beschränkt, doch scheinen die Einsatzmöglichkeiten der Personalisierung hier vor allem aufgrund der kostengünstigen Automatisierung der dahinter liegenden Prozesse als sehr vielversprechend.[19]

Doch nicht nur die Komplexität im Internet und damit der Bedarf an personalisierten Inhalten haben sich in den letzten Jahren drastisch erhöht, auch die Konsumenten selbst haben sich verändert. Die Verbraucher nutzen den erleichterten Informationszugang und das zusammenwachsende globale Angebot aus und treten autonomer und aktiver auf bzw. wollen individuelle Angebote und Produkte erwerben.[20] Scharl definiert das Internet als „turbulent, chaotisch und wechselhaft“ und weiters als „eine Umgebung, in dem die Konsumenten kaum über Toleranz, Nachsichtigkeit oder Loyalität verfügen“.[21] Letztlich muss man den selbstbewusster auftretenden Kunden klare Vorteile kommunizieren können, warum die eigene Website ihre Bedürfnisse besser befriedigen kann als andere. Hierzu kann die Personalisierung maßgeblich beitragen:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 4: Positive Effekte der Benutzermodellierung. Quelle: Mertens/Höhl (1999)

Zusammengefasst lässt sich demnach festhalten, dass der Hauptwert der Personalisierung für den Kunden in Zeitersparnissen und in den auf die individuellen Bedürfnisse abgestimmten Informations- und Produktangeboten liegt.[22]

2.2. Die Ebenen der Personalisierung

Aufgrund des enormen Umfangs, welchen der Begriff „Personalisierung“ im Rahmen des WWW bietet, scheint es empfehlenswert, die Personalisierung im Sinne eines besseren Verständnisses zu visualisieren und eine Landkarte zu entwickeln. Diese ermöglicht einen schnellen, aber aussagekräftigen Überblick über diesen Fachbereich. Anhand der Visualisierung soll möglichst prägnant dargestellt werden, was sich im Umfeld der interaktiven Medien grundsätzlich personalisieren lässt und welche unterschiedlichen technologischen Lösungen dazu herangezogen werden können. Da es im Rahmen dieser Magisterarbeit nicht möglich war, einen zufriedenstellenden Gesamtüberblick über das Forschungsgebiet der Personalisierung in der wissenschaftlichen Literatur aufzufinden, wurde eine solche „Landkarte“ aus unterschiedlichen Teilübersichten zusammengestellt.

Das Ergebnis dieses Arbeitspakets findet sich in Abbildung 5 wieder, welche den Begriff „Personalisierung“ in drei Ebenen zu untergliedern versucht, wobei jede Ebene für sich jeweils von verschiedenen Experten analysiert wurde und den „gemeinsamen Nenner“ der diversen bisherigen Forschungstätigkeiten widerspiegelt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 5: Die 3 Ebenen der Personalisierung. Quelle: In Anlehnung an Klossek (2006); Schemion/Koenemann/Reichert (2003); Runte (2000)

Als die oberste Untergliederungsebene bietet sich konsequenterweise die Anwendungsebene an, anhand welcher die Frage beantwortet werden soll, was grundsätzlich alles personalisiert werden kann.[23]

Die unterste Stufe (= Algorithmusebene), gibt eine Übersicht über die unterschiedlichen technologischen Personalisierungsverfahren wieder.[24] Diese Ebene teilt sich in den Bereich der Profilierungs-Algorithmen (rechte Spalte) und in den Bereich der Empfehlungs-Algorithmen (linke Spalte).

Als logisches Bindeglied zwischen der technologischen Umsetzung auf Ebene 1 und dem Endergebnis auf Ebene 3 komplettiert die Prozessebene, welche den Ablauf des Personalisierungsprozesses wiedergeben soll, das Konzept des Gesamtüberblicks in Abbildung 5. Auch auf diesem Level finden sich in der Literatur eine Reihe unterschiedlicher Darstellungen, im Kern laufen diese aber alle auf den hier gewählten Kreislauf-Prozess nach Schemion/Koenemann/Reichert[25] hinaus.[26]

Wichtig für die folgenden Ausführungen ist, die Prozessebene als die Meta-Ebene der Personalisierung zu verstehen. Unabhängig davon, welches Verfahren auf der Algorithmusebene angewendet wird bzw. welche Form das Ergebnis einer Personalisierung auf der Anwendungsebene annimmt, werden die vier Phasen des Personalisierungsprozesses stets ident sein.

Rein inhaltlich empfiehlt sich für eine weitere Beleuchtung der einzelnen Prozessschritte eine Zusammenfassung der ersten beiden Prozessphasen (sammeln und analysieren) unter dem Begriff „Benutzerprofilierung“, sowie eine gemeinsame Betrachtung der letzten beiden Prozessphasen (erzeugen und ausführen) unter dem Begriff „Matching“. Um der Aufgabenstellung der Entwicklung eines Empfehlungsrasters für die Identifikation geeigneter Personalisierungsverfahren für spezifische Internetangebote nachzukommen, wird es notwendig sein die technische Funktionsebene (= Algorithmusebene) zu verstehen. Dementsprechend wird dieses Kapitel in der Folge die unterschiedlichen technologischen Umsetzungsmöglichkeiten auf der Algorithmusebene einer eingehenden Beleuchtung unterziehen.

Der Vollständigkeit halber soll noch auf die ebenfalls interessante „Personalization Map“ von Schubert/Leimstoll/Risch verwiesen werden, welche anhand einer tiefgehenden Analyse der Anwendungsebene, die vielfältigen Einsatzmöglichkeiten von Personalisierungsverfahren aufzeigt.[27] Chiu visualisiert den Begriff „Personalisierung“ aus eher technischer Sicht und beschränkt seine Ausführungen auf einen relativ geringen Grad an Komplexität und Tiefe.[28]

2.3. Benutzerprofilierung

Lord Leverhulme sagte schon: „I know that half of my advertising budget is wasted, but I´m not sure which half.“[29] Das Ziel der Profilierungsphase der Personalisierung muss es sein, Kenntnis darüber zu erlangen, welche Hälfte der Werbungsausgaben die Zielgruppe erreicht hat und welche Hälfte die verschwendete war, um die zukünftigen Streuverluste zu minimieren. Für den Erwerb dieser Daten empfehlen sich unterschiedliche Methoden, welche jede für sich diverse Vor- und Nachteile zu bieten haben. Grundsätzlich gilt es hier zu beachten, dass - abhängig von der angestrebten Personalisierungsanwendung - unterschiedliche Input- und Profildaten zu erheben sind und ein Sammeln unnötiger Daten aus Kosten- und Performancegründen möglichst zu vermeiden ist.[30]

2.3.1. Profilierung als Basis der individualisierten Personalisierung

Aussagekräftige Kundenprofile bilden die Grundlage einer erfolgreichen Personalisierung.[31] Die beiden Prozessschritte „Daten sammeln“ und „Daten analysieren“ können gemeinsam unter der Prozessphase der Benutzerprofilierung zusammengefasst werden. Personenbezogene Informationen und Daten über den Kunden werden in Benutzerprofilen gespeichert, welche damit sowohl im Festnetz-Internet, als auch dem mobilen Internet die Grundlage der Personalisierung bilden. Personalisierung und Profilierung sind demnach sehr eng (bis untrennbar) miteinander verknüpft.[32]

2.3.1.1. Der Prozess der User-Profilierung

Der Prozess zur Erstellung eines Benutzerprofiles wurde von Schubert/Leimstoll bereits 2002 im „Customer Profile Life Cycle“ in Abbildung 6 visualisiert. Auffallend in dieser Darstellung ist der „Feedback-Loop“[33], welcher schon in der Darstellung der Prozessebene der Personalisierung zu finden ist und dazu dient, das Benutzerprofil permanent zu verfeinern bzw. aktuell zu halten.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 6: Customer Profile Life Cycle. Quelle: Schubert / Leimstoll (2002)

Wieder finden sich vier unterschiedliche Prozessschritte, welche im Endergebnis letztlich zu möglichst aussagekräftigen Kundenprofilen führen sollen.

Schubert stellt in „Personalized Commercial Web Sites“ auch dar, wie konkrete Datenquellen für die Profilierung aussehen und wie diese Benutzerprofile in der Folge mit anderen Daten/Informationen für die Personalisierung kombiniert werden können:[34]

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 7: A technical view on personalization. Quelle: Schubert (2006)

Der untere Bereich der Grafik stellt mögliche Inputquellen dar, wobei unter dem Kürzel „ETL“, „extract, transform, load“ zu verstehen ist.

Die Benutzerprofile werden in einem „Data Warehouse“[35] mit Daten zu den Produkten bzw. Inhalten einer Website über unterschiedliche Personalisierungsalgorithmen verknüpft. Letztlich

erhält der User damit personalisierte Inhalte zur Verfügung gestellt.

2.3.1.2. Explizite, implizite oder bereits vorhanden Daten

Bevor man jedoch die Benutzerprofile mit anderen Daten verknüpfen kann, wird man sich erst um entsprechende Inputdaten für die Profile sorgen müssen. Im Wesentlichen lassen sich hier

- explizite (oder auch reaktive)
- implizite (oder auch non-reaktive)
- „Legacy Data“ (= bereits vorhandene Daten. Sowohl unternehmensinternes als auch unternehmensexternes Material.)

Daten unterscheiden[36], wobei hier anhand der Datengewinnung und nicht der Inhalte unterschieden wird.

Explizite Daten

Explizite Daten werden, wie es der Name schon vermuten lässt, explizit vom User angegeben. In der Regel werden diesen also Fragen gestellt bzw. Antwortmöglichkeiten gegeben.[37] Als praxisnahe Beispiele, wie man als Website-Betreiber zu solchen Daten kommen kann, bietet sich die Präsentation „Behavioral Targeting & eCRM“ von Gromadecki/Riehle von der Pinuts media+science GmbH an, in welcher nachfolgende Möglichkeiten der Datengenerierung angeführt werden[38]:

- Gewinnspiel,
- Kontaktformular,
- Rückruf,
- Umfragen,
- Profilaktualisierung im Login-Bereich,
- Suche,
- Merkzettel,
- Bewertungen.

Alle diese Methoden haben gemein, dass sie einen Zeitaufwand für den User bedeuten und seinen Willen zur Kooperation erfordern.[39]

Als konkrete Praxisbeispiele lassen sich hier weiters Angebote über personalisierte Startseiten von Google[40], MyYahoo![41] oder auch gratis Email-Provider wie GMX[42] und viele mehr identifizieren. Sämtliche dieser Anbieter verlangen im Gegenzug zu den kostenlosen Diensten, zumindest im Rahmen der Registrierung, aussagekräftige Angaben über den jeweiligen User, um personalisierte Werbung schalten zu können. Letztlich sollen damit z.B. soziodemografische Daten (Geschlecht, Alter, Familienstand,…) gewonnen und daraus Metadaten über Präferenzen, Interessensgebiete und Wünsche abgeleitet werden.[43] Derartige Informationen sind zwar oft sehr allgemeiner Natur, jedoch bilden sie einen wichtigen Grundstock für weitere Analysen der Benutzer.[44]

Letztlich empfiehlt sich die explizite Profildatengewinnung vor allem aufgrund ihrer sehr einfachen technischen Umsetzbarkeit über vorgefertigte Anmeldeformulare oder Checkboxes und dem hierfür relativ geringen Aufwand für den Service-Provider.[45]

Implizite Daten

Eine implizite Profildatengewinnung basiert auf der Erfassung des User-Verhaltens auf einer Website. Diese Form der Datengewinnung erfolgt in der Regel transparent und mit dem Wissen der User, kann jedoch auch unbemerkt im Hintergrund durchgeführt werden.[46] Ein Stichwort, welches im Zusammenhang mit der Analyse des Surfverhaltens oft auftaucht, ist die sogenannte „Clickstream-Analyse“, welche sich mit der Sammlung und Analyse des Verhaltens der User auf einer Website beschäftigt.[47]

Der zentrale Vorteil der impliziten Profildatengewinnung ergibt sich durch den Aspekt des Agierens im Hintergrund. Die dauerhafte und unbemerkte Datenerfassung führt zu einem hohen Wahrheitsgehalt und einem hohen Grad an Aktualität der gewonnenen Informationen. Der Kunde verhält sich „natürlich“ und nimmt keine Rücksicht auf die Aufzeichnung seines Surfverhaltens.[48] Ein weiterer zentraler Vorteil dieser Methode liegt darin, dass für die Datengewinnung, abgesehen vom normalen „Surfen“ im Internet, keine zusätzlichen User-Interventionen notwendig sind.[49]

Über durchdachte Regelsysteme können implizite Daten zudem ausgeklügelt interpretiert werden. So wird das normale Such- und Surfverhalten z.B. geringer gewichtet als Notizen auf einem eventuell vorhandenen Merkzettel und tatsächlich getätigte Einkäufe wiederum werden nochmals weit stärker als die Merkzettel gewichtet.[50]

Um ein tiefer gehendes Verständnis über die implizite Profildatengewinnung zu erlangen, empfiehlt sich die Arbeit „User Profiles for Personalized Information Access“ von Gauch/Speretta/ Chandramouli/Micarelli.[51]

Legacy Data – Bereits vorhandene Daten

Letztlich stehen neben den expliziten und den impliziten Profildaten noch die sogenannten „legacy data“ zur Verfügung, also ältere, bereits gesammelte personenbezogene Daten. Diese können sich z.B. aus bereits getätigten Einkäufen in einem Online-Shop oder aus sonstigen Quellen (z.B. Kundenkarten am Point of Sale) zusammen setzen. Derartige Kundendaten stellen für die Personalisierung meist eine reiche Informationsquelle dar.[52]

2.3.1.3. Benutzer-Identifikation

Ein weiterer fundamentaler Bestandteil in der Benutzerprofilierung ist die User-Identifikation. Unabhängig davon, ob man explizite oder implizite Daten über den User erheben möchte, muss man zu aller erst in der Lage sein, die einzelnen User einer Website voneinander abzugrenzen um individuelle Kundenprofile erstellen zu können. Wichtig ist hier vorrangig die Identifikation einzelner User und nicht unbedingt gleich die Authentifizierung.[53]

Zur Identifizierung der Benutzer stehen folgende technologische Lösungen zur Verfügung:[54]

- Login über Benutzername und Passwort (HTTP-Protokoll),
- Benutzername und Passwort,
- Cookies,
- Spezielle URLs mit codierter Benutzererkennung (Session-IDs),
- IP-Erkennung,
- Zusatzprogramme.[55]

Dörner bietet einen kurzen, nach Ausprägung gewisser Beurteilungskriterien geordneten Überblick über die relevantesten Identifizierungsmethoden an (Tabelle 1).

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Methoden der Identifizierung nach Dörner. Quelle: Dörner (2003)

2.3.1.4. Speicherung der Profildaten – Client- oder Serverseitig

Bei der Planung der User-Profilierung wird man sich abgesehen von der Fragestellung, ob man explizite, implizite oder bereits vorhandene Daten einsetzen möchte, konsequenterweise auch die Frage nach dem Speicherort der Profile stellen müssen. Grundsätzlich lassen sich hier nur zwei verschiedene Speicherorte voneinander abgrenzen, dies sind die clientbasierte oder die serverbasierte Speicherung. Schubert/Leimstoll stellen unterschiedliche Profiltypen im Rahmen der User-Profilierung vor, welche unter anderem anhand des Ortes der Speicherung voneinander unterschieden werden. Die Grenzen zwischen clientbasierter und serverbasierter Speicherung verschwimmen jedoch insofern, als dass unterschiedliche Teilprofile, deren Speicherort voneinander abweichen kann, wieder zu einem Gesamtprofil zusammengefügt werden können.[56]

Die Vorteile der clientbasierten und der serverbasierten Speicherung werden von Schubert und Leimstoll wie folgt zusammengefasst[57]:

Vorteile clientbasierter Speicherung

- Gemeinsame Nutzbarkeit durch verschiedene Plattformen.
- Persönliche (personenbezogene) Daten sind nicht auf verschiedenen Computersystemen verteilt (Datenschutz).
- Benutzer kann Zugriffsrechte für verschiedene Plattformen selbst vergeben (wer darf welche Felder einsehen) und hat somit Macht über seine eigenen Daten.

Vorteile serverbasierter Speicherung

- Profil kann auf unterschiedlichen Arbeitsstationen des Benutzers verwendet werden (Roaming User).
- Plattform-Designer müssen sich nicht an die vorgegebene Schablone für Abschnitte und Felder halten, dadurch ist die Funktionalität der Applikation nicht durch gegebene Schemata beschränkt.
- Das Profil geht bei Datenverlust auf der lokalen Maschine des Benutzers nicht verloren.
- Aus Sicht des Dienste-Anbieters ergibt sich zudem noch der Vorteil, dass er auf die Daten jederzeit zugreifen, sie auswerten und gegebenenfalls auch weitergeben kann (aus Sicht des Users wiederum ein eventuelles Datenschutzproblem).

2.3.1.5. Ergebnisse der User-Profilierung - Profiltypen

Das Ergebnis einer erfolgreichen User-Profilierung sollten nach Schubert/Leimstoll unterschiedliche Profiltypen sein. Diese stellen wiederum die Grundlage für unterschiedliche Personalisierungsanwendungen dar. Die beiden Autoren listen in ihren Arbeiten einerseits die unterschiedlichen Profiltypen auf[58] und bieten andererseits auch einen Leitfaden für die Verwendung dieser unterschiedlichen Profile an.[59]

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Arten von Kundenprofilen. Quelle: Schubert / Leimstoll (2002)

Für eine detailliertere Darstellung der einzelnen Profiltypen inklusive Beispielen aus der Praxis empfiehlt sich die Arbeit „Handbuch zur Personalisierung von Webseiten“ von Schubert/Leimstoll.[60]

Aufbauend auf diesen unterschiedlichen Profiltypen bieten die Autoren in Abbildung 8 eine Checkliste für die Auswahl der Profile für unterschiedliche Personalisierungsanwendungen:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 8: Checkliste: Profile für Personalisierungsfunkionen. Quelle: Schubert/Leimstoll (2002)

Abschließend lässt sich zu Punkt 2.3.1. festhalten, dass es im Rahmen der Profilierung empfehlenswert ist, die „Goldenen Regeln zur Personalisierung“ nach Peppers/Rogers zu beachten[61]:

- Nicht alles auf einmal erfragen
Einen Dialog mit dem Kunden aufbauen und nur Informationen erfragen, welche zum jeweiligen Zeitpunkt wirklich erforderlich sind. Wenn möglich implizite Profilierung der expliziten vorziehen, um den User zu entlasten. Diese ist dem Kunden aber stets bekannt zu geben.
- Alle Daten einbeziehen („cross media“)
Auch Daten einbeziehen, die über andere Medien gewonnen werden (z.B. Daten der Kundenkarten) und dem Kunden stets das Gefühl geben, dass das Unternehmen in gut kennt, weil er wichtig für selbiges ist.
- Den Kunden das Medium wählen lassen („preferred media package“)

Nicht nur über ein Medium mit dem Kunden kommunizieren, sondern auch andere Kanäle wie Telefon, Fax, o.Ä. anbieten.

Schubert/Leimstoll ergänzen dieses Regelwerk noch mit folgenden Grundsätzen[62]:

- Der Prozess muss für den Kunden transparent sein (wie z.B. bei Amazon mit „Warum wurde mir dieser Artikel empfohlen?“).

- Der Kunde muss zu jedem Zeitpunkt wissen, was über ihn aufgezeichnet wird.
- Die Datenerfassung darf weder aufdringlich noch zu zeitaufwendig sein.
- Die Auswertung darf die Performance der Transaktionen nicht beeinflussen.
- Wo möglich, soll der Kunde die Wahl haben, ob er den Service ein- oder ausschalten möchte.

Letztlich lässt sich noch festhalten, dass vor allem mit Profilen, die über explizite (reaktive) Verfahren erstellt werden, vorsichtig umgegangen werden sollte und diese nur dort eingesetzt werden, wo der Kunde direkt davon profitiert.[63]

2.3.2. Logfiles

„Bei Logfiles handelt es sich um Datendateien, meist Textdateien, welche von und auf einem Computer erstellt werden und ausgewählte, oder sämtliche Interaktionen eines oder mehrerer Benutzer zu protokollieren. Sie weisen damit die Charakteristika eines Logbuchs im eigentlichen Wortsinn auf.“[64]

Anhand von Web-/Server-Logfiles lassen sich neben Informationen zum Benutzungs- bzw. Navigationsverhalten von Websitebesuchern weitergehend Informationen extrahieren, die allgemeine Rückschlüsse über Zugangswege (accessibility), Sichtbarkeit (visibility) und Verlinkungen (interlinking) von Webinhalten möglich machen.[65] Client-Logfiles werden im Gegensatz zu den Web-/Server-Logfiles nicht auf den Webserver, sondern auf den Rechner des Benutzers geschrieben.

Der grundsätzliche technische Ablauf einer Verbindung zwischen Client-Rechner und Webserver ist in Abbildung 9 visualisiert:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 9: Ablauf einer Anfrage vom Client-Rechner zum Webserver. Quelle: Appl/Meier (2001)

Der Aufbau einer WWW-Seite basiert in der Regel auf einem http-Protokoll. Der Benutzer gibt auf der Client-Seite eine Internet-Adresse (URL) in die Adresszeile des jeweiligen Browsers ein. Der Browser veranlasst in der Folge eine Verbindung zum gewünschten Server und übermittelt eine Anfrage (Request) zur Übertragung des vom Benutzer gewünschten Dokuments. Der Server wiederum sollte im Normalfall die gewünschte Datei identifizieren können und diese in der Folge an den Browser des Benutzers zurück senden. Letztlich wird im Browser-Fenster des Benutzers die gewünschte Datei dargestellt und der Webserver wiederum protokolliert Anfrage und Antwort (Request und Response) mit einem weiteren Logfile-Eintrag.[66] Die Verbindung zwischen Client und Server wird in der klassischen http-Version 1.0 nach jeder Transaktion getrennt, um den physischen Übertragungsweg nicht unnötig zu belasten[67], http-Version 1.1 ermöglicht jedoch bereits persistente Verbindungen.[68]

Problematisch im Bereich der Logfile-Analysen ist der Umstand, dass seitens der Webserverhersteller kein standardisiertes Protokollformat existiert und dadurch mittlerweile einige unterschiedliche Dateiformate in Verwendung sind, wobei sich die Unterschiede hauptsächlich aus Art und Umfang der enthaltenen Informationen ergeben.[69]

Einträge in die Logfiles eines Servers bieten in weiterer Folge die Grundlage für sogenannte Web-Logfileanalysen. Aus diesen Analysen können wertvolle Informationen über Nutzungsverhalten und Optimierungspotential einer Website generiert werden. Logfiles sind jedoch auf quantitative Analysemethoden ausgerichtet, weshalb kaum userspezifische Informationen als Basis für individualisierte Dienste gewonnen werden können.[70] Trotz dieser Unzulänglichkeit sind Logfile-Analyse-Produkte jedoch eine überlegenswerte Investition, so man seine Website stets bestmöglich optimieren will. Eine entsprechende Auflistung diverser Logfile-Analyzer findet sich im Anhang A – Aufzählung von Logfile-Analyzer-Anbietern. Weitere, umfangreiche Auflistungen von Web-Analyseprodukten finden sich unter anderem im Google-Unterverzeichnis „Computer/Software/Internet/Site_Management/LogAnalysis/“[71], im gleichnamigen Unterverzeichnis auf Bewgo[72], auf „Datamation.com“[73], oder aber auch auf „Galeas.de“[74].

Letztlich soll als Gegenansicht zu Bosshard‘s Feststellung, dass sich Logfiles kaum für die Personalisierung von Webseiten eigenen, auf die Methoden des „Web Usage Mining“, im Speziellen dem „Customized Usage Tracking“ im nächsten Kapitel hingewiesen werden.

2.3.3. Web (Usage) Mining

„Data Mining bezeichnet softwaregestützte Prozesse zum Auffinden von versteckten, aber potenziell nützlichen Beziehungen und Mustern in großen Datenbeständen.“[75] Ziel des Data Mining ist es im Wesentlichen aus einem (meist großen) Datenbestand interessante und verwertbare neue Erkenntnisse zu gewinnen. Dazu werden wiederum eine Reihe unterschiedlicher statistisch-mathematischer Methoden eingesetzt[76], auf welche aber schon alleine wegen des inhaltlichen Umfangs nicht näher eingegangen werden kann und soll.

Das Web Mining stellt eine Sonderform des Data Mining dar, wobei hier die Analysemethoden speziell zur Untersuchung von Webdaten eingesetzt werden.[77] Diese Ansicht wird auch von der Definition des Web Mining durch Galeas unterstützt, welcher von einer Extraktion von interessanten und potentiell nützlichen Mustern und impliziten Informationen aus Artefakten oder Aktivitäten des World Wide Web spricht.[78] Mulvenna/Sarabjot/Büchner gehen noch einen Schritt weiter und definieren Web Mining in ihrer Arbeit „Personalization on the Net using Web Mining“ folgender Maßen:

„Web mining provides the tools to analyze Web log data in a user-centric manner such as segmentation, profiling, and clickstream discovery“.[79]

Demnach sollten die Methoden des Web Mining ein durchaus beträchtliches Potential hinsichtlich der Personalisierung von Webseiten bieten. Investitionen können eingeschätzt, Fehlinvestitionen erkannt und korrigiert und neue Potentiale entdeckt werden. Damit kann in der Folge ein stärkeres Interesse und eine erhöhte Zufriedenheit der User bezogen auf die Website erreicht werden.[80]

2.3.3.1. Web Mining Kategorien

Im Rahmen des Web Mining werden über unterschiedliche Applikationen unterschiedliche Zwecke verfolgt. Der Überbegriff des „Web Mining“ wird in der Literatur in drei Kategorien unterteilt, wobei diese wieder in Subgruppen zerfallen:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 10: Kategorisierung des Web Mining. Quelle: Zaiane (2001)

Web Content Mining generiert Wissen aus den Inhalten von Dokumenten und deren Beschreibungen.[81] Im Rahmen des Content Mining werden zwei verschiedene Strategien unterschieden: Eine Variante ist es, den Inhalt von Dokumenten direkt zu analysieren und die zweite Variante ist es, die Ergebnisse anderer Tools zur Inhaltssuche (z.B. Suchmaschinen) zu verfeinern.[82]

[...]


[1] Vgl. Klossek Martin: (Personalisierte), Seite 14 ff.

[2] Siehe unter: http://news.netcraft.com/archives/about_netcraft.html, Stand 21.12.2007

[3] Quelle: http://survey.netcraft.com/index-200007.html, Stand 30.01.2008

[4] Quelle: http://news.netcraft.com/archives/web_server_survey.html, Stand 30.01.2008

[5] Quelle: http://www.iht.com/articles/2007/01/19/yourmoney/mobile.php, Stand 21.12.2007

[6] Quelle: http://www.handycheats.de/seiten/news/mails/153/1190116808.html, Stand 21.12.2007

[7] Quelle: http://www.spiegel.de/netzwelt/mobil/0,1518,446250,00.html, Stand 21.12.2007

[8] Siehe unter: http://www.gartner.com/it/regionalization/notice/de.jsp, Stand 21.12.2007

[9] Quelle: http://www.fiercewireless.com/story/feature-dial-m-for-mobile-advertising/2007-01-12, Stand 21.12.2007

[10] Vgl. Schubert Petra: (Personalized), Seite 39

[11] Chiu Willy: (Personalization), Seite 1

[12] Schubert Petra: (Personalized), Seite 41

[13] Vgl. Horn Florian: (Informationssammlung), Seite 4

[14] Terabyte = 1012 Byte = 1.000.000.000.000 Byte oder 1.000 Gigabyte

[15] Vgl. Klossek Martin: (Personalisierte), Seite 14

[16] Siehe dazu Punkt 1.1.

[17] Vgl. Tiedke Daniela: (Personalisierung), Seite 225

[18] Vgl. Georgiadis Christos K./Maitsaris Athanasios: (Personalized), Seite 3

[19] Vgl. Murthi B.P.S. /Sarkar Sumit: (Management), Seite 1344

[20] Vgl. Lewis David: (Konsumenten), Seite 34 f.

[21] Scharl Arno: (Evolutionary), Seite 61

[22] Vgl. Schubert Petra /Leimstoll Uwe: (Handbuch), Seite 5

[23] Vgl. Klossek Martin: (Personalisierte), Seite 89 ff.

[24] Vgl. Runte Matthias: (Personalisierung), Seite 9ff. ; Chiu Willy: (Personalization), Seite 3 f.

[25] Vgl. Schemion Detlev / Koenemann Jürgen / Reichert Frank: (Holzweg ), Seite 8

[26] Vgl. Horn Florian: (Informationssammlung), Seite 9f.; Högler Tamara/ Bulander Rebecca / Schiefer Gunther: (Computing), Seite 7; Fackler Gabriele / Pinegger Thomas: (Strategie), Seite 5

[27] Vgl. Schubert Petra / Leimstoll Uwe / Risch Daniel: (Personalization), Seite 4 ff.

[28] Vgl. Chiu Willy: (Personalization), Seite 3

[29] Vgl. Disch Wolfgang K.: (Bonmot), Seite 330 ff.

[30] Vgl. Chiu Willy: (Personalization), Seite 8

[31] Vgl. Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 4

[32] Vgl. Högler Tamara / Bulander Rebecca / Schiefer Gunther: (Computing), Seite 4 f.

[33] Deutsche Übersetzung: „Rückkoppelungsschleife“

[34] Vgl. Schubert Petra: (Personalized), Seite 46

[35] Siehe dazu: http://de.wikipedia.org/wiki/Data_Warehouse, Stand 25.01.2008

[36] Vgl. Chiu Willy: (Personalization), Seite 3

[37] Vgl. Schubert Petra: (Personalized), Seite 44

[38] Vgl. Gromadecki Andreas / Riehle Jan-Philip: (Behavioral), Seite 16

[39] Vgl. Gauch Susan u.a.: (Information), Seite 58

[40] Siehe: http://www.google.at/ig, Stand 28.12.2007

[41] Siehe: http://cm.de.my.yahoo.com/?rd=nux, Stand 28.12.2007

[42] Siehe: http://www.gmx.net/de, Stand 28.12.2007

[43] Vgl. Gromadecki Andreas / Riehle Jan-Philip: (Behavioral), Folie 16

[44] Vgl. Murthi B.P.S. /Sarkar Sumit: (Management), Seite 1351

[45] Vgl. Högler Tamara / Bulander Rebecca / Schiefer Gunther: (Computing), Seite 5

[46] Vgl. Chiu Willy: (Personalization), Seite 3

[47] Quelle: http://de.wikipedia.org/wiki/Web_Analytics, Stand 29.12.2007

[48] Vgl. Högler Tamara / Bulander Rebecca / Schiefer Gunther: (Computing), Seite 5

[49] Vgl. Gauch Susan u.a.: (Information), Seite 59

[50] Vgl. Gromadecki Andreas / Riehle Jan-Philip: (Behavioral), Folie 22

[51] Vgl. Gauch Susan u.a.: (Information), Seite 59

[52] Vgl. Chiu Willy: (Personalization), Seite 3

[53] Vgl. Dörner Jan-Hendrik: (Personalisierung), Seite 12

[54] Vgl. Dörner Jan-Hendrik: (Personalisierung), Seite 12 ff.; Wagner Nicola: (Webservices), Seite 8 ff.

[55] Vgl. Welker Martin / Werner Andreas / Scholz Joachim: (Sozialforschung), Seite 12

[56] Vgl. Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 25

[57] Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 25

[58] Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 23 f.

[59] Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 28 f.

[60] Vgl. Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 44 ff.

[61] Vgl. Peppers Don / Rogers Martha: (One-to-One), Seite 276

[62] Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 33 f.

[63] Vgl. Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 33

[64] Vgl. Welker Martin / Werner Andreas / Scholz Joachim: (Sozialforschung), Seite 137

[65] Mayr Philipp: (Website-Entries), Seite 5

[66] Köhntopp Marit / Köhntopp Kristian: (Datenspuren), Seite 5 ff.

[67] Wilde Erik: (World-Wide-Web), Seite 498

[68] Siehe dazu: http://de.wikipedia.org/wiki/Http, Stand 30.12.2007

[69] Vgl. Wagner Nicola: (Webservices), Seite 14

[70] Vgl. Bosshard Sven: (Logfiles), Seite 8

[71] Quelle: http://directory.google.com/Top/Computers/Software/Internet/Site_Management/Log_Analysis/, Stand 01.01.2008

[72] Quelle: http://www.bewgo.co.uk/Computers/Software/Internet/Site_Management/Log_Analysis/, Stand 01.01.2008

[73] Quelle: http://products.datamation.com/analysis/wta//, Stand 01.01.2008

[74] Quelle: http://www.galeas.de/webmining.html, Stand 01.01.2008

[75] Schubert Petra /Leimstoll Uwe: (Handbuch), Seite 14

[76] Siehe dazu: http://de.wikipedia.org/wiki/Data_mining, Stand 01.01.2008

[77] Vgl. Schubert Petra / Leimstoll Uwe: (Handbuch), Seite 14

[78] Quelle: http://www.galeas.de/webmining.html, Stand 01.01.2008

[79] Mulvenna Maurice D. / ANAND Sarabjot S. / BÜCHNER Alex G.: (Web-Mining), Seite 124

[80] Vgl. Wagner Nicola: (Webservices), Seite 20

[81] Vgl. Schubert Petra /Leimstoll Uwe: (Handbuch), Seite 14

[82] Quelle: http://www.galeas.de/webmining.html, Stand 01.01.2008

Ende der Leseprobe aus 148 Seiten

Details

Titel
Entwicklung eines Empfehlungsrasters für Personalisierungsverfahren und Anwendung auf ein mobiles Video‐Service
Hochschule
Karl-Franzens-Universität Graz
Note
1,0
Autoren
Jahr
2008
Seiten
148
Katalognummer
V113217
ISBN (eBook)
9783640125807
ISBN (Buch)
9783640185474
Dateigröße
4491 KB
Sprache
Deutsch
Schlagworte
Entwicklung, Empfehlungsrasters, Personalisierungsverfahren, Anwendung, Video‐Service
Arbeit zitieren
Walter Kalunder (Autor:in)evolaris next level Privatstiftung (Hrsg.) (Autor:in), 2008, Entwicklung eines Empfehlungsrasters für Personalisierungsverfahren und Anwendung auf ein mobiles Video‐Service, München, GRIN Verlag, https://www.grin.com/document/113217

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Entwicklung eines Empfehlungsrasters für Personalisierungsverfahren und Anwendung auf ein mobiles Video‐Service



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden