Lade Inhalt...

Analyse automatisch generierter Ähnlichkeitsstrukturen einschließlich einer Untersuchung der Navigation verschiedener Benutzer in dem erzeugten Gefüge

Seminararbeit 2005 21 Seiten

BWL - Informationswissenschaften, Informationsmanagement

Leseprobe

Inhaltsverzeichnis

ABBILDUNGSVERZEICHNIS

1. EINLEITUNG

2. ANALYSE DER GENERIERTEN ÄHNLICHKEITSSTRUKTUREN
2.1 Vorteile der neuen Softwaretechnologie
2.2 Schwächen der neuen Softwaretechnologie

3. ANALYSE DER BENUTZERINTERAKTION
3.1 Aufbau der Untersuchung
3.2 Testperson 1
3.3 Testperson 2
3.4 Testperson 3

4. HANDLUNGSEMPFEHLUNGEN

5. FAZIT UND AUSBLICK

Abbildungsverzeichnis

Abb. 1: Artikel über Robert Strange McNamara

Abb. 2: Artikel über den Kalten Krieg

Abb. 3: Artikel über Eskimos

Abb. 4: Einstiegespunkte zum Artikel Vietnamkrieg

Abb. 5: Gruppierung der verwandten Artikel

Abb. 6: Ergebnisliste der Volltextsuche nach „Eskimo“

Abb. 7: Ergebnisliste der Stichwortsuche nach „Vietnam“

Abb. 8: Zweiter Artikel zur Stichwortsuche nach „Vietnam“

Abb. 9: Ergebnisliste der Stichwortsuche nach „Kapitol“

1. Einleitung

Diese Ausarbeitung setzt sich mit automatisch generierten Ähnlichkeitsstrukturen auseinander. Ziel ist es, zum einen neue Erkenntnisse über automatisch generierte Ähnlichkeitsstrukturen zu gewinnen und zum anderen die Navigation verschiedener Benutzer in diesen Strukturen zu analysieren. Als Untersuchungsbasis dient die große Bertelsmann Lexikothek. Diese als Lexikodisc bezeichnete Software bedient sich neuester Softwaretechniken, durch welche Links zu thematisch ähnlichen Artikeln automatisch generiert werden.

Im zweiten Kapitel wird der Leser zunächst in die neue Softwaretechnologie eingeführt. Ein Vergleich mit der bisher üblichen manuellen Verweisgenerierung durch ein Redaktionsteam soll den Blick für das Potential der neuen Anwendung schärfen.

Der dritte Teil dieser Arbeit beschäftigt sich mit der Navigation verschiedener Benutzer in den automatisch erzeugten Ähnlichkeitsstrukturen. Dabei wird die Vorkenntnis der Benutzer in die Betrachtung mit einbezogen, um aufzuzeigen, wie sich der jeweilige Wissensstand auf die Interaktion einer Testperson mit der Software auswirkt.

Da im Verlauf dieser Arbeit mehrere offensichtliche Mängel zu Tage getreten sind, leitet der Autor im vorletzten Kapitel aus seinen gewonnenen Erkenntnissen einige Handlungsempfehlungen ab, die bei der Weiterentwicklung der Technologie helfen sollten. Die Ausarbeitung endet mit einem kurzen Fazit, in dem die wesentlichen Untersuchungsergebnisse zusammengefasst werden. Im abschließenden Ausblick wird versucht das Potential der neuen Technologie zu bewerten.

2. Analyse der generierten Ähnlichkeitsstrukturen

Eine sehr nützliche Funktion elektronischer Lexika stellen die Verweise auf inhaltlich ähnliche Themen dar. So können auch umfangreiche Informationsbedürfnisse befriedigt werden, da das Wissen zu einem bestimmten Themengebiet über Artikel mit inhaltlich ähnlichen Fragestellungen erweitert werden kann.

Bisher wurden diese Verweise stets durch ein eigenes Redaktionsteam erstellt, was mit einem hohen Aufwand und vor allem sehr hohen Personalkosten verbunden war. Neuste Softwaretechnologie ermöglicht es nun, inhaltlich ähnliche Themen vollautomatisch zu erkennen und direkt die notwendigen Verweise zu erstellen. Es muss jedoch angemerkt werden, dass diese Technologie noch nicht vollständig ausgereift ist. Um dem Leser eine erste Meinungsbildung über die Technik zu ermöglichen, sollen im Folgenden Stärken und Schwächen genauer analysiert und anhand von Screenshots veranschaulicht werden.

2.1 Vorteile der neuen Softwaretechnologie

Der bedeutendste Vorteil dieser neuen Technologie liegt eindeutig in dem enormen Einsparpotential. Weil elektronische Lexika immer umfangreicher werden, ist eine händische Erstellung und Pflege von Ähnlichkeitsstrukturen für alle enthaltenen Artikel nur mit einem sehr hohen personellen Aufwand durchführbar. Zwar kann man sich der hohen Qualität der manuell erstellten Arbeitsergebnisse sicher sein, die anfallenden Kosten stehen dazu jedoch in keinem angemessenen Verhältnis. Würde man jeden neuen Inhalt mit allen schon vorhandenen Artikeln auf inhaltliche Ähnlichkeiten hin untersuchen, so würden die anfallenden Personalkosten bei wachsendem Lexikaumfang stark exponentiell anwachsen.

Ein weiterer Punkt, der erwähnenswert scheint, ist die Tatsache, dass eine solche Technologie neben elektronischen Lexika noch andere Einsatzgebiete finden kann: Die wenigsten modernen Suchmaschinen sind heutzutage in der Lage, inhaltlich sehr ähnliche Inhalte zu erkennen. So führt eine Suche nach Notebook nur zu Webinhalten, die direkt diesen Begriff verwenden. Die Bezeichnung Laptop beschreibt zwar das gleiche technische Gerät, die Technologie der Suchmaschine unterscheidet jedoch strikt zwischen beiden Begriffen. Insbesondere unter betriebswirtschaftlicher Sicht sollte diese Tatsache fokussiert werden. Eigene Untersuchungen bezogen auf die Suchmaschine Google1 zeigen, dass eine weltweite Suche nach den Begriffen Notebook oder Laptop 56,4 Millionen Treffer ergibt. Beinhaltet das Angebot eines Internetshops jedoch nur Notebooks bzw. nur Laptops, so halbiert sich die Treffermenge nahezu auf 33,6 bzw. 33,7 Millionen Treffer.

Mit anderen Worten: weist die Artikelbeschreibungen des Anbieters nicht wortwörtlich sowohl Notebooks, als auch Laptops auf, so halbiert sich der Stamm potentieller Kunden nahezu, sofern sie nur nach einem der beiden Begriffe suchen.

Mit der entwickelten Technologie böte sich hier ein Ansatz, begrifflich unterschiedliche Wörter als inhaltlich gleich zusammen zu fassen. So ließe sich die Qualität der Suchergebnisse insbesondere bei nicht sehr umfangreichen Trefferlisten stark verbessern.

2.2 Schwächen der neuen Softwaretechnologie

Detailliertere Untersuchungen (vgl. 3. Kapitel, Seite 8ff) offenbarten, dass die automatisch generierten Ähnlichkeitsstrukturen durchaus noch einige Mängel aufweisen. So ist einerseits generell zu beanstanden, dass zu vielen Inhalten die Liste der verwandten Artikel sehr lang ist, wodurch die Übersicht verloren geht. Desgleichen ist die Qualität der Zusammenstellung in vielen Punkten mangelhaft. So fragt man sich, in wie fern Christenverfolgung und Landvogtei mit dem Artikel über Gro ß macht inhaltlich zusammenhängen. In diesem Zusammenhang aufgeführt sei auch der Lexikodisc-Eintrag über Ponyreiten, wo in der Liste der verwandten Artikel der Punkt Sekund ä relektronen aufgeführt wird. Hier erschließt sich der inhaltliche Zusammenhang ebenso wenig wie bei dem Eintrag zu Laptop, dem als inhaltlich verwandt die Shakespeareb ü hne zugeordnet wird.

Dies sind nur einige wenige Beispiele, bei denen sich der inhaltliche Zusammenhang fraglich ist. Wie es scheint, sind die automatisch generierten Ähnlichkeitsstrukturen den manuell erstellten Listen noch lange nicht ebenbürtig. Es empfiehlt sich eine weitergehende Analyse der hier nur im Ansatz aufgezeigten Schwächen.

Neben fragwürdigen inhaltlichen Bezügen zeigen sich auch Mängel in der Struktur der erstellten Listen. Die Betrachtung der Inhalte, auf die verwiesen wird, zeigt oft eine deutliche Inselbildung. Als Beispiel sei hier auf den Artikel über Robert S. McNamara2 verwiesen:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Artikel über Robert Strange McNamara, [Quelle: Lexicodisc]

Wie aus dem oben stehenden Screenshot ersichtlich, wird ausschließlich auf andere Persönlichkeiten verwiesen. Ein Bezug zu historischen Ereignissen, mit denen die genante Person in Verbindung gebracht wird, fehlt vollständig.

Solche Inseln treten auch in anderen Zusammenhängen auf. Betrachtet man den Artikel Kalter Krieg, so offenbaren sich auch hier mehrere Inseln:

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: Artikel über den Kalten Krieg, [Quelle: Lexicodisc]

Leider werden die einzelnen Inseln (militärische Ausdrücke, Persönlichkeiten, politische Begriffe und geografische Bezeichnungen) nicht durch das Programm direkt gruppiert, sondern sind sehr vermischt, was die Übersichtlichkeit einschränkt. Wären die verwandten Artikel gleich nach bestimmten Kriterien wie Personen, Geografie, Politik etc. geordnet, so wäre die Liste visuell einfacher zu erfassen und die Funktion der verwandten Artikel würde aufgewertet werden.

3. Analyse der Benutzerinteraktion

Untersucht wird die Navigation von insgesamt drei verschiedenen Testpersonen mit sehr unterschiedlichem Vorwissen. Diese sollen ausgehend von einem vorgegebenen Thema versuchen über die Verweise im Menüpunkt Verwandte Artikel zu einem bestimmten anderen Artikel zu gelangen.

3.1 Aufbau der Untersuchung

Bei der Navigation über die verwandten Artikel wird nach 15 Navigationspunkten abgebrochen, falls der Zielartikel bis dahin nicht erreicht wurde. Jede Testperson hat pro Untersuchungspunkt (s.u.) drei Versuche, um den gesuchten Eintrag zu erreichen. Wenn weitere Schritte nicht mehr Erfolg versprechend scheinen, können die Testpersonen jederzeit einen Versuch abbrechen. Rückschritte sind stets erlaubt.

Betrachtet wird die Navigation ausgehend von den folgenden zwei Artikeln:

1. VietnamkriegWashington
2. EskimoAustralien

Voruntersuchungen haben ergeben, dass der Aufbau der Ähnlichkeitsstrukturen nicht symmetrisch ist. So erreicht man zwar ausgehend vom Eintrag Eskimos über die verwandten Artikel Indianer und Kolonialismus schließlich Australien (vgl. Tabelle 3, Seite 12), es ist dagegen nicht möglich, dem gleichen Pfad zurück zum Ausgangspunkt zu folgen. Ausgehend von dem Artikel über Australien taucht in der dazu generierten Liste verwandter Artikel der Begriff Kolonialismus gar nicht erst auf, über den man zuvor zum Eintrag Australien gelangte.

Um das Vorwissen der Benutzer in die Betrachtung mit einbeziehen zu können, werden diese bei jedem Navigationspunkt nach der Motivation befragt, wieso sie sich aus der Liste der verwandten Artikel für einen bestimmten Punkt entscheiden.

Rein theoretisch kann die Untersuchung bis zu 2703 Navigationspunkte umfassen, so dass für diese Ausarbeitung nur die beiden oben genannten Navigationspfade in die Analyse einbezogen wurden. In weiteren Recherchen hat der Autor jedoch weitere mögliche Navigationspfade herausgearbeitet. Um denkbaren Anschlussarbeiten einen ersten Ansatz für tiefer greifende Betrachtungen zu geben, seien diese hier kurz aufgeführt:

1. Fu ß ballBundeswehr
2. PonyreitenAdenauer
3. FernsehenTulpe

Einführend für die detailliertere Analyse sollen zunächst die drei Testpersonen gegenübergestellt werden:

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Übersicht der Testpersonen, [Quelle: eigene Darstellung]

3.2 Testperson 1

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2: Navigationspfade von Testperson 1, [Quelle: eigene Darstellung]

[...]


1 www.google.de

2 * 09.06.1916 in San Francisco, 1961-1968 US-Verteidigungsminister

3 Drei Testpersonen werden bezüglicher zweier Untersuchungspunkte analysiert, wobei sie drei Versuche pro Navigationspfad haben und ein Abbruch nach 15 Navigationspunkten erfolgt: 3 x 2 x 3 x 15 = 270

Details

Seiten
21
Jahr
2005
ISBN (eBook)
9783638469210
Dateigröße
5.7 MB
Sprache
Deutsch
Katalognummer
v50781
Institution / Hochschule
Universität Hildesheim (Stiftung) – Institut für mathematik und angewandte Informatik
Note
1,0
Schlagworte
Analyse Untersuchung Navigation Benutzer Gefüge Wissensmanagement-Seminar

Autor

Teilen

Zurück

Titel: Analyse automatisch generierter Ähnlichkeitsstrukturen einschließlich einer Untersuchung der Navigation verschiedener Benutzer in dem erzeugten Gefüge