Lade Inhalt...

Fuzzy-Suche: Fuzzy-Set-Theorie und ihre Anwendung auf Internetsuchmaschinen

Seminararbeit 2003 17 Seiten

Informationswissenschaften, Informationsmanagement

Leseprobe

Inhaltsverzeichnis

1 Inhalt

2 Einführung
2.1 Bezug zum Seminar: Wissensmanagement
2.2 Eingrenzung des Themas
2.3 Motivation

3 Fuzzy
3.1 Was ist Fuzzy?
3.2 Der Begriff ”Unschärfe“
3.3 Mathematische Grundlagen
3.3.1 Die Zugehörigkeitsfunktion
3.3.2 Mengentheorie
3.3.3 Normierung
3.3.4 logische Operatoren
3.3.5 Abgrenzung zur Wahrscheinlichkeitstheorie

4 Suchen mit Fuzzy
4.1 Bisherige Schlusselw örtsuche
4.2 Kombinierte Suche mit einem unscharfen Begriff
4.3 Kombinierte Suche mit mehreren unscharfen Begriffen

5 Einbindung des Benutzers

6 Bewertung der Fuzzy-Suche
6.1 Vorteile
6.2 Nachteile
6.3 Symbiose

7 Fazit

Literaturverzeichnis

1 Inhalt

Diese Seminararbeit beschäftigt sich mit dem Thema Fuzzy-Suche.

Über die Eingrenzung des Themas auf die Suche im Internet gelingt es, ein Szenario aufzustellen. Durch dieses Szenario wird gezeigt, dass das Suchen mit herkömmlichen Suchmaschinen ohne Fuzzy zu problematischen Suchergebnissen führen kann. Auf diesem Szenario aufbauend, wird erklärt, wie die Fuzzy-Theorie helfen kann, das Problem in den Griff zu bekommen. Hierzu wird zunächst auf die mathematische Konzeption der Fuzzy-Theorie eingegangen, die dann auf die Suchproblematik des Szenarios übertragen wird. Im weiteren wird darauf einge- gangen, was an den Benutzer für Anforderungen gestellt werden und was dies für Vor- und Nachteile mit sich bringt. Zum Schluss wird eine Würdigung der Ergebnisse vorgenommen.

2 Einführung

2.1 Bezug zum Seminar: Wissensmanagement

Das Seminar beschäftigt sich mit dem Thema Wissensmanagement. Es ist er- sichtlich, dass dadurch das Auffinden von Wissen einen zentralen Punkt darstellt. Wissen ist meist in einer bestimmten Form irgendwo abgelegt. Es soll also das Ziel sein, das Wissen in seiner bestimmten Form zu finden und sich Zugang dazu zu verschaffen.

2.2 Eingrenzung des Themas

Der Fokus der Arbeit liegt hierbei auf der Suche nach Quellen insbesondere Homepages im Internet. Natürlich lassen sich die folgenden Schwierigkeiten und die vorgeschlagenen Erweiterungen der vorhandenen Suchmaschinen auch auf die Suche in Datenbanken oder anderen Datensammlungen übertragen. Die spezielle Problemstellung der Internetsuche bietet ein einsichtiges Beispiel, da ein großer Anteil der Leser - wenn nicht die Gesamtheit - bereits auf Schwierigkeiten bei der Suche mit Google & Co gestoßen ist.

2.3 Motivation

Stellen wir uns in Anlehnung an [Cho03] folgendes Szenario vor:

Wir befinden uns in den USA in San Francisco. Wir möchten an einem Tag einen berühmten Nationalpark besuchen, wir wissen aber nicht welchen. Was liegt also näher, als das Internet zu bemühen, um sich über Lage, ggf. Öffnungszeiten usw.

zu erkundigen. Wir geben also unter www.google.com folgendes in das Suchfeld ein: popular national parks in the USA (beliebte Nationalparks in den USA) und erhalten ca. 174.000 Ergebnisse. Die Suche hat uns also nicht das geliefert, was wir eigentlich wollten, denn es würde viel zu lange dauern alle vorgeschlagenen Internetseiten nach den gewünschten Informationen durchzusehen. Der Vollständigkeit halber soll hier angemerkt sein, dass es sich nicht um ein Google-spezifisches Suchergebnis handelt. Als weiteres Beispiel sei hier die Such- maschine Yahoo aufgeführt, welche 176.000 Seiten zu der gesuchten Eingabe fin- det.

Das Problem von denen im Internet angebotenen Suchdiensten wie Google, Yahoo, Altavista u.a. ist, dass sie auf Schlüsselwörtern basieren. Dass heißt, sie suchen nach auf den jeweiligen Seiten enthaltenen Schlüsselwörtern und erstellen dann nach Anzahl der Treffer eine Rangfolge der gefundenen Seiten. Die Frage, die sich also stellt ist: Wie können wir eine Suchmaschine so gestalten, dass sie uns die Ergebnisse liefert, die wir gerne haben wollen?

3 Fuzzy

3.1 Was ist Fuzzy?

Wir betrachten zunächst eine ganz allgemeine Definition aus [Bro99]:

”Fuzzy-Logik(englischfuzzy:unscharf)istimweiterenSinneineErweiterung der klassischen Logik und Mengenlehre, [...] so dass eine Darstellung und Verar- beitung unpräziser Informationen (wie z. B.: [...], ziemlich heiß, stark bremsen) möglich ist.“

Hier sehen wir schon den Bezug zu dem Problem der Suche aus dem oben geschilderten Szenario. Wir möchten einen beliebten Nationalpark besuchen. Was aber ist ein beliebter Nationalpark? Der Begriff beliebt ist nicht exakt. Er ist unscharf, also nicht genau abgegrenzt oder im Sinne der obigen Definition unpräzise. Um klären zu können, was ein beliebter Nationalpark ist, müssen wir uns zum einen mit dem Begriff Unschärfe auseinander setzen, und uns zum anderen mit den mathematischen Grundlagen der Fuzzy-Theorie beschäftigen.

3.2 Der Begriff

”Unschärfe“

Der Mensch verwendet häufig unscharfe Begriffe, insbesondere dann wenn es sich um eine unsichere Situation handelt. Für diese Unsicherheit gibt es nach [Zim93] drei Gründe:

1. Die Ausgangssituation ist zu komplex, um vom Menschen komplett erfasst zu werden.
2. Vielleicht weiß der Mensch in einer Situation gar nicht genau, was er will.
3. Es kann Dinge geben, die der Mensch aufgrund zukünftiger Ereignisse gar nicht wissen kann.

Wenn wir auch hier wieder unser Szenario betrachten, sehen wir, dass Punkt 2 derjenige ist, welcher den Grund für die Unschärfe im Begriff beliebt (bzw. popular) widerspiegelt.

Die unscharfen Begriffe halten den Menschen jedoch nicht ab, Entscheidungen zu treffen. Ziehen wir zur Verdeutlichung ein Beispiel aus [Zim93] heran. Stellen wir uns vor, jemandem beim Einparken zu helfen. Unsere Kommandos wären so etwas

wie: ”nochetwasweiterzurück“oder ”schärfereinschlagen“.DerFahrerwirddie Anweisungen zu interpretieren wissen und danach Entscheidungen treffen, wie er sein Auto rangiert.

Ein herkömmlicher Rechner kann mit solchen Kommandos nichts anfangen. Er braucht exakte Informationen; um bei dem Beispiel zu bleiben so etwas wie mm zurück“ bzw. ”13,5 ”dasLenkrad 12 Grad 14 Minutennachrechts“.

Aufgrund der oben genannten Gründe für Unsicherheit ist unsere Begriffswelt voller unscharfer Konzepte. Diese sollen durch die Fuzzy-Mengen formal erfasst und der Verarbeitung durch Rechner zugänglich gemacht werden [Dud[93]].

3.3 Mathematische Grundlagen

Die mathematischen Grundlagen gehen auf den Wissenschaftler L. Zadeh zurück.

L. Zadeh entwickelte die Fuzzy-Set-Theory (Theorie der unscharfen Mengen) im Jahre 1965. Die Theorie stellt eine Verallgemeinerung der klassischen Mengenlehre als auch der dualen Logik dar [Zim99].

Die zentrale Rolle der Theorie liegt in der Idee und der Konzeption der Zugehörigkeitsfunktion.

3.3.1 Die Zugehörigkeitsfunktion

Die Zugehörigkeitsfunktion ordnet Werten der Menge X einen Grad der Zugehörigkeit zum Konzept F zu, indem X mit der Funktion µ in das reelle Intervall [0; 1][Abbildung in dieser Leseprobe nicht enthalten] abgebildet wird [Dud93].

Abbildung in dieser Leseprobe nicht enthalten

Hierbei stellt X eine Menge dar, die wir als Indikator für den unscharfen Begriff ansehen. Jedem Element dieser Menge wird über die Funktion µ ein Wert zwischen 0 und 1 zugeordnet. Hierbei soll der Wert 1 für die volle Zugehörigkeit zum Konzept F stehen und 0 für überhaupt keine Zugehörigkeit.

Übertragenwir diese Theorie auf unser Szenario, dann können wir als Indikator für den unscharfen Begriff beliebt eine Größe wählen wie Besucher in Millionen pro Jahr. Das Konzept F ist die Beliebtheit. Nehmen wir an, ab einer Besucher- zahl von 5 Millionen gehört ein Nationalpark zu den beliebten (Zugehörigkeit: [Abbildung in dieser Leseprobe nicht enthalten], bis zu einer Besucherzahl von 1 Millionen zählt er zu den nicht beliebten (Zugehörigkeit: [Abbildung in dieser Leseprobe nicht enthalten]. Bei Besucherzahlen zwischen 1 und 5 Millionen bekommen dann einen entsprechenden Zugehörigkeits- wert zugewiesen. Zum Beispiel hat ein Nationalpark mit 4 Millionen Besuchern im Jahr eine Zugehörigkeit von 0,8 zu den beliebten Nationalparks. Schauen wir uns hierzu einmal die Zeichnung der Funktion in Abbildung 1 an.

Abbildung 1: Zugehörigkeitsfunktion nach der Fuzzy-Logik

Zum Vergleich wird die klassische duale Logik hier herangezogen:

Hierbei würden wir eine Grenze festlegen bspw. 3 Millionen Besucher im Jahr. Nationalparks mit mehr Besuchern würden als beliebt gelten und solche mit weni- ger Besuchern als nicht beliebt. Es fällt sofort auf, wie eingeschränkt die Sichtweise der boole’schen Logik hier ist. Denn ein Nationalpark mit 2.999.999 Besuchern gilt als nicht beliebt und ein Park mit 2 Besuchern mehr im Jahr ist dann ein beliebter Nationalpark. Dies können wir durch die Abbildung 2 illustrieren.

Der Unterschied, der hierbei deutlich wird, ist, dass wir mittels der FuzzyTheorie auch Werte zwischen 0 und 1 (Abbildung in das reelle Intervall), folglich also mehr Zustände als nur Wahr oder Falsch, zulassen. Hier gibt es also auch Ausprägungen wie wenig beliebt oder sehr stark beliebt.

3.3.2 Mengentheorie

Wir können die Fuzzy-Theorie aber neben der Erweiterung der allgemeinen Logik auch als eine Erweiterung der Mengenlehre auffassen. Ein x ∈ X kann in der klassischen Mengenlehre Element einer Menge F sein oder nicht (F ). Die Fuzzy- Theorie lässt auch andere Zugehörigkeitswerte zu einer Menge zu als nur 0 oder 1 - im folgenden symbolisiert durch̃

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Zugehörigkeitsfunktion nach der boole’schen Logik

Die Konzeption dieser Diagramme ist entnommen aus [Tra94]. Die Diagramme sind in den Abbildungen 3 und 4 zu finden.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Venn-Diagramm bei Fuzzy-Mengen

Dies können wir natürlich auch durch die Zugehörigkeitsfunktionen beschrieben, denn es gilt:

Abbildung in dieser Leseprobe nicht enthalten

[...]

Details

Seiten
17
Jahr
2003
ISBN (eBook)
9783638284264
ISBN (Buch)
9783638760263
Dateigröße
853 KB
Sprache
Deutsch
Katalognummer
v25937
Institution / Hochschule
Universität Bielefeld – Lehrstuhl für angewandte Informatik an der Fakultät für Wirtschaftswissenschaften
Note
1,0
Schlagworte
Fuzzy-Suche Fuzzy-Set-Theorie Anwendung Internetsuchmaschinen Seminar Wissensmanagement

Autor

Teilen

Zurück

Titel: Fuzzy-Suche: Fuzzy-Set-Theorie und ihre Anwendung auf Internetsuchmaschinen