Lade Inhalt...

Semantische Netze

Seminararbeit 2005 33 Seiten

Informatik - Angewandte Informatik

Leseprobe

Inhaltsverzeichnis

1 Einleitung
1.1 Was ist ein Semantisches Netz
1.2 Ziele
1.3 Semantische Relationen in natürlicher Sprache
1.4 Formalismen zur Beschreibung semantischer Netze
1.5 Kriterien zur semantischen Beschreibung

2 Netztypen
2.1 Klassifizierende semantische Netze
2.2 Deduktive Netze
2.3 Scripts
2.4 Prozesshafte Netze
2.5 Referentielle Netze
2.6 Netze mit semantischer Spezialisierung und syntaktischer Junktion

3 KL-ONE ein semantisches Netz in der Anwendung
3.1 KL-ONE Classic

Abbildungsverzeichnis

1.1 Kollokationsgraph für “dog“ [2]

1.2 Plausibilitat von Satzen [10]

1.3 Das Konzept einer Boing 747 [8]

2.1 Ein Semantisches Netz nach Collins und Quillian [11]

2.2 Graphische Darstellung der Transitivitat in deduktiven Netzen

2.3 Semantisches Netz nach Hyvonen [11]

2.4 Ausschnitt aus dem Script-Graphen-System nach Raskin [11]

2.5 Graphische Darstellung des Scripts „Löffel“ und damit essbare Stoffe nach Raskin [11]

2.6 Einbettung von „spoon“ in die Begriffsordnung [11]

2.7 Darstellung der Ko-Hyponyme von „spoon“ [11]

2.8 Netzdarstellung einer syntaktischen Struktur nach de Beaugrande [11]

2.9 Ein Konzeptuelles Netz [11]

2.10 Ein komplexes konzeptuelles Netz [11]

2.11 Graphische Darstellung des Wissens über Objekte [11]

2.12 Referentielles Netz mit Attributen nach Habel [11]

2.13 Darstellung eines komplexen Ausdrucks nach Figge [11]

3.1 Die Grammatik von CLASSIC [11]

3.2 Festsetzung der Kardinalitat [11]

Zusammenfassung

In dieser Arbeit werden verschiedene formale Ansätze zur Modellierung von Se­mantischen Netzen, sowie deren Bezug zu semantischen Relationen aus der Lin­guistik präsentiert.

Im ersten Kapitel wird eine Einleitung zu dem Thema gegeben bei der die Mo­tivation und die Ziele Semantischer Netze erlautert werden. In der Folge wird eine linguistische Herleitung zu Semantischen Netzen gegeben und wichtige formale Aspekte zur Beschreibung von semantischem Wissen präsentiert.

Im zweiten Kapitel werden sechs Typen Semantischer Netze abgehandelt und dazu kleine Modellierungsbeispiele gegeben. Die Formalismen dieser Netze wer­den dabei größtenteils uber die Logik erster Stufe aufgebaut.

Im dritten Kapitel wird ein Typ von praktisch angewandten Netzen präsentiert, die KL-ONE Systeme. Eine Implementierung eines KL-ONE Systems - Classic - wird im Anschluss in groben Zügen beschrieben.

Kapitel 1 Einleitung

Diese Einleitung wird die Ziele von Semantischen Netzen und deren Ursprünge in der Linguistik abhandeln. In der Folge werden Formalismen zur Modellbildung und Kriterien zur Unterscheidung von Semantischen Netzen prasentiert. Zu Be­ginn wird ein Beispiel eines Semantischen Netzes prasentiert. Dies soll dem Leser eine grobe Vorstellung darüber liefern, wie ein solches Netz aussehen kann.

1.1 Was ist ein Semantisches Netz

Das Semantische Netz aus Abbildung 1.1 basiert auf einem Kollokationsgraph und ist auf der Internetseite der Universitat Leipzig verfUgbar.

Hier wurde der Begriff Hund abgefragt, worauf das Ergebnis geliefert wird, dass ein Hund ein Tier ist, dass er bellt oder verwandte Tiere wie die Katze. Die einzelnen Begriffe stehen also alle mit Hund in Verbindung. Bei Kollokati­onsgraphen bedeutet das, dass sie mit einer bestimmten Haufigkeit im gleichen Satz vorkommen. Dieser Ansatz wurde gewahlt, da es fUr den Aufbau eines sol­chen Graph’s relativ einfach ist. Bei der Abfrage in solchen Netzen kann auch frei gewahlt werden, wie weit entfernte Begriffe angezeigt werden sollen. [2]

1.2 Ziele

Die Ideen zu Semantischen Netzen waren ursprünglich davon motiviert Model­le für die Sprachverstehens- und Sprachproduktionsforschung zu bilden. Dabei kommt es natürlich darauf an, wie Wissen repräsentiert wird. Die gebildeten Mo­delle und die verschiedenen Wissensrepräsentationen wurden bald auch dazu ver­wendet, um Textübersetzer zu bauen.

Doch zur Textübersetzung ist nicht nur ein bestimmtes Lexikon notig sondern auch ein Mindestmaß an Allgemeinwissen, dass im semantischen Netz abgelegt

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1.1: Kollokationsgraph für “dog“ [2]

sein sollte. Ist dieses Wissen sehr umfangreich und bestehen auch die notigen In­ferenzmechanismen zur Auswertung und Nutzung des Wissens ist die Idee sehr naheliegend Künstliche Intelligenzen zu schaffen, die mit so einer Informations­basis agieren können.

Ein weiteres Ziel ware die Informationsflut die heute im Internet vorherrscht mit Semantischen Netzen zu bezahmen. Die derzeitigen Suchmaschinen stellen eine einfache Weise dar Inhalte zu filtern, doch konnte die assoziative Suche schneller zum gewünschten Ergebnis führen.

Informationen sind durch Texte linear aufgebaut und konnen dadurch auch nur linear vermittelt werden. Eine nicht lineare Wissensabfrage und Wissensorganisa­tion ware daher vorteilhaft.

Die Verwaltung von Wissen wird speziell in größeren Firmen immer wich­tiger, da der Informationsaustausch zwischen den Abteilungen effizient durch- gefUhrt werden sollte. Dazu sind auch effektive organisationsweite Informations­portale notig, die Wissensverwaltungssysteme, wie semantische Netze verwen­den. Mit Synergiemanagement wird erreicht mit einer Grupp von Menschen ef­fektiv zu arbeiten. Dazu ist effizientes Kommunizieren notig, was auf Basis ge­meinsamer Ontologien erreicht wird. Unter Ontologie wird hier verstanden, Ar­beitsprozesse formal als Konzepte und deren Relationen untereinander darzustel­len. Schlussendlich bieten semantische Netze die Moglichkeit, Zusammenhange unter einem bestimmten Kontext schneller zu erkennen. [11,9]

1.3 Semantische Relationen in natürlicher Sprache

Da sich semantische Netze an der Verarbeitung natürlicher Sprache orientieren, wird in diesem Kapitel auf die Erkenntnisse und Modelle der Neurolinguistik bei der Sprachverarbeitung eingegangen.

Bereits 1861 fiihrte Paul Pierre Broca bereits Untersuchungen durch, bei de­nen er ein Areal des Gehirns - heute Broca Areal genannt- mit der Sprachverarbei­tung in Verbindung brachte. Der untersuchte Patient hatte zu Lebzeiten eine Broca Aphasie, welche sich durch einen extrem agrammatischen Satzbau und einer ver­langsamten Sprachproduktion mit großer Sprachanstrengung kennzeichnete.

Wernicke entdeckte 1874 ein Areal, das er bei Beschadigung fur ein schlechtes Sprachverstandnis und fur eine schlechte Sprachproduktion verantwortlich mach­te. Die betroffenen Patienten können zwar Sprache mit normalem Sprachrythmus produzieren, die Syntax wird jedoch nicht beachtet und die Worter haben kei­ne wahrnehmbare Bedeutung. Diese Aphasieform wird neben Wernicke-Aphasie auch Jargon-Aphasie genannt.

Diese Entdeckungen führten zu der Idee Sprache neuronal zu lokalisieren und zur Bildung von Modellen der Sprachverarbeitung.[10, 1]

Um die Modelle Nachweisen zu konnen stehen heute Methoden, wie EEG und FMRI zur Verfügung, mit denen Gehirnaktivitaten lokalisiert werden konnen.

Bei der EEG-Messung wird nur oberflachlich eine Messung mit durchgeführt.

Dabei werden die offenen elektrischen Felder gemessen, die durch die parallel angeordneten Neuronenstrange im Gehirn zu Stande kommen. Die räumliche Lo­kalisation der Potentiale der Gehirnbereiche wird über die Potentialunterschiede zwischen den verschiedenen Messpunkten berechnet.

Bei FMRI-Messungen werden mittels Computertomographie magnetische Strome im Gehirn gemessen und zu 3-dimensionalen Bildern ausgewertet.

Mit den genannten Techniken werden in der Sprachforschung wahrend dem Präsentieren von Satzen Messungen durchgeführt. Die folgenden beiden Satze unterscheiden sich durch die Art des Fehlers, namlich eines syntaktischen- beim ersten und eines semantischen Fehlers beim zweiten Satz.

„Der Honig wurde im aufbewahrt.“

„Der Honig wurde im Keller ermordet.“

Die Auswertung der EEG-Messungen ergab, dass eine Verletzung der Syntax mit einer negativen Auslenkung nach 162 Millisekunden und die semantische Ver­letzung mit einer negativen Auslenkung nach 552 Millisekunden in Verbindung gebracht werden konnte. Bei einem Wert zwischen 250 und 600 Millisekunden wird in der Neurolinguistik von einer ,,N400“-Komponente in den Messdaten ge­sprochen, welche fUr semantische Verletzungen charakteristisch ist.[10]

Beim Logogen Modell steht die Verbindung der Verarbeitung von Sprache und Schrift im Zentrum. Demgemaß werden die Wörter beispielsweise eines Sat­zes zuerst in einem auditiven Eingabelexikon nachgeschlagen, uber ein kognitives System semantisch verarbeitet und die Antwort über ein Ausgabelexikon ausge­geben. Das Ausgabelexikon kann ebenso wie das Eingabelexikon von phonologi- scher oder orthographischer Natur sein, also auf akustische oder schriftliche Art interpretiert werden.

Das im Zentrum des Logogenmodells stehende gemeinsame kognitive System ist auch Sitz der semantischen Verarbeitung. Die Ein- und Ausgabe Lexika werden im allgemeineren Sinn auch mentale Lexika genannt. Sie enthalten Wortgruppen, Worter und Morpheme - die kleinsten Einheiten der Sprache.

Die Idee hinter mentalen Modellen ist, dass zwischen den Eintragen des men­talen Lexikons Relationen bestehen. Diese Relationen bilden in der Folge ein Se­mantisches Netzwerk. Ein mentales Modell gebildet zu haben, bedeutet außer­dem, die funktional relevanten Dinge eines Sachverhalts zu repräsentieren und die Wahrheitsbedingungen von Satzen zu eruieren bzw. den Wahrheitswert unter den gegeben Umstanden der Umwelt zu kennen. [10]

Eine Gruppe von Untersuchungen beschaftigt sich mit der Plausibilitat von Satzen. Dabei geht es um die Erwartungshaltung beim Lesen eines unvollstandigen Satzes. In der Abbildung 1.2 haben die moglichen fortfuhrenden Worter drei un­terschiedliche vom Kontext und vom Betrachter abhangige Wahrscheinlichkeiten, welche mit der Starke der Auslenkung der N400 korrelieren. Diese Abstufungen der Wahrscheinlichkeit werden auch mit Kontextsensitivitat bezeichnet.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1.2: Plausibilitat von Satzen [10]

Der bei dem Experiment aus der Abbildung 1.2 präsentierte Satz lautet:

„Sie wollten das Hotel so gestalten, dass es an einen tropischen Ort erinnert. Darum pflanzten sie entlang der Straße ...“

Den Versuchspersonen wurde als Fortführung des Satzes nun entweder „Tulpen“, „Pinien“ oder „Palmen“ präsentiert, was wie oben beschrieben in einer unter­schiedlich starken Auslenkung der N400-Komponente resultierte. Dieses Expe­riment liefert einen weiteren Hinweis darauf, dass semantische Relationen exis­tieren und im psycholinguistischen Sinne mit welchen Messkomponenten sie kor­relieren. [10, 3]

Zwei weitere Formen semantischer Verbindungen sind Ana- Kataphorische Relationen. Sie verbinden Satze, wie im folgenden Beispiel zu erkennen ist.

„Kennst du Heinz? Der ist mein bester Freund.“

Dies ist ein Beispiel fiir eine Anaphorische Relationen, also mit zuriickweisendem Charakter des Wortes „der“. Die Kataphorische Relationen bilden analog mit ei­nem vorausweisenden Charakter eine weitere Möglichkeit der Wiederaufnahme des Kontextes und kann ebenso mit einer Proform, wie im Beispiel, als auch mit Substantiven, Pronomen, Adverbien, Adjektive und Verben erreicht werden. Ei­ne Verletzung solcher Relationen ruft eine N400- und P600-Komponente hervor, worauf hier aber nicht naher eingegangen werden soll. [3]

Relationen existieren nicht nur zwischen Satzen, sondern auch zwischen Wortern des mentalen Lexikons. Mit Antonymen werden gegensatzliche Worter wie,,schwarz - weiß“ bezeichnet. Wurde zuerst „schwarz“ gelesen ist das gegensatzliche Wort „weiß“ leichter abrufbar. Dies zeigte sich in Versuchen bei denen Testkandida­ten Antonyme und keine Antonyme wie „schwarz-gelb“ präsentiert wurden. Wor­te die keine Antonyme waren, ergaben eine Negativierung. Bei nicht relatierten Wortern z.B. „gelb-nett“ wird eine erhohte N400 gemessen. Antonyme sind also ein Beleg fur die Existenz von semantischen Relationen.[12, 3]

Die dazu entgegengesetzten Relationen sind Synonyme, wie zum Beispiel Oran­ge“ und „Apfelsine“. Zu den Relationen der Hierarchischen Strukturen gehoren die Hyponyme und die Hyperonyme. Ein Vogel ware beispielsweise das Hyponym von Tier und Tier ist das Hyperonym von Vogel.

Mit der Meronymie werden „Teil-Ganzes“-Beziehungen ausgedrückt, wie zum Beispiel „Arm-Korper“. Auch Verbkonzepte stehen in einem logischen Zu­ sammenhang, wie zum Beispiel „gelingen - versuchen“. Diese Relation wird als Implikationsbeziehung verstanden. Bei Kausationsrelationen werden lexikalische Resultate von Verben also wie bei „offnen - offen“ in Verbindung gebracht. Die beschriebenen Relationstypen werden in der Praxis beim semantischen Netz „Ger- maNet“ angewandt.[12]

Semantische Netze werden auch unter dem Aspekt modelliert, dass Sätze schneller erfassbar sind, wenn zwischen den einzelnen Komponenten semantische Relationen existieren, wie bei folgendem Beispiel:

„Der Tischler sagt Holz.“

Hier kann der Priming-Effekt beobachtetet werden: Der Satz wird schneller verar­beitet, wenn zusatzliche semantische Information gegeben ist. Im letzten Beispiel aktiviert zum Beispiel das Subjekt „Tischler“ ein semantisches Netz das eine star­ke Relation zu „Holz“ hat. Das Objekt „Holz“ kann schneller verarbeitet werden, da die dafiir zustandige Neuronengruppe nahe der gerade aktivierten Gruppe liegt. Dabei hangt die Existenz von Relationen zwischen Worten nicht von deren Wort­kategorie ab.

Auch indirekte Relationen wie etwa die Wortgruppe: Hose-Hemd-Kragen“, stehen mit dem Priming-Effekt in Verbindung. Die N400-Komponente hat bei indirekten Relationen eine etwas niedrigere Auslenkung als bei nicht relatierten Worten. Die Hohe der Auslenkung kann in dem Sinne als Grad der Verwandt­schaft von Wörtern gesehen werden.

[10, 3]

1.4 Formalismen zur Beschreibung semantischer Net­ze

Im Allgemeinen stellen semantische Netze eine Form der grafischen Wissensre- prasentation dar. Die Implementierung in Computersystem hat für die Verarbei­tung von größeren Datenmengen naturlich wesentliche Vorteile. Die urspriinglich Intention mit semantischen Netzen war, nathrliche Sprache zu verstehen, zu verar­beiten und zu produzieren, doch heute sind die Anwendungsgebiete breit gefachert.

Allen Arten von semantischen Netzen bestehen aus

- gerichteten Graphen, deren
- Komponenten/Knoten von verschiedenen, wohldefinierten Typen sind.

Sie bestehen also aus Knoten die mit Kanten verbunden sind, wobei der Typ jedes Knotens und jeder Kante genau definiert ist. Die Netze unterscheiden sich durch die Anzahl der Knoten und Verbindungstypen, die zur Verfiigung stehen und dadurch, ob ihnen eine formale Definition zugrunde liegt. [11, 7, 8, 6]

Die Abbildung 1.3 zeigt die Flugzeugflotte einer Fluggesellschaft. Es gibt hier Flugzeuge und Gates. Ein Flugzeug vom Typ Boing-747 hat verschiedene Eigen­schaften. Und ein bestimmtes Flugzeug vom Typ Boing-747 hat eine Seriennum­mer und steht an einem bestimmten Gate.

[...]

Details

Seiten
33
Jahr
2005
ISBN (eBook)
9783638412711
ISBN (Buch)
9783638707022
Dateigröße
1.2 MB
Sprache
Deutsch
Katalognummer
v43500
Institution / Hochschule
Universität Salzburg – Institut für Computerwissenschaften
Note
2
Schlagworte
Semantische Netze Seminar Informatik

Autor

Zurück

Titel: Semantische Netze