Paradigmenbildung in einem selbstlernenden System


Magisterarbeit, 2006

64 Seiten, Note: 1


Leseprobe


Page 1


1. Einleitung

image 7434f01170334652c7597a4f87275c5c

In der sogenannten Informationsgesellschaft lebend bedarf es Mittel und Techniken, die Inhalte, Informationen und Dokumente verschiedenster Art zu organisieren, um mehr als nur zufälligen Zugriff auf das Gewünschte zu erhalten. 1 Mittlerweile hält nicht mehr nur das weltweite Internet eine unglaubliche Fülle an Dokumenten bereit, auch der heimische Rechner ist längst zur Bibliothek geworden, in der sich zehn Jahre Tageszeitung neben Teilen der Gutenbergbibliothek 2 , der Wikipedia 3 und einer Menge anderer Bücher, Aufsätze etc. befinden. Der massive Zuwachs an digitalen Dokumenten lässt für deren Organisation keine manuelle, sondern nur eine automatische Methode zu. Dabei sind zumindest für die textuellen Dokumente neben den bestehenden Werkzeugen von dem Sprachlichen Informationsverarbeiter weitere Werkzeuge entwickelbar, wie das in der vorliegenden Arbeit entwickelte Programm beispielhaft aufzeigt. Eine Möglichkeit läge darin, die Meta-Tags 4 in HTML-Dokumenten um Keywords zu erweitern, die nicht explizit Bestandteile des originären Dokuments sind. Ein mögliches Verfahren dazu ist die Generierung von Paradigmen, denn Worte sind im gleichen Paradigma wenn sie „gegeneinander austauschbar“ 5 sind, also z.B. die Wörter Orange und Apfelsine 6 oder die Wörter Obst und z.B. Orange 7 . Die auf diese Weise ausgezeichneten Dokumente, in denen etwa im eigentlichen Text stets nur von Apfelsine die Rede ist, würden auch dann noch durch eine Suchmaschine auffindbar sein, wenn der Benutzer als Suchbegriff Orange eingegeben hätte. Für die Analyse und maschinelle Erzeugung von Wissen ist demnach

1 Mit zunehmender Dokumentenzahl steigt die Unwahrscheinlichkeit des Rechercheerfolges. Ein ausführlicher Artikel zum Thema findet sich unter:

http://de.wikipedia.org/wiki/Dokumentenmanagement (letzter Zugriff: 21.02.2006)

2 http://www.gutenberg.org/ (letzter Zugriff: 21.02.2006)

3 http://de.wikipedia.org/wiki/Hauptseite (letzter Zugriff: 21.02.2006)

4 Meta-Tags sind versteckte Elemente auf einer Webseite. Sie enthalten Metadaten über das betreffende Dokument.

5 Diese Definition gilt für die Domäne Linguistik. Es gibt andere Lesarten von Paradigma.

6 Der Fachterminus einer solchen Relation lautet Synonym. Dabei hat das Beispiel nur für „die Nordhälfte Deutschlands Gültigkeit und ist in Österreich und der Deutschschweiz als Teutonismus markiert. In Bayern würde der Gebrauch des Wortes Apfelsine einen "Zugereisten" oder Urlauber kennzeichnen.“ Vgl. http://de.wikipedia.org/wiki/Synonym (letzter Zugriff: 08. 01. 2006)

7 Der Fachterminus einer solchen Relation lautet Hyperonym (vgl. Kapitel 2.12).

Page 4


soll der kursive Text einen Fokus erzeugen. Am besten lässt sich das durch eine prosodische Hervorhebung mitlesen. Die Funktion so markierten Textes kann dabei durchaus verschieden sein, sei es um das Wort als Eigennamen, als inhaltlslose Oberflächenerscheinung, ganze Wortgruppen als Zitat oder einfach als inhaltlich besonders bedeutsam zu kennzeichnen. Die genaue Funktion sollte sich aus dem Kontext ergeben.

2. Linguistische Fundierung

image 3f2e24d5e29ade0c8842d35608a2804a

In der Sprachwissenschaft existieren viele verschiedene Denkrichtungen. Jedes Modell hat seine eigenen Fachtermini, Axiome und Ansprüche. Dabei werden oftmals gleichlautende Termini verwendet, die aber inhaltlich sehr verschieden sind. 21

Die vorliegende Arbeit ist aus strukturalistischer Sichtweise geschrieben. Dabei gibt es selbst innerhalb der strukturalistischen Schule mindestens drei Hauptschulen, 22 die sich ihrem Wesen nach voneinander unterscheiden, 23 nämlich die

1. Prager Schule unter Mathesius, Trubetzkoy (1939) und Jakobson und die 2. Kopenhagener Schule unter Louis Hjelmslev (1953/1961) sowie den 3. amerikanischen Strukturalismus, der sich in den Deskriptivismus von Bloomfield (1933) und den Distributionalismus Zellig Harris' (1951/1960) aufspaltet.

Grundsätzlich aber kann der sprachwissenschaftliche Strukturalismus als Weiterentwicklung der Ideen von Ferdinand de Saussure (1916) 24 angesehen werden. Der Strukturalismus 25 bezeichnet demnach

21 Vgl. z.B. die differenten Lesarten des Begriffs Grammatik unter deskriptiver, mentalistischer oder normativer Sichtweise.

22 Vgl. Hans-Jürgen Sasse (2003)

23 Letztlich unterscheiden sich sogar die einzelne Autoren selbst über die Jahre in ihren Ansichten und Definitionen. Daher auch z.B. die Ausdrücke „der frühe Chomsky“ oder „der Chomsky der späten 60er Jahre“.

24 Die erste französische Ausgabe erschien 1916. In der Arbeit wird die deutsche Fassung von 1967 verwendet (vgl. Literaturverzeichnis).

25 Synonyme sind strukturale/strukturelle/strukturalistische Sprachwissenschaft.

Page 5


[...] eine Gruppe unterschiedlicher sprachwissenschaftlicher Richtungen, die in der ersten Hälfte des 20. Jahrhunderts entwickelt wurden. Wesentliche gemeinsame wissenschaftstheoretische Prämissen sind das Postulat, dass alle linguistischen Aussagen als die Struktur betreffende Aussagen zu formulieren sind (daher der Name) und die Auffassung von Sprache als ein relationales System von Elementen, deren interne Beziehungen zueinander ohne Rückgriff auf psychologische oder geisteswissenschaftliche (z.B. auch historische) Erklärungshilfen beschrieben werden müssen. (Sasse 2003:69)

Die vorliegende Arbeit orientiert sich dabei an jenen Strukturalisten, die sich nicht nur um deskriptive Techniken zur Analyse von Sprachdaten bemühten, sondern daneben eine rigorose Form der Sprachtheorie entwickelten. 26 Da sich diese strukturalistischen Methoden ihrer Form nach an den Naturwissenschaften orientieren, ihre Formalismen und Termini sich also der Logik und der Mathematik entlehnen, sind diese Methoden für den Einsatz in computerlinguistische Modelle prädestiniert. Die zum Einsatz kommenden heuristischen Methoden sind vor allem der Substitutionstest 27 für die Kookkurrenzanalyse und die Gewichtung der Aussagen durch quantitative Relationen, um Distributionsverhältnisse zu ermitteln. Wie diese Heuristiken funktionieren und auf welche Weise sie im PaGe umgesetzt sind, ist in Kapitel 3.3 beschrieben. In Kapitel 2 wird der Begriffsverortung und der geschichtlichen Auseinandersetzung mit dem Begriff Paradigma innerhalb der Linguistik Platz eingeräumt. Dies kann nicht geschehen ohne sich mit der bereits in der Einleitung erwähnten Semantik auseinanderzusetzen.

2.1. Semantik

image 70b27bb497e8a7f13f95de9101881db6

Die eingangs umschriebene Lesart von Semantik als Bedeutungslehre, die z.B. auch die Beziehung zwischen Sprache und Denken und Welt fasst, muss im Kontext dieser Arbeit

26 Wichtige Vertreter dieser mathematoiden Richtung sind der Behaviorist Louis Hjelmslev und Zellig S. Harris, der Lehrer von Noam Chomsky. Vgl.: Sasse (2003:71)

27 Der Substitutionstest, oder Austauschtest, ist ein Mittel der Distributionsanalyse. Der Begriff Distribution ist ein Synonym für Verteilung und meint die Beschreibung der Elemente aufgrund der anderen sie umgebenden Elemente. Ein Element innerhalb einer Elementenkette wird gegen ein anderes Element ausgetauscht. Die so entstandene Kette wird auf Wohlgeformtheit überprüft, und das Ergebnis trägt zur Definition (lat: de=ab; finis=Grenze, also Definitio=Eingrenzen) des Elements bei.

Page 6


auf den spezielleren Begriff Wortbedeutungslehre eingeengt werden und ist damit abgegrenzt von z.B. emotiver, situativer, expressiver und sozialer Bedeutung. Semantik wird hier also als Wissenschaft von den sprachlichen (vorwiegend lexematischen 28 ) Inhalten gebraucht. Der Begriff war (und ist) in der Linguistik nicht immer derart eingegrenzt verwendet worden. Überlegungen eines zu weit gefassten Semantikbegriffs können bis zum Ausschluss der Semantik aus linguistischen Theorien führen. Auf diese Tatsache wird unter anderem im folgenden Kapitel eingegangen. Auf Semantik im allgemeineren, umfassenderen Sinne wird im Unterkapitel 2.1.3 eingegangen.

2.1.1. Genealogische Skizze

image 4b544f5b540855c0cccf615c57942cbf

Als einer der frühesten Quellennachweise der Reflektion über die Bedeutung von sprachlichen Zeichen dienen uns die Gedanken griechischer Philosophen. Zum Begriff Bedeutung schreibt John Lyons einleitend:

Die scholastischen 29 Philospohen waren wie die Stoiker 30 an der Sprache als Werkzeug zur Analyse der Struktur der Wirklichkeit interessiert. Deshalb war es gerade die Frage der Bedeutung oder der „Signifikation“, der sie das Größte Gewicht beimaßen. (Lyons 1971: 15)

Die Denkrichtung der sich auf Aristoteles berufenden Scholastiker ist die des Objektivismus. Dieser geht davon aus, dass der Verstand als Spiegel der (einen) Wirklichkeit zu betrachten ist, und dass linguistische Symbole zu Einheiten und Kategorien in der Welt korrespondieren, sich mithin Sprache, Denken usw. auf eine Logik zurückführen liesse (siehe dazu u.a. Lakoff 1987). Die Stoiker dagegen

glaubten jedoch nicht, daß Sprache eine direkte Widerspiegelung der „Natur“ sei. Die meisten unter ihnen waren „Anomalisten“ die eine Entsprechung von Wörtern und Dingen verneinten und auf den unlogischen Aspekten der Sprache bestanden. (Lyons 1975: 12)

28 Ein Lexem ist ein Eintrag im Lexikon. Eigenschaften eines Lexems sind u.a. Merkmale der syntaktischen Klassifikation (z.B. Verb oder Nomen).

29 Die Blütezeit der Scholastik lag im 13. Jahrhundert.

30 Der antike Ursprung lag in Athen um 300 vor Christus.

Page 9


(„meaning“) vor. (Geckeler 1971: 32)

Die Wiederentdeckung der Semantik innerhalb die Linguistik ist, so eine These dieser Arbeit, dem Umstand der Erfindung der maschinellen Datenverarbeitung geschuldet.

2.1.2. Definitionen

«Aliquid stat pro aliquo.« 43

Die lexikalische Semantik beschäftigt sich mit der Bedeutung von Wörtern wie auch der inneren Strukturierung des Wortschatzes insgesamt. Die Strukturierung besteht in der Darstellung der Relationen der Wörter zu anderen Wörtern und zeigt damit Verwandtschaft zur Kategorienlehre des Aristoteles sowie zu deren Weiterentwicklung, der Prototypentheorie Eleanor Roschs und auch der Kategorialsemantik. 44 Als Bezeichnung solch einer Relation hat sich der Begriff Wortfeld etabliert. Der Begriff Wortfeld wurde vor allem von Trier und Weissgerber geprägt und suggeriert eine Sammlung von Wörtern, die durch ein gemeinsames semantisches Merkmal gekennzeichnet sind. Trier geht von einer Gliederung des Wortschatzes aus, bei der sich die Glieder, also die Wörter, gegenseitig voneinander abgrenzen und so ihre Bedeutung durch ihre Stellung innerhalb dieses Systems erhalten. Bei Saussure findet sich im Kapitel „Der sprachliche Wert, § 2“ ein Grundgedanke der Feldforscher:

Innerhalb einer und derselben Sprache begrenzen sich gegenseitig alle Worte, welche verwandte Vorstellungen ausdrücken: Synonyma wie denken, meinen, glauben haben ihren besonderen Wert nur durch ihre Gegenüberstellung; wenn meinen nicht vorhanden wäre, würde sein ganzer Inhalt seinen Konkurrenten zufallen. (Saussure 1967:138)

Vor der Definition komplexerer Begriffe ist es sinnvoll, grundlegende Begriffe 45 zu erklären. Diese entstammen der Semiotik 46 :

signe (oder sprachliche Zeichen): im Sinne de Saussures bestehend aus:

signifié (oder Signifikat): entspricht dem Bezeichneten, ist also die begriffliche Inhaltsseite des signe

43 Etwas, das für etwas anderes steht.

44 Für ein Beispiel einer solchen Hierarchie siehe Abbildung 6

45 Die fünf unten dargestellten Begriffe finden ihre Entsprechung bei den Stoikern sowie bei dem Scholastiker Augustinus (vgl.: Geckeler 1971:79f).

46 Ein Synonym zu Semiologie

Page 10


signifiant (oder Signifikant): entspricht dem Bezeichnenden, ist also die Ausdrucksseite des signe

valeur (oder Wert): entspricht der strukturellen Position in Beziehung zu anderen signe

chose (oder aussersprachliche Realität): das signe steht als Einheit einer außersprachlichen Realität gegenüber

Geckeler beschreibt die Bestandteile des Wortfeldes nach Coseriu wie folgt:

Im Hinblick darauf, daß Lexeme in Wortfeldern funktionieren, definieren wir die „Bedeutung“ (wir denken besonders an die lexikalische Bedeutung) als reine Beziehungen auf der Inhaltsebene, als Verhältnisse von „signifiés“ zueinander. (Geckeler 1971: 79 f.)

Begriffe, die die Beziehungen von Elementen innerhalb des Wortfeldes bezeichnen, sind:

Synonyme: Wörter, deren signifié (annähernd) gleich ist, z.B. Orange und Apfelsine

Antonyme: Wörter, deren signifié gegensätzlich ist, z.B. Tag und Nacht

Hyponyme: Wörter, deren signifié in anderen inkludiert ist, z.B. Tulpe und Blume

superordinierte Hyponyme: Wörter, deren signifié andere inkludieren 47

Ende der Leseprobe aus 64 Seiten

Details

Titel
Paradigmenbildung in einem selbstlernenden System
Hochschule
Universität zu Köln
Note
1
Autor
Jahr
2006
Seiten
64
Katalognummer
V186151
ISBN (eBook)
9783869438856
ISBN (Buch)
9783656992677
Dateigröße
1342 KB
Sprache
Deutsch
Schlagworte
paradigmenbildung, system
Arbeit zitieren
Pascal Christoph (Autor:in), 2006, Paradigmenbildung in einem selbstlernenden System, München, GRIN Verlag, https://www.grin.com/document/186151

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Paradigmenbildung in einem selbstlernenden System



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden