Lade Inhalt...

Orthographische Einflüsse auf die phonologische Enkodierung in der mündlichen Sprachproduktion

Magisterarbeit 2008 100 Seiten

Sprachwissenschaft / Sprachforschung (fachübergreifend)

Leseprobe

Inhaltsverzeichnis

1 EINLEITUNG

2 THEORETISCHER RAHMEN
2.1 Sprachproduktion – von der Intention zur Artikulation
2.2 Modelle der Sprachproduktion
2.3 Basisannahmen der Sprachproduktionsmodelle
2.4 Ein serielles Modell
2.5 Ein vorwärts-kaskadierendes Modell
2.6 Ein interaktives Modell
2.7 Abschließender Vergleich der vorgestellten Modelle
2.8 Mündliche Sprachproduktion im Kontext der multimodalen Einzelwortverarbeitung
2.9 Wege der Verarbeitung eines Stimulus im Logogen-Modell

3 DAS ARBEITSGEDÄCHTNIS UND DIE SPRACHPRODUKTION
3.1 Das Arbeitsgedächtnismodell nach Baddeley
3.1.1 Die phonologische Schleife
3.1.2 Die zentrale Exekutive
3.1.3 Automatische und kontrollierte Prozesse
3.1.4 Kritik und neuere Gesichtspunkte
3.2 Zur strategischen Wahl sprachlicher Verarbeitungsrouten unter Arbeitsgedächtnisbelastung

4 EMPIRISCHER RAHMEN
4.1 Arbeitsdefinition von Priming
4.2 Implizites Priming
4.3 Die Methode der Gedächtnisbelastung
4.4 Bisherige Studien
4.5 Motivation für das vorgestellte Experiment

5 EXPERIMENTELLE UNTERSUCHUNG
5.1 Experiment 1: Implizites Priming (auditiv)
5.1.1 Versuchsteilnehmer
5.1.2 Versuchsmaterial
5.1.3 Versuchsdesign
5.1.4 Nebenaufgabe
5.1.5 Apparatur
5.1.6 Versuchsablauf
5.2 Experiment 2: Bildbenennaufgabe
5.2.1 Versuchspersonen
5.2.2 Material, Design, Apparatur
5.2.3 Versuchsdurchführung
5.2.4 Versuchsauswertung
5.2.5 Ergebnisse Experiment 1: Implizites Priming
5.2.6 Diskussion Experiment 1
5.2.7 Ergebnisse Experiment 2: Bildbenennen
5.2.8 Diskussion Experiment 2
5.2.9 Ergebnisse Zahlenmemorieraufgabe

6 ABSCHLIEßENDE DISKUSSION

7 LITERATUR

8 ANHANG
8.1 Abbildungsverzeichnis
8.2 Tabellenverzeichnis
8.3 Instruktionen
8.4 Wortmaterial
8.5 Wortmaterial prompt – target
8.6 Bildmaterial
8.7 Fragebogen
8.7.1 Freiwillige Angaben der Versuchspersonen
8.7.2 Befragung zu dem Experiment

1 EINLEITUNG

Sie ist ziemlich alt und hat verschiedene Formen; sie kann zärtlich sein und auch ärgerlich, sanft und brutal, sie kann die Liebe erklären, aber auch den Krieg. Wir alle kennen sie – und doch irgendwie nicht so richtig. Wir begegnen Ihr täglich – und doch: Müssen wir sie beschreiben, täten wir uns schwer. Sie kommt zu uns und wird ein Teil von uns – und doch wissen wir nicht wie-

DIE SPRACHE.

(Prof. Dr. Angela D. Friederici)

Die Fähigkeit des Menschen, seine Gedanken in Worte zu fassen und zu artikulieren, definiert den Forschungsbereich der Sprachproduktion. Die zentrale Fragestellung der Sprachproduktionsforschung ist, wie das im Gehirn gespeicherte Wissen, auch kognitive Repräsentationen genannt, und Denkprozesse zusammenwirken, um den so mühelos erscheinenden Prozess des Sprechens zu ermöglichen. Es gibt kaum eine andere Tätigkeit, die wir so oft praktizieren wie das Sprechen. Bei einer Unterhaltung liegt die durchschnittliche Sprechgeschwindigkeit bei zwei bis vier Wörtern pro Sekunde. Die Wörter werden dazu fortlaufend aus dem mentalen Lexikon abgerufen, das mehrere zehntausend Einträge enthält. Bei diesem Vorgang machen wir erstaunlich wenig Fehler. Die Prozesse zeichnen sich durch eine extreme Geschwindigkeit und Präzision aus.

Um zu untersuchen, wie ein Sprecher von der Intention zur Artikulation gelangt, ziehen Wissenschaftler unterschiedliche Methoden heran. Pechmann unterscheidet in Bezug auf die Entwicklung der Sprachproduktionsforschung drei Wurzeln, die sich mehr oder weniger unabhängig voneinander entwickelt haben. (vgl. Pechmann, 1994). Die erste historische Wurzel zur Erforschung der Sprachproduktion ist das Beobachten von Sprachstörungen, den Aphasien. Zu Beginn des 19. Jahrhunderts stellten sich Ärzte und Neurologen die Frage, wo die Sprache im Gehirn lokalisiert ist und welche Anteile des Gehirns für die Produktion von Sprache zuständig sind. Die zweite und bedeutsamste Wurzel der Sprachproduktionsforschung ist die Beobachtung von Versprechern. Schon gegen Ende des 19. Jahrhunderts wurde der erste große Korpus von Versprechern von Meringer und Mayer (1895) publiziert. Meringer interessierte sich in erster Linie für die Arten von Versprechern, die etwas über die Prozesse und Mechanismen zur Sprachproduktion aussagen und legte damit den Grundstein für die psycholinguistische Erforschung des Sprachproduktionsprozesses. Die dritte historische Wurzel der Sprachproduktionsforschung, die im Gegensatz zu den ersten beiden erheblich später erfolgte, ist die Analyse der zeitlichen Struktur gesprochener Sprache. Erste Untersuchungen hierzu wurden erst mit der Entwicklung geeigneter technischer Geräte zur Aufnahme und Reproduktion gesprochener Sprache möglich.

Die Sprachproduktion ist somit ein eigener Forschungsbereich der Psycholinguistik, der sich von dem der Sprachrezeption, dem Verstehen gesprochener Sprache, unterscheidet. Ungeachtet dieser Unterscheidung greifen jedoch alle Prozesse bei der Sprachverarbeitung, sei es die Produktion oder die Rezeption, auf die Ressourcen unseres Gedächtnisses zurück. Letztendlich sind damit alle Prozesse Teil eines allgemeinen Denk- und Sprachverarbeitungssystems.

Die vorliegende Arbeit beschäftigt sich mit dem Bereich der oben beschriebenen Sprachproduktionsforschung, besonders mit dem Teilprozess der phonologischen Enkodierung. Die Sprachproduktion soll nicht isoliert betrachtet werden, sondern im Kontext der gesamten Sprachverarbeitung und der Ressourcen, die zur adäquaten Produktion eines Wortes herangezogen bzw. gebraucht werden.

Ausgangspunkt der hier vorliegenden Untersuchung ist eine Forschungsarbeit von Damian und Bowers (2003). Anhand der durchgeführten Experimente hatten die Autoren festgestellt, dass im Englischen bei der mündlichen Sprachproduktion nicht nur die Phonologie, sondern auch die Orthographie eine Rolle spielt, selbst wenn diese zur Bewältigung der sprachproduktiven Aufgabe nicht herangezogen wird. Anhand dieser Untersuchungsergebnisse schließen die Autoren darauf, dass bei der Verarbeitung von Sprache nicht nur primäre, sondern auch sekundäre Informationen aktiviert werden, welche möglicherweise ebenfalls die Sprachproduktion beeinflussen. In dieser Arbeit soll untersucht werden, ob auch bei deutschen Sprechern die Orthographie automatisch bei der mündlichen Sprachproduktion aktiviert wird. Weiterhin soll erforscht werden, inwiefern sich eine zusätzliche Belastung des Arbeitsgedächtnisses auf die Sprachproduktion auswirkt. Es stellt sich die Frage, ob bei hoher Arbeitsgedächtnisbelastung eventuell strategisch andere Routen zur Verarbeitung herangezogen werden als bei geringer Belastung.

Als methodischer Zugang zur Untersuchung des Einflusses der Orthographie auf die Sprachproduktion wird in dieser Arbeit das Paradigma des impliziten Priming verwendet. Kombiniert wird dieses Paradigma mit einer Zahlenmerkaufgabe, um zusätzlich die Auswirkungen additiver kognitiver Belastung auf das sprachliche Verhalten zu untersuchen.

Im zweiten Kapitel werden zunächst die allgemeinen sprachstrukturellen Annahmen zum Prozess der Sprachproduktion beschrieben. Im Anschluss werden drei aktuelle psycholinguistische Modelle der Sprachproduktion vorgestellt. Nach dieser Einführung werden die einzelnen Sprachproduktionsmodelle gegenüber gestellt und insbesondere in Bezug auf die zeitliche Koordination der Teilprozesse näher beleuchtet. Im Anschluss erfolgt die Beschreibung des Logogen-Modells, welches die Einbettung der Sprachproduktion in den Kontext der gesamten Sprachverarbeitung erlaubt. An dieser Stelle wird gezeigt, dass unterschiedlichen Routen zur Verarbeitung eines Stimulus zur Verfügung stehen und diese je nach Art des Input und Output variieren können.

Im dritten Kapitel wird zunächst allgemein das Arbeitsgedächtnismodell von Baddeley eingeführt und der Unterschied zwischen automatisierten und kontrollierten Prozessen wird herausgearbeitet. Im Anschluss daran werden die bisherigen Untersuchungsergebnisse zur strategischen Routenwahl bei der Sprachverarbeitung vorgestellt.

Im vierten Kapitel wird der empirische Rahmen dieser Arbeit vorgestellt. Zunächst werden die wichtigsten Ergebnisse der bisherigen empirischen Forschung zu den hier vorgestellten Experimenten zusammengefasst. Anschließend werden die empirischen Fragestellungen und Vorhersagen, die sich aus den Hypothesen und den theoretischen Modellen ableiten lassen, formuliert. Im Mittelpunkt stehen zwei Fragen: Erstens, beeinflusst die Orthographie die mündliche Sprachproduktion und zweitens, in welchem Ausmaß beeinflusst eine zusätzliche hohe kognitive Belastung des Arbeitsgedächtnisses die mündliche Sprachproduktion, bzw. inwiefern führt die Belastung des Arbeitsgedächtnisses zu einer strategischen Wahl der unterschiedlichen Routen.

Nach der Darstellung der experimentellen Untersuchung in Kapitel fünf und der statistischen Auswertung nebst ihrer Ergebnisse werden im sechsten Kapitel die Ergebnisse in den theoretischen und empirischen Rahmen eingeordnet und im Hinblick auf die Hypothesen ausführlich diskutiert.

2 THEORETISCHER RAHMEN

2.1 Sprachproduktion – von der Intention zur Artikulation

Die psycholinguistische Forschung hat in den letzten Jahren sehr deutlich aufgezeigt, dass die Verwendung von Sprache eine herausragende kognitive und kommunikative Leistung des Menschen ist. Bei der Produktion von Sprache müssen wir Erstaunliches leisten. Verschiedene Wissenssysteme werden aktiviert, greifen ineinander und müssen sich an zeitliche Bedingungen halten. Normalerweise produzieren wir bei einer Unterhaltung zwei bis vier Wörter pro Sekunde. Die Wörter werden aus dem mentalen Lexikon[1] abgerufen, das mehrere zehntausend Einträge enthält. Neben der extremen Geschwindigkeit zeichnen sich diese Prozesse durch eine große Präzision aus, denn beim Wortabruf werden erstaunlich wenige Fehler gemacht. Levelt schätzt die Fehlerrate auf 1:1000 (Levelt et al., 1999: 4).

Es stellt sich die Frage, wie das Sprachproduktionssystem aufgebaut ist und wie die Prozesse bei der Produktion einer Äußerung ablaufen? Auf diese Fragen wird im nächsten Abschnitt näher eingegangen.

Es gibt verschiedene Vorstellungen darüber, wie der Sprachproduktionsprozess im Detail zu modellieren ist. Abgesehen von den Details gehen alle Theorien davon aus, dass die Produktion einer sprachlichen Äußerung in drei Stufen verläuft. Diese werden in der Terminologie nach Levelt (1989) als Konzeptualisierung, Formulierung und Artikulation bezeichnet. Auf der Stufe der Konzeptualisierung entsteht die präverbale konzeptuelle Botschaft. Der Sprecher entscheidet, unter Berücksichtigung verschiedener Aspekte wie z.B. den Hörererwartungen, dem sozialen Rahmen oder auch den Regeln der Interaktion, über den Inhalt der Äußerung. Levelt teilt den Prozess der Konzeptualisierung in zwei Teilprozesse: die Makroplanung und die Mikroplanung. Bei der Makroplanung arbeitet der Sprecher seine kommunikative Absicht heraus, d.h. er muss diejenigen Informationen selektieren, die zur Erreichung seines kommunikativen Ziels relevant sind. Der Output der Makroplanung dient als Input für die Mikroplanung. Auf der Stufe der Mikroplanung wird diesen konzeptuellen Informationen eine propositionale Gestalt[2] zugewiesen. Der Output der Makro und Mikroplanung ist schließlich die präverbale Botschaft, auch preverbal message genannt, die als Eingabe für den Formulator dient (vgl. Levelt, 1989: 107ff.). Bei längeren Äußerungen können Teile der präverbalen Botschaft in einem so genannten Buffer im Arbeitsgedächtnis zwischengespeichert werden.

Die zweite Stufe, die Formulierung, beinhaltet die Transformation der bis dahin konzeptuellen, also nicht-sprachlichen Information, in eine lexikalisch- grammatische Repräsentation. Bei dem Prozess der Formulierung werden zwei Phasen unterschieden: die grammatische Enkodierung und die phonologische Enkodierung. In die Phase der grammatischen Enkodierung fällt die Aktivierung und Selektion[3] geeigneter lexikalischer Einträge im mentalen Lexikon sowie der Aufbau einer syntaktischen Oberflächenstruktur. Diese Oberflächenstruktur wird an den phonologischen Enkodierer weitergegeben und dort in eine phonologische Repräsentation umgesetzt. Die Zwischenergebnisse der grammatischen Enkodierungsprozesse können im syntaktischen Buffer gelagert werden, die Zwischenergebnisse der phonologischen Enkodierung werden im artikulatorischen Buffer zwischengespeichert. Die Aufgabe der phonetischen Enkodierung besteht darin, den phonetischen Plan der zu artikulierenden Äußerung aufzubauen. Da der phonetische Plan vom Artikulator jedoch nicht mit der gleichen Geschwindigkeit ausgeführt werden kann, mit der er als Input der Enkodierungskomponente geliefert wird, muss er zunächst im artikulatorischen Buffer zwischengespeichert werden (Oberauer & Hockl, 2003). Aus diesem werden die Ergebnisse dann sukzessiv abgerufen und artikuliert. So können eventuelle Verzögerungen, die bei der phonologischen Enkodierung entstehen, ausgeglichen werden (vgl. Levelt, 1989: 12). Die beiden Buffer haben somit neben der Speicherfunktion zusätzlich die Aufgabe, die Asynchronien auszugleichen, die sich aus den unterschiedlichen Geschwindigkeiten der Produktionskomponenten ergeben (Oberauer & Hockl, 2003: 364).

Auf der letzten Stufe, der Artikulation, werden schließlich die entsprechenden motorischen Programme aktiviert, um die Äußerung akustisch zu realisieren (Pechmann, 1994).

Um der oben genannten Geschwindigkeit und Flüssigkeit des Sprachproduktionsprozesses gerecht zu werden, müssen Theorien der Sprachproduktion davon ausgehen, dass zumindest einige der Prozesse bei der Sprachproduktion automatisch ablaufen und unserer Aufmerksamkeit nur zu gewissen Teilen zugänglich sind (Levelt, 1989). Weiterhin ist nicht nur eine Automatisierung einiger Prozesse anzunehmen, sondern in gewisser Weise auch eine parallele Verarbeitung. Das bedeutet, dass bei der Generierung einer Äußerung die drei Stufen Konzeptualisierung, Formulierung und Artikulation nicht strikt seriell für die gesamte Äußerung durchlaufen werden. Würde ein Sprecher bei längeren Äußerungen erst eine komplette Bedeutungsstruktur aufbauen, diese dann vollständig formulieren und anschließend artikulieren, so wäre die durchschnittliche Sprechgeschwindigkeit, die wir beobachten können, gar nicht möglich. Es käme zu Pausen und Verzögerungen, vor allem zu Beginn einer Äußerung sowie zwischen Teiläußerungen (Jescheniak, 2002: 19). Vielmehr ist davon auszugehen, dass unterschiedliche Planungseinheiten zum gleichen Zeitpunkt auf unterschiedlichen Ebenen verarbeitet werden. Jede Verarbeitungskomponente kann mit der Verarbeitung beginnen, sobald sie einen minimalen Input erhalten hat. In Bezug auf die Sprachproduktion bedeutet diese Annahme, dass der Formulator mit der Verarbeitung der präverbalen Bedeutungsstruktur beginnt, bevor diese vollständig erstellt ist und sein Teilergebnis an den Artikulator weitergibt. Auf diese Weise können alle drei Komponenten an unterschiedlichen Teilen der Äußerung parallel arbeiten. In der Literatur wird diese Art der Verarbeitung als inkrementelle Verarbeitung oder auch inkrementelle Produktion bezeichnet (vgl. Kempen & Hoenkamp, 1987: 202 f., vgl. auch Levelt, 1989; Pechmann, 1994). Die folgende Abbildung soll den Prozess der inkrementellen Verarbeitung verdeutlichen:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Vereinfachte Darstellung a) inkrementeller und b) nicht inkrementeller Verarbeitungsprozesse (Abbildung aus Jescheniak, 2002: 20).

Die Annahme einer inkrementellen Verarbeitung bietet weiterhin den Vorteil, dass durch diese typische Merkmale der spontanen Sprache, wie z.B. Hesitationsphänomene innerhalb oder auch zwischen einzelnen Sätzen, Satzabbrüche sowie Korrekturen erklärt werden können. Solche Merkmale der spontanen Sprache legen nahe, dass wir in der Lage sind, mit einer Äußerung zu beginnen, bevor die Planungsphase abgeschlossen ist (vgl. Kempen & Hoenkamp, 1987). Letztlich spricht aber allein schon die Intuition der meisten Sprecher gegen eine strikt sequenzielle Verarbeitung einer Äußerung: Die meisten Sprecher haben den Eindruck, dass sie mit der Artikulation einer Äußerung bereits beginnen können, ohne genau zu wissen, wie die Äußerung beendet werden soll (vgl. Jescheniak, 2002: 19).

Nach dieser kurzen allgemeinen Einführung in die grundlegenden Prozesse und Annahmen zur Sprachproduktion, wird im nächsten Abschnitt näher auf die Modelle eingegangen, die zur Erklärung der Sprachproduktion vorliegen. Die oben beschriebene zeitliche Koordination der Verarbeitungsprozesse wird auf unterschiedliche Weise in die Sprachproduktionsmodelle integriert. Weiterhin treffen die Modelle verschiedene Aussagen in Bezug auf die Richtung des Informationsflusses während der Prozessphasen. Auf der einen Seite stehen Modelle mit der Annahme eines unidirektionalen Informationsflusses ohne Feedback, auf der anderen Seite Modelle mit bidirektionaler Aktivierungsausbreitung und mit Feedback.

Es bleibt zu sagen, dass sich die Beschreibungen der Modelle in erster Linie auf einen spezifischen Teilprozess der Sprachproduktion beziehen: den Zugang zu mentalen Lexikoneinträgen[4]. Dieser Teilaspekt hat in den letzten Jahren den Schwerpunkt im Bereich der Sprachproduktionsforschung ausgemacht. Der lexical access ist daher für die Semantik und auch für die Phonologie, bzw. die phonologische Enkodierung sehr gut erforscht. Der untere Teil des Lexikons dagegen wurde bisher nur wenig erforscht. In dieser Arbeit soll untersucht werden, inwiefern der obere Teil des Lexikons auf die untere Ebene übertragbar ist und somit auch auf der unteren Ebene Feedbackprozesse stattfinden. Genauer gesagt soll untersucht werden, ob die Orthographie (Schreibweise eines Wortes) bei der mündlichen Sprachproduktion eine Rolle spielt und diese durch Feedback beeinflussen kann.

2.2 Modelle der Sprachproduktion

Modelle zur Sprachproduktion zielen darauf ab, die Prozesse abzubilden, die zwischen der Entstehung eines Gedankens und der Artikulation erfolgen.

Mittlerweile liegen zahlreiche Modellierungen zur Sprachproduktion vor. Gegenwärtig lassen sich dabei grundsätzlich drei zentrale theoretische Ansichten unterscheiden: Serielle Modelle, vorwärts-kaskadierende sowie interaktive Netzwerkmodelle[5]. Historisch betrachtet wurden dabei zuerst die seriellen Modelle und anschließend die interaktiven Netzwerkmodelle formuliert (Pechmann, 1994). Einen Grund dafür sieht Pechmann in der Entwicklung paralleler Rechnerarchitekturen (Pechmann, 1994: 34). Die fortschreitende Entwicklung der Computertechnologie hat dazu geführt, dass heute nicht mehr nur die interaktiven konnektionistischen Modellierungen zur Sprachproduktion anhand von Computersimulationen evaluiert werden, sondern zunehmend auch die seriellen Modelle (Eikmeyer, 2003). Im Folgenden sollen die grundlegenden Ansichten der drei unterschiedlichen Modellklassen beschrieben werden.

Die modularen oder auch diskret-seriellen Modelle gehen davon aus, dass die einzelnen Prozesse auf den verschiedenen Verarbeitungsstufen strikt seriell verlaufen (Prinzip der Serialität), d.h. alle Verarbeitungsschritte erfolgen zeitlich nacheinander[6]. Weiterhin arbeiten die Prozesse nach dem Prinzip der Diskretheit. Dieses Prinzip besagt, dass erst dann ein Ergebnis an die folgende Verarbeitungsstufe weitergegeben wird, wenn die Prozesse der vorangegangenen Stufe komplett abgeschlossen sind. Ebenso entscheidend für die seriellen Modellierungen ist die Modularitätsannahme[7], das heißt, dass die einzelnen Teilprozesse voneinander abgekapselt sind und unabhängig arbeiten. Des Weiteren gehen die Vertreter serieller Modelle davon aus, dass die Aktivierung im gesamten Prozess nur in eine Richtung verläuft (Prinzip der Unidirektionalität). Es gibt kein Feedback, d.h. der Rückfluss von Informationen auf eine frühere Ebene ist ausgeschlossen (vgl. Fromkin, 1971; Garret, 1975; Levelt, 1989; Levelt et al., 1999).

Im Unterschied dazu nehmen vorwärts-kaskadierende Modelle an, dass auf jeder Verarbeitungsebene zumindest Teilergebnisse an die nächste Ebene weitergegeben werden können, auch wenn diese die Verarbeitung noch nicht komplett abgeschlossen haben (Humphreys at al., 1988). Wie auch bei den seriellen Modellierungen bleibt die Richtung des Informationsflusses hier allerdings unidirektional, ohne Feedback (strictly feedforward). Die Informationen einer späteren Verarbeitungsstufe fließen nicht zurück an die Vorherige (Humphreys et al., 1988).

Vertreter der interaktiven Modelle nehmen an, dass zwischen den Verarbeitungsstufen bidirektionale Verbindungen bestehen. Aufgrund dieser bidirektionalen Verbindungen findet bei interaktiven Modellierungen eine ständige Interaktion innerhalb der Ebenen statt. Spätere Verarbeitungsebenen können so via Rückkopplungsschleifen (feedback und feedforward) frühere Verarbeitungsebenen beeinflussen (vgl. Dell, 1986; Dell & O´Seaghdha, 1991; Dell, Schwartz, Martin, Saffran & Gagnon, 1997).

Die unterschiedlichen Annahmen der einzelnen Theorien haben in den letzten Jahren zu fruchtbaren Diskussionen unter den Vertretern der jeweiligen Modelle geführt. Wie schon oben erwähnt, werden diese Verarbeitungsmodi primär für den lexikalischen Zugriff diskutiert. In erster Linie unterscheiden sich die Modelle im Hinblick auf die zeitliche Koordination sowie auf die mögliche Interaktion zwischen den lexikalischen Verarbeitungsebenen. Im Mittelpunkt steht dabei die Frage, ob die einzelnen Prozessstufen der Sprachproduktion autonom oder interaktiv arbeiten. Auch wenn den einzelnen Modellierungen unterschiedliche Annahmen zugrunde liegen, gehen die Vertreter der verschiedenen Theorien doch von einer gewissen Grundarchitektur aus (Jescheniak, 2000: 32). Diese wird im folgenden Abschnitt beschrieben. Daran anschließend werde ich exemplarisch drei aktuelle Sprachproduktionsmodelle zu den drei verschiedenen Sichtweisen – modular, kaskadierend und interaktiv – vorstellen.

2.3 Basisannahmen der Sprachproduktionsmodelle

Wie zuvor beschrieben, gehen alle bisher entwickelten Modellierungen der Sprachproduktion davon aus, dass an der Produktion einer Äußerung drei voneinander unabhängig arbeitende Prozessstufen beteiligt sind: die Konzeptualisierung, die Formulierung und die Artikulation.

Ebenso sind sich die Vertreter aller Modelle einig, dass der Abruf der Wörter aus dem mentalen Lexikon nicht als Ganzes geschieht, sondern der Zugriff zwei Teilschritte umfasst. Unterschieden wird dabei die Enkodierung auf der Inhaltsseite, also der Abruf der semantisch-syntaktischen Repräsentation des Wortes, von der Enkodierung auf der Ausdrucksseite, der morpho- phonologischen Repräsentation. Diese beiden unterschiedlichen Repräsentationen werden in der psycholinguistischen Literatur häufig als Lemma und Lexem bezeichnet. Nach Kempen und Huijbers ist das Lemma definiert als „ abstract prephonological lexical item “ während das Lexem als „ concrete phonological shape for abstract items “ bezeichnet wird (Kempen & Huijbers, 1983: 208). Empirische Evidenz für die Trennung der Lemma und Wortformrepräsentation ergibt sich aus einer Vielzahl von Untersuchungen, die an dieser Stelle kurz genannt werden sollen. Die ersten Hypothesen für eine Zweiteilung des Lexikons wurden aus Sprechfehleranalysen abgeleitet (siehe z.B. Fromkin, 1971; Garret, 1975; Dell, 1986; für eine Übersicht siehe Marx, 2001) und nach und nach aufgrund späterer Untersuchungen erweitert. Dazu zählen einerseits Untersuchungen zu Wortfindungsstörungen bei aphasischen Patienten (z.B. Garrett, 1984; Dell et al., 1997; siehe auch Caramazza & Miozzo, 1997), andererseits aber auch Untersuchungen zu Wortfindungsstörungen bei hirngesunden Menschen, dem so genannten tip-of- the-tongue Phänomen[8] (siehe Brown & McNeill, 1966; Caramazza & Miozzo, 1997). Als letztes zu nennen sind zahlreiche Befunde, die aus experimentellen Paradigmen (wie z.B. dem Bild-Wort-Interferenzparadigma) stammen und die den zeitlichen Verlauf des lexikalischen Abrufes untersuchen (siehe Levelt at al., 1991; Schriefers, Meyer & Levelt, 1990).

Darüber hinaus muss jede Theorie der Sprachproduktion zeitliche Aspekte berücksichtigen. Wie oben erwähnt, lässt die enorme Geschwindigkeit und Flüssigkeit der Sprachproduktion darauf schließen, dass zumindest einige Prozesse der Sprachproduktion automatisch ablaufen und unserer Aufmerksamkeit nur zu gewissen Teilen zugänglich sind (Levelt, 1989). Im Hinblick auf die Automatisierung eben dieser Prozesse und der Aufmerksamkeit sind hier besonders die folgenden Fragen von Interesse. Erstens, welche Prozesse der Sprachproduktion erfordern in welchem Maße die Kapazität des Arbeitsgedächtnisses und zweitens, inwieweit beeinträchtigt bzw. verlangsamt die Belastung des Arbeitsgedächtnisses die Prozesse der Sprachproduktion? Weiterhin ist interessant, ob die unterschiedlichen Routen bei der Sprachverarbeitung strategisch verwendet werden können, ob also der Sprecher eventuell unter Belastung des Arbeitsgedächtnisses eine andere Route heranzieht als ohne. Auf diese Fragen wird im dritten Kapitel dieser Arbeit näher eingegangen.

Schließlich gehen alle Modelle in Bezug auf die zeitlichen Aspekte von einer parallelen oder auch inkrementellen Verarbeitung der einzelnen Teilprozesse aus.

Im Anschluss an die oben angeführten Basisannahmen bleibt noch zu erwähnen, dass die meisten Sprachproduktionsmodelle, auch die diskret- seriellen, in Form eines Netzwerkes modelliert sind. Solche Netzwerkimplementationen erlauben Simulationen und haben ihren Ursprung im Konnektionismus[9] . Daher ist es an dieser Stelle sinnvoll, kurz die grundlegende Architektur und Funktionsweise eines Netzwerkmodells zu beschreiben, um sich bei der späteren Vorstellung der Modelle hierauf beziehen zu können.

Ein Netzwerk 10 besteht aus aktivierbaren Knoten und aus Verbindungen zwischen diesen Knoten. Die Knoten sind - zweidimensional von oben nach unten - in Schichten oder auch Ebenen angeordnet. Diese Schichten entsprechen den angenommen drei Verarbeitungsschritten. Die oberste Ebene wird entsprechend als konzeptuelle Ebene beschrieben. Jedes Inhaltswort entspricht auf dieser Ebene genau einem Knoten, der auch als lexikalisches Konzept bezeichnet wird. Unterhalb der konzeptuellen Schicht ist die Lemma- Schicht angeordnet. Jedes lexikalische Konzept der konzeptuellen Schicht entspricht genau einem Knoten auf der Lemma-Ebene. Hier sind die syntaktischen Eigenschaften gespeichert. Unterhalb dieser Ebene befindet sich schließlich die Wortform-Ebene oder auch Lexem-Ebene. Auf dieser Ebene entsprechen die einzelnen Knoten Morphemen. Lexikalische Prozesse in einem Netzwerkmodell werden als Ausbreitung von Aktivierung beschrieben (spreading activation). Das bedeutet, dass aktivierte Knoten Aktivierung an andere, mit ihnen verbundene Knoten, weiter geben. Dadurch beeinflussen sie wiederum deren Aktivierungsgrad und somit deren Möglichkeit, Aktivierung weiterzugeben. Das Ansteigen und Absinken von Aktivierung in den Knoten ist, ebenso wie die Weitergabe im Netzwerk, durch Algorithmen festgelegt. Eine Aktivierung breitet sich im Netzwerk nicht unkontrolliert aus, sondern folgt einem Weg, der durch eine inhaltliche Systematik der Anordnung der Knoten vorgegeben ist. Das heißt, dass zu bestimmten Zeitpunkten und unter bestimmten Bedingungen eine Auswahl aus einer Menge aktivierter Knoten stattfindet und dass nur diese ausgewählten Knoten Aktivierung weitergeben können.

Nach dieser kurzen Beschreibung werden nun die jeweiligen Modelle zur Sprachproduktion im Detail vorgestellt. Bei der Darstellung der Modelle beschränke ich mich auf den Teilprozess des lexikalischen Zugriffs. Beschrieben wird lediglich der Zugriff auf einzelne Wörter, da diese Gegenstand meiner Untersuchungen sind. Auf den Aufbau komplexer Äußerungen und syntaktischer Strukturen wird hier nicht weiter eingegangen. Für ausführliche Beschreibungen dazu siehe Bosshardt, 2003; Dell, 1986; Levelt, 1989; sowie Levelt at al., 1999. Zur exemplarischen Darstellung der modularen Sichtweise habe ich das Modell von Levelt (1989) sowie Levelt, Roelofs und Meyer (1999) gewählt. Zur Beschreibung der Theorie mit kaskadierender Verarbeitung beziehe ich mich auf Peterson und Savoy (1998) sowie Jescheniak und Schriefers (1998). Zur Beschreibung der interaktiven Sichtweise beziehe ich mich auf das Modell von Dell (1986), Dell und O’Seaghdha (1991) sowie Dell et al. (1997).

2.4 Ein serielles Modell

Eines der ersten seriellen Modelle zur Sprachproduktion wurde von Victoria Fromkin (1971) in den siebziger Jahren entwickelt. Fromkins Modell entstand allein auf der Basis von Versprecheranalysen. Als Grundlage diente ihr der von Meringer und Mayer (1895) zusammengestellte Korpus von Versprecherdaten. Mit ihren Untersuchungen leistete Fromkin Pionierarbeit auf dem Gebiet der Versprecheranalyse. Nach wie vor beruht die moderne Sprachproduktionsforschung auf Studien, deren empirisches Material aus Versprechern besteht (Pechmann, 1994). Neuere Modelle der Sprachproduktion berufen sich nicht mehr ausschließlich auf qualitative und quantitative Versprecheranalysen, denn allein diese Daten reichen nicht aus, um die detaillierten Prozesse die bei der Sprachproduktion vonstatten gehen, zu erklären. In den letzten Jahren wurden daher diverse experimentelle Techniken entwickelt, die darauf abzielen, die Teilprozesse bei der Sprachproduktion in Echtzeit zu untersuchen.

In meiner Arbeit wird das serielle Sprachproduktionsmodell von Levelt und seinen Mitarbeitern (Levelt, 1989; insbesondere Levelt, Roelofs & Meyer 1999) vorgestellt. Levelts Modell wurde in den letzten[10] Jahren stetig erweitert. Bisher ist es das einzige Modell, das den gesamten Prozess von der konzeptuellen Planung bis hin zur lautsprachlichen Realisierung einer Äußerung im Detail beschreibt. Zur Begründung der theoretischen Annahmen ziehen Levelt und Mitarbeiter die Ergebnisse unterschiedlichster empirischer Studien heran. So werden neben Sprechfehlerdaten auch experimentelle Untersuchungsergebnisse berücksichtigt, weshalb das Modell im Gegensatz zu vielen anderen sehr umfassend und sowohl linguistisch als auch psycholinguistisch motiviert ist. Die Annahmen der Theorien wurden in einem implementierten Computermodell (WEAVER++, siehe v.a. Roelofs, 1997) geprüft.

Abbildung 2 gibt einen ersten Überblick über die zentralen Komponenten, die nach Levelt et al. (1999) an der lexikalischen Kodierung beteiligt sind.

Die Produktion einer Äußerung bzw. eines Wortes umfasst mehrere Verarbeitungsstufen, die in Levelts Modell seriell durchlaufen werden. Auf jeder Stufe werden von den Verarbeitungskomponenten oder auch Modulen spezifische Repräsentationen erzeugt. Diese laufen in folgender Reihenfolge ab: die lexikalischen Konzepte, Lemmata, Morpheme, phonologische Wörter und schließlich die artikulatorischen Gesten (Levelt, Roelofs & Meyer, 1999: 3). Jedes Modul arbeitet weitgehend autonom und verfügt über spezialisierte Prozeduren, die nur für dieses Modul charakteristisch sind. Wie anhand der Abbildung durch die Richtung der Pfeile deutlich wird, fließt die Information von der Lemma- zur Lexem-Ebene ausschließlich nach unten (top-down). Der Rückfluss von Informationen wird in Levelts Modell ausgeschlossen. Auf die Funktion des Monitoring (self-monitoring) und des Syllabrium (syllabary) gehe ich später ein.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Die bei der Lexikalisierung beteiligten Prozesse (Abbildung aus Levelt, Roelofs & Meyer, 1999: 3).

Nach diesem Überblick werde ich nun die Teilprozesse, die bei der Lexikalisierung stattfinden, beispielhaft anhand der Enkodierung eines Wortes herausarbeiten. Das Modell des mentalen Lexikons ist bei Levelt et al. (1999) in Form eines Netzwerkes organisiert. In der folgenden Abbildung 3 wird die Lexikalisierung des Wortes „escort“ dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Beispielhafter Ausschnitt des lexikalischen Netzwerkes (Abbildung aus Levelt, Roelofs & Meyer, 1999: 4).

Die Knoten in dem Modell sind in drei Repräsentationsebenen angeordnet:

- Die Knoten auf der konzeptuellen Ebene repräsentieren Konzepte. Diese Konzepte haben Verbindungen zu anderen Knoten auf dieser Ebene. Bei diesen Verbindungen handelt es sich um semantische Relationen. Um diese darzustellen, werden die Konzepte mit Etiketten oder auch labels (wie z.B. „ist ein“, „gehört zu“ oder „besteht aus“) versehen. Besteht eine semantische Ähnlichkeit zwischen zwei Konzepten einer Kategorie, so wird diese nicht in Form einer direkten Verbindung dargestellt, sondern lediglich durch semantische Merkmalsknoten, mit denen beide Konzepte verbunden sind.
- Auf der lexikalisch-syntaktischen Ebene, der Lemma-Ebene, werden die Wörter als Lemmata, also als syntaktische Einheiten, repräsentiert. Auf dieser Ebene werden den lexikalischen Einträgen syntaktische Informationen zugewiesen. Jede syntaktische Eigenschaft, wie z.B. das grammatische Geschlecht bei einem Nomen oder die Wortart, wird im Netzwerkmodell durch einen Knoten repräsentiert. Die Lemmata sind mit den jeweils entsprechenden Knoten verbunden.
- Auf der morphologischen Lexem-Ebene, werden schließlich die Wörter als Lexeme, also als morphologische Einheiten, abgebildet. Auf dieser Ebene sind die Knoten der einzelnen Morpheme mit den Knoten der phonologischen Segmente verbunden, aus denen sich das betreffende Morphem zusammensetzt. Weiterhin bestehen Verbindungen zwischen Morphemknoten und Knoten, die metrische und prosodische Informationen repräsentieren.

Der lexikalische Zugriff auf ein Wort wird als Ausbreitung von Aktivierung beschrieben, die sich seriell von der konzeptuellen Ebene und der Lemma- Ebene zur Lexem-Ebene vollzieht. So fließt die Aktivierung aller aktivierten Einheiten der konzeptuellen Ebene zu den korrespondierenden Knoten auf der Lemma-Ebene. Von der Lemma-Ebene wird die Aktivierung erst nach der Selektion des Lemmas an die Lexem-Ebene weitergegeben. Von zentraler Bedeutung für die serielle Modellierung ist, dass die Aktivierung nur an das entsprechende Lexem des zuvor selektierten Lemmas weitergegeben wird (Prinzip der Diskretheit).

Der Prozess des lexikalischen Zugriffs auf ein einzelnes Wort soll in Anlehnung an Abbildung 3 kurz erläutert werden. Bei der Aktivierung des Zielwortes ESCORT wird zunächst nicht nur das lexikalische Konzept des Zielwortes selbst aktiviert, sondern auch weitere, semantisch ähnliche Konzepte (semantische Kohorte), wie in diesem Fall ACCOMPANY und SAFEGUARD. Liegt keine Störung im System vor, wie es z.B. bei einer Aphasie der Fall sein kann, so erhält das lexikalische Konzept des Zielwortes ESCORT die höchste Aktivierung und sendet Aktivierung an das dazugehörige Lemma auf der nächsten Ebene. Ist das Ziel-Lemma, in diesem Beispiel das Wort „escort“ aktiviert und der Selektionsprozess auf der Lemma-Ebene abgeschlossen, so beginnt in einem nächsten Schritt die grammatische Enkodierung. Hier werden unter Verwendung der Informationen des mentalen Lexikons die semantisch- syntaktischen Eigenschaften des Lemmas spezifiziert und eine syntaktische Oberflächenstruktur aufgebaut (syntaktische Enkodierung). Für das Verb „escort“ werden so die unveränderlichen syntaktischen Eigenschaften sowie die diakritischen Parameter festgelegt[11] . Zwischenergebnisse können im syntaktischen Buffer gespeichert werden. Sind die syntaktischen Eigenschaften des Lemmas spezifiziert, folgt die phonologische Enkodierung. Auf dieser Ebene wird das Zielwort zunächst als morphologische Einheit abgebildet, wobei die metrischen und die segmentalen Eigenschaften des Morphems verfügbar werden. Anschließend wird die phonologische Repräsentation aufgebaut, die wiederum die Eingabe für die phonetische Kodierung darstellt. Die folgende Abbildung 4 stellt die phonologische Enkodierung des Wortes „escort“ dar.

[...]


[1] In der Fachliteratur ist der Begriff „mentales Lexikon“ oder auch „internes Lexikon“ sehr unterschiedlich definiert. Hier soll unter dem Begriff ganz allgemein derjenige Teil des Langzeitgedächtnisses fallen, in dem die Wörter einer Sprache mental repräsentiert sind. Es wird angenommen, dass das mentale Lexikon ca. 50.000 bis 100.000 Einträge enthält, auf die der Sprecher bei der Sprachproduktion zugreifen kann. Neben Informationen über die Bedeutung von Wörtern, also semantischen Informationen, enthält das mentale Lexikon syntaktische, morphologische und phonologische Informationen.

[2] Eine Proposition bezeichnet eine Verknüpfung von kleineren Bedeutungseinheiten. Diese sind häufig als Prädikat-Argument-Struktur oder als Funktions-Argument-Struktur dargestellt (vgl. Levelt, 1989).

[3] Aktivierung und Selektion sind für den Prozess der Sprachproduktion und besonders für serielle Modellierungen der Sprachproduktion wichtige und keinesfalls gleichbedeutende Annahmen. In der Literatur wird diese Differenzierung auch als Prinzip der Diskretheit bezeichnet. Dieses Prinzip besagt, dass die Verarbeitung auf einer Ebene abgeschlossen sein muss, bevor die Verarbeitungsprozesse auf anderen Ebenen erfolgen können. In Bezug auf die Sprachproduktion bedeutet dies, dass die Verarbeitung auf der Lemma- Ebene erst dann abgeschlossen ist, wenn das Lemma nicht nur aktiviert, sondern ebenfalls selektiert wurde. Das Prinzip der Diskretheit wird bei der näheren Beschreibung sowie der Gegenüberstellung der Modelle im nächsten Abschnitt ausführlicher dargestellt.

[4] Der lexikalische Zugriff, auch lexikalische Kodierung, Lexikalisierung oder lexical access genannt, bezeichnet „die Auswahl von Wörtern aus dem mentalen Lexikon auf der Basis einer Repräsentation der intendierten Bedeutung und dem Aufbau der entsprechenden Wortform“ (Meyer & Schriefers, 2003: 483).

[5] Diese Modellierungsoptionen werden nicht nur für den Bereich der Sprachproduktion diskutiert, sondern auch für viele andere Bereiche der Kognitionswissenschaft.

[6] Für die Produktion längerer oder komplexer Äußerungen gilt das oben beschriebene Prinzip der inkrementellen Produktion.

[7] Der Ausdruck „Modularität“ wird innerhalb der Psycholinguistik, der Psychologie wie auch der Kognitionswissenschaft unterschiedlich verwendet. Unter dem Begriff „Modularität“ soll an dieser Stelle die Konzeption, wie sie von Fodor (1983) entwickelt wurde, verstanden werden. Unter Modulen werden Arbeitseinheiten verstanden, in denen Informationen wie in einer Kapsel, autonom und mit hoher Geschwindigkeit, verarbeitet werden. Jede Arbeitseinheit ist für eine spezielle Art der Informationsverarbeitung zuständig. Sie benötigt für die Arbeit einen genau spezifizierten Input und beginnt automatisch zu arbeiten, wenn sie durch eben diesen spezifischen Input aktiviert wurde. Informationen anderer Verarbeitungsebenen spielen keine Rolle und können nicht genutzt werden (Fodor, 1983).

[8] Bei psycholinguistischen Untersuchungen wird das tip-of-the-tongue Phänomen experimentell herbeigeführt, indem Probanden die Bedeutungsdefinition von seltenen Wörtern vorgegeben wird, die sie benennen sollen. Evidenz für die Unterscheidung einer Lemma- und Lexemebene liefern solche Untersuchungen insofern, als dass offenbar auf semantische und syntaktische Informationen zugegriffen werden kann, nicht aber auf phonologische (vgl. Dietrich, 2002: 25).

[9] Der Grundansatz des Konnektionismus ist die Nachbildung kognitiver Prozesse mit Hilfe künstlicher Neuronennetze. Die Architektur solcher neuronalen Netze orientiert sich hauptsächlich an der Struktur des zentralen Nervensystems. Eingesetzt werden konnektionistische Modelle als Erklärungsansätze z.B. in der Mustererkennung, Bildverarbeitung, Bewegungskoordination, Sprachrezeption aber ebenso auch für die Sprachproduktion (für eine ausführliche Beschreibung in Bezug auf die Sprachproduktion siehe Schade, 1999).

[10] Innerhalb der konnektionistischen Netzwerkmodelle wird zwischen lokal- konnektionistischen und distribuiert-konnektionistischen Netzwerkmodellen differenziert. In lokal-konnektionistischen Modellen repräsentiert jeder Knoten im Netzwerk genau eine Einheit (ein Wort oder ein Phonem). Weiterhin sind solche Modelle vorspezifiziert, d.h. sie spiegeln die linguistischen Verarbeitungsebenen wider. Distribuiert-konnektionistische Modelle sind dagegen nicht vorspezifiziert, d.h. die Modelle können lernen. Weiterhin werden bei distribuiert-konnektionistischen Modellen alle Einheiten von mehreren Knoten repräsentiert und jeder Knoten ist an der Repräsentation mehrer Einheiten beteiligt (vgl. Schade & Kupitz, 2003). Bei denen für meine Arbeit relevanten Modellen handelt es sich ausschließlich um lokal- konnektionistische Modelle.

[11] Als unveränderliche Merkmale werden z.B. für ein Verb die Argumente und die thematischen Rollen spezifiziert. Handelt es sich beispielsweise um ein transitives Verb, so sind zwei Nominalphasen erforderlich. Als diakritische Merkmale für Verben werden angesehen: Modus (aktiv oder passiv), Tempus, sowie Numerus und Person (in Übereinstimmung mit dem jeweiligen Satzobjekt) (Jescheniak, 2002: 29).

Details

Seiten
100
Jahr
2008
ISBN (eBook)
9783640211661
ISBN (Buch)
9783640211791
Dateigröße
1 MB
Sprache
Deutsch
Katalognummer
v117854
Institution / Hochschule
Universität Bielefeld
Note
1,0
Schlagworte
Orthopraphische Einflüsse Enkodierung Sprachproduktion

Autor

Zurück

Titel: Orthographische Einflüsse auf die phonologische Enkodierung in der mündlichen Sprachproduktion