Lade Inhalt...

Produktivität und der Erstspracherwerb. Die Produktivität der drei Deklinationsklassen des Russischen in der frühen Phase der Sprachproduktion

Hausarbeit 2015 23 Seiten

Russistik / Slavistik

Leseprobe

Inhaltsverzeichnis

0. Einleitung

1. Produktivitätsbegriff
1.1. Produktivität bei Baayen
1.2. Produktivität und Erstspracherwerb

2. Messung der Produktivität der drei Deklinationsklassen im Erstspracherwerbskorpus

3. Fazit

4. Literaturverzeichnis

0. Einleitung

Es lohnt sich vor allem aus zweierlei Gründen die frühe Phase des Spracherwerbs bzw. der Sprachproduktion im Kontext der sprachlichen Produktivität zu betrachten. Erstens können dankt den neuen korpuslinguistischen Methoden zu empirischen Messungen der Produktivität Hypothesen aufgestellt bzw. überprüft und offene Fragen, die sich den klassischen experimentellen Verfahrensweisen der Spracherwerbsforschung entziehen, geklärt werden. Zweitens wird dadurch eine unvoreingenommene, also von dem jeweiligen Gegenstand bzw. der jeweiligen Spracherwerbstheorie unabhängige Hypothesenprüfung ermöglicht. Dies ist insofern von Bedeutung, als dass die aktuelle Debatte rund um den kindlichen Spracherwerb durch Heterogenität und Konfrontation der unterschiedlichen Sprachtheorien geprägt wird.[1]

Die Chance die Produktivität bestimmter sprachlicher Phänomene nicht nur zu messen, sondern dies sogar objektiv zu tun, hat mich im Endeffekt dazu angehalten, die Untersuchungen bzw. die Hypothesen von Natalia Gagarina und Maria Voeikova (2009) zum Kasus- und Numeruserwerb mit Hilfe von Korpusarbeit (Baayen 2008) zu überprüfen. In ihrer Arbeit „The acquisition of case and number in Russian“ verfolgen die beiden Autorinnen ein dreifaches Ziel: a) die Erfassung des Erwerbs des Kasus und Numerus von Beginn der Substantivproduktion, b) das Aufstellen der Entwicklungsphasen des Kasus- und Nummeruserwerbs sowie der Marker für die Phasenübergänge und c) die Erklärung der Mechanismen, die für den Kasus- und Numeruserwerb verantwortlich sind (Gagarina/Voeikova 2009, S. 179). Dabei beobachteten sie vier monolingual aufwachsende Kinder aus Sankt Petersburg, ein Mädchen und drei Jungs. Entscheidend für ihre Untersuchung waren die ersten neun Monate ab dem Beginn des Auftretens der ersten Kasus- und Numerusunterscheidungen.[2] Das Erfassen und Auswerten dieser neunmonatigen Phase des Kasus- und Numeruserwerbs hat eine zentrale These bezüglich der Produktivität der drei Deklinationsklassen (DK) des Russischen hervorgebracht: Die frühe Phase der Sprachproduktion ist durch hohe Produktivität von Substantiven der 1. (maskuline Substantive ohne Endung und neutrale Substantive mit den Endungen -o/-ë/-e) und der 2. (maskuline und feminine Substantive mit der Endung –a) DK gekennzeichnet (Vgl. ebd., S. 188).[3] Da sich Gagarina und Voeikova dem konstruktivistischen Ansatz des Spracherwerbs (Vgl. dazu z. B. Slobin 1985, Tomasello 2003) anschließen, also der Meinung sind, dass Sprache keine angeborene Fähigkeit ist, sondern sich erst aus der Notwendigkeit zu kommunizieren entwickelt, führen sie die hohe Produktivität der 1. und 2. DK auf den Input zurück (Vgl. ebd., S. 179). Demnach wählen Kinder ausgehend vom Input selektiv sprachliche Muster aus, mit denen sie schließlich selber agieren. Diese Muster werden aber nicht zufällig, sondern auf der Grundlage von aufeinander wirkenden Faktoren wie z. B. die Frequenz der auftretender Typen und Tokens, die strukturelle Transparenz, die Auffälligkeit des Musters usw. ausgewählt (Vgl. ebd., S. 180). So wurden die ersten fixierten Fälle von Miniparadigmen meistenteils mit den in der frühen Phase der Sprachproduktion häufig auftretenden Wortformen wie die Namen von Kindern, die Bezeichnungen für Mama und Papa sowie ihre diminutive Formen, also den Substantiven der 1. und 2. DK verknüpft. Im Gegenteil dazu überschritt das Auftreten der Substantive der 3. DK (feminine Substantive ohne Endung mit Stammauslaut auf weichen Konsonanten und auf weichen sowie harten Zischlaut (-j)) in dieser frühen Phase nicht mal 3% (Vgl. ebd., S. 194). Aus diesem Grund gehen die beiden Autorinnen davon aus, dass die 1. und 2. DK produktiv und die 3. DK dementsprechend unproduktiv ist. Diese These wird zusätzlich durch die schon von Ceitlin (2000) ermittelte Tendenz des frühen Spracherwerbs unterstützt, die durch die Übergeneralisierung der produktiven Flexionsmarker auf die unproduktiven geprägt ist. Demnach erwerben die Kinder zunächst die produktiven Flexionsmarker und übertragen bzw. übergeneralisieren diese dann auf unproduktive Formen. Durch eine solche Erschaffung von neuen Formen füllen Kinder die vorhandenen Lücken im eigenen Sprachsystem auf. Diese Übergeneralisierungstendenz wurde ebenfalls von Gagarina und Voeikova fixiert. Dazu führen sie folgende Beispiele auf: daj sol-a * (NOM, 1. DK) analog zu daj maka (moloka) anstatt daj sol-i (3. DK) oder vešč-a * (NOM, weibliche Endung –a der 2. DK) anstatt vešč‘ (3. DK) (Ebd., S. 188).[4] Diese Beispiele zeigen darüber hinaus, dass die Kinder die untypische endungslose feminine Form durchaus als solche erkennen und sie deswegen durch eine typische feminine Endung –a (NOM) der 2. DK erweitern. Überspitzt würde es sogar bedeuten, dass die 2. DK in der frühen Phase der Sprachproduktion von allen drei die produktivste sein muss. Daraus ergibt sich folgende Rangfolge der Produktivität der drei DK: Die 2. DK ist die produktivste. Die 1. DK ist die zweitproduktivste. Die letzte DK ist dementsprechend die unproduktivste. Das Ziel dieser Arbeit besteht also vor allem darin, diese Reihenfolge der Produktivität der drei DK mit Hilfe von Korpusarbeit (Baayen 2008) zu überprüfen und damit gleichzeitig die Erklärungsansätze von Gagarina und Voeikova bezüglich der frühen Phase der Sprachproduktion entweder zu bestätigen oder zu widerlegen.

Um dies zu erreichen, müssen aber zuvor drei wichtige Schritte vollzogen werden. Erstens muss auf den Begriff der Produktivität näher eingegangen werden. Dies wird, zweitens, mit der Arbeit am Korpus verknüpft und dadurch eine optimale Verbindung zwischen der Theorie und der Praxis gewährleistet. Um die Einführung in die Korpusarbeit zu erleichtern, wird dabei zunächst auf die Daten des russischen eine Million Tokens großen Trainingskorpus (Nacional’nyj korpus russkogo jazyka 2003-2016) zurückgegriffen. Dieses eignet sich hierfür insbesondere, weil es keine zusätzlichen Kodierungen wie z. B. das Abgrenzen der kindlichen Äußerungen verlangt. Anschließend kann, drittens, die Bedeutung der Produktivität in der Erstspracherwerbsforschung diskutiert werden. Erst nach dem diese drei Schritte ausgeführt wurden und so eine theoretische Basis geschaffen wurde, kann diese zur Nutzung bei der Messung der Produktivität der drei DK herangezogen werden. Hierbei wird nicht mehr auf den Trainingskorpus, sondern auf den Erstspracherwerbskorpus (Meyer/ Stoll 2009) zurückgegriffen, sodass schließlich eine authentische Hypothesenprüfung gewährleistet werden kann.

1. Produktivitätsbegriff

Nicht anders als bei den Theorien der Spracherwerbsforschung wurde für den Begriff der Produktivität bis jetzt keine allgemeingültige und ausnahmslos akzeptierte Definition gefunden. Diese Problematik stellt Amir Zeldes (2013) in seiner Arbeit „Productivity in Argument Selection: From Morphology to Syntax“ gekonnt dar, indem er einen Überblick über die Entwicklung und die Vielseitigkeit der unterschiedlichen Definitionsversuche des Produktivitätsbegriffs verschafft. Dabei geht er unteranderem auf den modernen bzw. korpuslinguistischen Produktivitätsbegriff ein, der, wie schon mehrfach angesprochen, eine empirische Messung der Produktivität bestimmter sprachlicher Phänomene ermöglicht und deswegen im Vordergrund dieser Untersuchung stehen wird. Einer der bekanntesten Vertreter des korpuslinguistischen Produktivitätsbegriffs ist Rolf Harald Baayen (2008, 2009), der aktuell als einer der international besten und innovativsten Forscher auf dem Gebiet der Wortschatzforschung und der quantitativen Linguistik gilt. Darüber hinaus war er einer der ersten Linguisten, der die Vorteile der computergestützten und empirischen Sprachforschung erkannte. Insbesondere aus diesem Grund lohnt es sich im Zusammenhang mit der korpuslinguistischen Arbeit auf den Produktivitätsbegriff nach Baayen näher einzugehen.

1.1. Produktivität bei Baayen

Baayen unterscheidet zwischen drei Arten der Produktivität: „realized productivity“ (Baayen 2009, S. 901) , „expanding productivity“ (Ebd., S. 902) und „potential productivity“ (Ebd.). Unter der „realized productivity“ ist dabei die Zahl der relevanten Typen[5] zu verstehen. Die „expanding productivity“ erfasst die Zahl der relevanten Typen, die nur einmal vorkommen. Diese werden darüber hinaus als „hapax legomena“ (Ebd.) bezeichnet. Die „potential productivity“ bezieht sich auch auf die Zahl der relevanten Typen, die nur einmal vorkommen. Diese werden aber auf die Größe des Korpus relativiert (Tokenzahl). Demnach kommt der expandierenden und der potenziellen Produktivität eine höhere Bedeutung zu, da die erste die gegenwärtige Produktivität und die zweite die Wahrscheinlichkeit der Neubildungen bzw. das Potenzial zur Bildung neuer Wörter einschätzen. Um den Produktivitätsgrad der jeweiligen Produktivität zu errechnen, entwickelt Baayen zwei mathematische Formel:

Expandierende Produktivität (Ebd.): P*= V(1, C, N) / V(1, N)

Abbildung in dieser Leseprobe nicht enthalten

Potentielle Produktivität (Ebd.): P= V(1, C, N) / N(C)

Abbildung in dieser Leseprobe nicht enthalten

Um die jeweiligen Größen der Formeln verstehen und ermitteln zu können, soll nun schrittweise sowohl die Variablen der Formeln, als auch parallel die Arbeit am russischen eine Million Tokens großen Trainingskorpus (Nacional’nyj korpus russkogo jazyka 2003-2016) erläutert werden.

Abbildung in dieser Leseprobe nicht enthalten

Es ist eher problematisch nur anhand dieser beiden Werte eine annehmbare Aussage über die Produktivität der 2. DK zu treffen. Erstens handelt es sich hierbei um sogenannte α-Werte, die sich nur auf eine bestimmte Stelle der Produktivitätskurve, auf die später ausführlich eingegangen wird, begrenzen und somit lediglich die Steigung dieser Stelle beschreiben. Zweitens können diese beiden Werte überhaupt nicht miteinander verglichen werden. Erst dann, wenn man zusätzliche α-Werte z. B. der 1. und 3. DK ermittelt würde, könnte man diese mit der 2. DK verglichen und dadurch akzeptable Aussagen bezüglich der Produktivität aller DK treffen. Dabei wäre man aber immer darauf angewiesen, die ermittelten Ergebnisse in Verhältnis zu anderen Werten zu setzten und so die produktivste DK zu ermitteln. Stefan Evert und Anke Lüdeling (2001) bieten in diesem Zusammenhang eine geschicktere Lösung an. Mit Hilfe vom Typ-Token-Verhältnis (Vc(C, N(C)): Typenzahl einer Kategorie C in N(C) Tokens) lässt sich nämlich eine „vocabulary growth curve“ (Evert/Lüdeling 2001, S. 168) abbilden, die durch ihren Verlauf die Produktivität oder die Unproduktivität einer Kategorie anzeigt. Bei der beständigen Token-Anzahl wird dabei die Anzahl der Typen gezählt (Vgl. ebd.). Wenn dadurch eine abflachende Kurve entsteht, ist das sprachliche Muster unproduktiv. Eine kontinuierlich steigende Kurve steht dagegen für ein produktives sprachliches Muster. Ein idealtypischer Verlauf der Kurven sieht nach Evert und Lüdeling also folgendermaßen aus (Ebd.):

Abbildung in dieser Leseprobe nicht enthalten

Um solche Vokabularwachstumskurve (VGC) modellieren zu können, muss man

a) zipfR installieren und mit library(zipfR) laden:

- mit Hilfe des Zipfschen Gesetzes (πz =C / z )[7] werden die Ergebnisse, also die Auftrittswahrscheinlichkeit eines Items πz und dessen Rang z (beide ergeben zus. 1 (z. Bsp. * 4)), durch die normalisierende Konstante (C) modifiziert und so die VGC angepasst

b) VGC modellieren:

> DK2a_S.spc <- vec2spc(DK2a_S$lem)

> DK2a_S.lnre.fzm <- lnre("fzm", DK2a_S.spc)

> DK2a_S.int.vgc <- lnre.vgc(DK2a_S.lnre.fzm, seq(0, N(DK2a_S.lnre.fzm)), m.max=3)

c) VGC plotten bzw. anzeigen lassen:

> plot(DK2a_S.int.vgc)

Abbildung in dieser Leseprobe nicht enthalten

Laut der obigen Abbildung der idealverlaufenden VGC kann also ohne Zweifel festgehalten werden, dass die 2. DK des Russischen produktiv ist.

Natürlich dürfen diese Ergebnisse aber nicht unkritisch betrachtet werden. Erstens sind sowohl die expandierende, als auch die potenzielle Produktivität sehr stark von der Größe des Korpus abhängig, auch wenn man es auf die Zahl der Tokens relativiert (Vgl. Baayen 2008, S. 223). Zweitens spielt ebenso die relative Häufigkeit der im Korpus vorkommenden Tokens einer Kategorie C (f(C)=N(C) / N → f(DK2a_S)= 61383 / 1228881= 0.04995032), die nur durch eine bestimmte Art von Texten beeinflusst werden kann, eine große Rolle (Vgl. Zeldes 2013, S. 59). Drittens kann das einmalige Vorkommen des relevanten Typs („hapax legomena“) unteranderem nur an schwankender Stichprobengröße des Korpus liegen (Vgl. Evert/Lüdeling 2001, S. 168). Alle diese Punkte müssen bei der Interpretation der Ergebnisse, also auch bei der Messung der Produktivität der drei DK mitberücksichtigt bzw. diskutiert werden. Vorerst wird aber ein weiterer Aspekt der Produktivität in Betracht gezogen, nämlich die Bedeutung der Produktivität im Kontext der Erstspracherwerbsforschung.

[...]


[1] Die bis jetzt einflussreichsten drei Theorien sind dabei der Behaviorismus (Vgl. z. B. Bloomfield 1933, Skinner 1957), der Kognitivismus (Vgl. z. B. Piaget 1976, Wygotski 1964) und der Nativismus (Vgl. z. B. Chomsky 1981, 2000). Eine prägnante Zusammenfassung über die Entwicklung sowie die Vor- und Nachteile dieser drei Sprachtheorien bitten unteranderen Kniffka und Siebert-Ott (2012, S. 32 ff.) an.

[2] Der Erwerb von Kasus und Numerus erfolgte in gleichen Phasen und ähnlichem Tempo, obwohl die Kinder dabei auf verschiedene Strategien zurückgriffen und die erste Kasus- und Numerusunterscheidung je nach Kind früher oder später einsetzte.

[3] Die Nummerierung der Deklinationsklassen entspricht in dieser Übersetzung der theoretischen Grundlage des Kompendiums des linguistischen Wissens (Schlegel u.a. 1992, S. 129-140) und stimmt mit der Nummerierung von Gagarina und Voeikava nicht vollkommen überein.

[4] Bei der Transliteration des Kyrillischen wird in dieser Arbeit auf die Kodeks-ISO Transliterationstabellen zurückgegriffen, die den aktuellen wissenschaftlichen Normen der Transliteration des Kyrillischen entspricht (Kempgen 1996-2016).

[5] „In der strukturalen Linguistik dienen die Begriffe [Token und Types] zur Unterscheidung zwischen konkreten sprachlichen Äußerungen (Token) und abstrakten Einheiten der Metaebene (Types), die sie repräsentieren“ (Wikipedia. Die freie Enzyklopädie). Online im Internet: https://de.wikipedia.org/wiki/Token_und_Type (Abruf am 02.05.2016).

[6] Die 2. DK wurde deswegen zur Erläuterung ausgewählt, weil sich das Suchmuster für diese im Vergleich zu den anderen zwei DK am einfachsten definieren lässt.

[7] Das Zipfsche Gesetz, das nach George Kingsley Zipf, der dieses Gesetz in den 1930er Jahren aufstellte, benannt wurde, „ist ein Modell, mit dessen Hilfe man bei bestimmten Größen, die in eine Rangfolge gebracht werden, deren Wert aus ihrem Rang abschätzen kann“ (Wikipedia. Die freie Enzyklopädie). Online im Internet: https://de.wikipedia.org/wiki/Zipfsches_Gesetz (Abruf am 02.05.2016).

Details

Seiten
23
Jahr
2015
ISBN (eBook)
9783668437845
ISBN (Buch)
9783668437852
Dateigröße
1 MB
Sprache
Deutsch
Katalognummer
v359079
Institution / Hochschule
Humboldt-Universität zu Berlin – Institut für Slawistik
Note
1,0
Schlagworte
Erstspracherwerb Messung der Produktivität Korpus Linguistik Produktivitätsbegriff Produktivität nach Baayen Deklinationsklassen Produktivitätskurven

Autor

Teilen

Zurück

Titel: Produktivität und der Erstspracherwerb. Die Produktivität der drei Deklinationsklassen des Russischen in der frühen Phase der Sprachproduktion