Lade Inhalt...

Kreuzkulturelle Studie psychologischer Arbeitsanalyseverfahren. Validierung des Fragebogens ISTA in Bezug auf die italienische Sprache

Diplomarbeit 1999 106 Seiten

Psychologie - Arbeit, Betrieb, Organisation und Wirtschaft

Leseprobe

Inhaltsverzeichnis

1. EINLEITUNG

2. THEORIE
2.1 Das Meßinstrument ISTA
2.1.1 Ziele des Verfahrens
2.1.2 Anwendungsbereiche
2.1.3 Theoretische Fundierung
2.1.4 Aufbau des Verfahrens
2.1.4.1 Merkmalsbereiche
2.1.4.2 Skalen und Indizes
2.1.4.3 Art der Fragen
2.1.5 Kennwerte
2.2. Übersetzung von Fragebögen in der kulturvergleichenden Forschung
2.2.1 Richtlinien zur Übersetzung von Instrumenten
2.2.1.1 Kontextrichtlinien
2.2.1.2 Entwicklungsrichtlinien
2.2.1.3 Richtlinien der Testadministration
2.2.1.4 Richtlinien zur Dokumentation und Interpretation der Ergebnisse
2.2.2 Übersetzungsmethoden
2.2.2.1 Übersetzung/ Rückübersetzung (back-translation)
2.2.2.2 Committee Approach
2.2.2.3 Kombination von Techniken
A. Komitee plus Bilinguale
B. Back-translation plus Bilinguale
C. Back-translation, Pretest plus Monolinguale
2.2.3 Qualität und Äquivalenz der Übersetzungen
2.2.3.1 Äquivalenzkriterien
A. Linguistische Äquivalenz
B. Bedeutungsäquivalenz ( semantische Äquivalenz )
C. Psychologische Äquivalenz
D. Psychometrische Äquivalenz
2.2.4 Äquivalenzbestimmung
2.2.4.1 Urteilsmethoden
A. Bedeutungsvergleich im Rahmen der back-translation Methode
B. Bedeutungsvergleich im Rahmen des committee approach
C. Pretest-Techniken
2.2.4.2. Statistische Methoden
A. Datenerhebungsdesigns
- Bearbeitung der Quell- und Zielversion des Fragebogens durch bilinguale Probanden
- Bearbeitung des Originals und der Rückübersetzung des Tests durch Quellsprache-
Monolinguale
- Bearbeitung der Quellversion durch Quellsprache-Monolinguale und der Zielversion
durch Zielsprache-Monolinguale
B. Techniken der Datenauswertung
2.2.5. Probleme des Übersetzungsprozesses
2.2.5.1 Die Kompetenz des Übersetzers
2.2.5.2 Emische Konzepte
2.2.5.3 Sekundäre Bedeutungen
2.3 Die bilinguale Sprachleistung in der Psycholinguistik
2.3.1 Begriffserklärung
2.3.2 Die linguistische Leistung der Bilingualen
2.3.3 Frühe vs. späte Bilinguale
2.3.4 Der Age-at-arrival Effekt 39
2.3.5 Der Kontakt mit der Zweitsprache 39
2.4 Fragestellung und Hypothesen
2.4.1 Fragestellung
2.4.2 Hypothesen bezüglich der Äquivalenz der Versionen

3. Untersuchung
3.1 Design
3.2 Qualitative Untersuchung
3.2.1 Übersetzung
3.2.2 Revision der Übersetzung
3.2.3 Rückübersetzung
3.2.4 Bedeutungsvergleich
3.2.5 Zweite Revision der Übersetzung
3.3 Quantitative Untersuchung
3.3.1 Stichprobe
3.3.2 Instrument
3.3.3 Datensammlung
3.3.4 Operationalisierung der Zusatzhypothesen
3.3.5 Statistische Auswertung der Erhebungsdaten
3.4 Ergebnisse
3.4.1 Ergebnisse des Bedeutungsvergleichs
3.4.2 Ergebnisse der statistischen Auswertung
3.4.2.1 Reihenfolgeeffekt der Testadmini***stration
3.4.2.2 Trennschärfen
3.4.2.3 Skaleninterkorrelationen
3.4.2.4 Interne Konsistenz
3.4.2.5 Mittelwerte
3.4.2.6 Korrelationen
3.4.2.7 Moderatoreffekte

4. ZUSAMMENFASSUNG UND Diskussion

5. Literatur

6. TABELLEN UND ABBILDUNGSVERZICHNIS

7. ANHANG

1. EINLEITUNG

Die Übersetzung von bereits etablierten Instrumenten für die Anwendung in einer neuen Sprache bzw. Kultur hat Tradition in der psychologischen Forschung. Diese hat erstens den Vorteil ökonomisch zu sein: sie nimmt viel weniger Zeit und Kosten in Anspruch als die Entwicklung eines neuen Instrumentes. Zweitens gibt es meistens eine Reihe von Studien mit deren Daten die neu erworbenen Daten verglichen werden können. Drittens vermittelt die Verwendung eines etablierten Instrumentes ein erhöhtes Sicherheitsgefühl. Viertens erlaubt die Übersetzung eines Tests den interkulturellen Vergleich, ein immer wichtiger werdender Forschungsbereich. Aber auch in Ländern mit großer Immigrationsrate besteht ein Bedarf nach angemessenen Instrumenten, mit deren Hilfe Personen unterschiedlichen kulturellen und sprachlichen Hintergrundes in die Studien einbezogen werden können, bzw. mit denen die Merkmale dieser Personen erhoben werden können.

Der Fragebogen ISTA (Instrument zur stressbezogenen Tätigkeitsanalyse) dient der Abschätzung von Belastungsschwerpunkten bei beruflichen Tätigkeiten. Bis jetzt gab es oft große Schwierigkeiten, diese Belastungsschwerpunkte auch bei anderen, nicht deutschsprachigen (bzw. der deutschen Sprache nicht ausreichend mächtigen) Beschäftigten mit Hilfe der deutschen Fragebogenversion zu erheben. Sehr oft waren die sprachlichen Schwierigkeiten so gravierend, daß diese Probanden aus der Untersuchung ausgeschlossen werden mußten.

Durch die Erweiterungen der Originalversion des Instrumentes in andere Sprachen erhofft man sich, diese Probleme zu eliminieren. Die vorliegende Arbeit repräsentiert eine Validierungsstudie der italienischen Version des Fragebogens ISTA, Version 6.0.

Die Vorgehensweise orientiert sich an den von der Internationalen Testkomission (ITC) formulierten Richtlinien zur Übersetzung psychologischer Instrumente und Tests.

Die Studie umfaßt die Evaluation der psychologischen und psychometrischen Äquivalenz der italienischen Übersetzung des Fragebogens ISTA im Rahmen des multimodalen Ansatzes. Angewendete Methoden sind die back-translation (Übersetzung und Rückübersetzung) , die in der kulturvergleichenden Forschung als Standardprozedur zur Übersetzung eines Instrumentes und der Evaluation der Bedeutungsäquivalenz von Ziel- und Originalversion gilt, und die bilingual testing Methode. Die back-translation Mehtode hat den Vorteil, daß sie bei erfolgreicher Anwendung einen evidenten Nachweis erbringt, daß der Inhalt eines Items getreu in die Zielsprache übertragen wurde. Sie verlangt aber Ermessensentscheidungen, wenn das rückübersetzte Item nicht wortwörtlich mit dem Original übereinstimmt. Zudem kann selbst bei vollkommen befriedigendem Resultat die psychologische Äquivalenz zwar als weitgehend plausibel, nicht aber als nachgewiesen gelten, da wichtige Konnotationen des Items in der Zielsprache selbst bei inhaltlich getreuer Rückübersetzung u.U. wieder preisgegeben werden müssen.

Es ist daher naheliegend die Übersetzung mit weiteren Methoden auf ihre psychologische Äquivalenz zu überprüfen. Als Verfahren dazu wurde die bilingual testing Methode eingesetzt, die Bearbeitung der Ziel- und Originalversion durch bilinguale Probanden, da mit ihr Item für Item die Responses ein und derselben Gruppe auf beide Sprachversionen korreliert werden können. Zudem können auch auf der Skalenebene des Fragebogens mit verschiedenen statistischen Methoden Vergleiche gemacht werden. Weiterhin ermöglicht die Gewinnung empirischer Daten nicht nur die Unterstützung der psychologischen, sondern auch die Überprüfung der psychometrischen Äquivalenz der zwei Testversionen.

Ziel dieser Arbeit ist die Übersetzung des ISTA in die italienische Sprache und die Äquivalenzprüfung der übersetzten Version, ein erster Validierungsschritt im Prozeß der Bereitstellung dieses Instrumentes für die Anwendung an italienischen Stichproben innerhalb und zwischen den Kulturen.[1]

2. THEORIE

In folgendem Abschnitt wird das Instrument ISTA vorgestellt, methodologische Fragen zur Übersetzung von Fragebögen erläutert und einige Aspekte des Bilingualismus in Bezug auf die vorliegende Arbeit dargestellt.

2.1 Das Meßinstrument ISTA

Das "Instrument zur Stressbezogenen Tätigkeitsanalyse" ist ein Verfahren zur Abschätzung von Belastungsschwerpunkten, eine Grobanalyse die Zusammenhänge zwischen Streß am Arbeitsplatz und verschiedenen Kriterien psychischer und somatischer Gesundheit feststellen kann (Semmer & Dunckel, 1991).

2.1.1 Ziele des Verfahrens

Das Ziel von ISTA besteht darin, Merkmale der Arbeit zu erheben, die stressrelevant sind, d.h. die als Ressourcen oder als Stressoren im Stressprozeß wirken können.

Damit kann ISTA Aufschluß geben über die Notwendigkeiten der Arbeitsgestaltung, besonders im Hinblick auf eine Belastungsoptimierung. Es kann darüber hinaus zum Vergleich von Arbeitstätigkeiten und zur Abschätzung der Folgen von Arbeitsgestaltungsmaßnahmen eingesetzt werden. Weniger geeignet dagegen ist ISTA für die Ermittlung von Qualifikationserfordernissen.

Für die Forschung kann dieses Instrument nützlich sein, um Zusammenhänge zwischen Stressoren und Ressourcen am Arbeitsplatz, Personenmerkmalen (z.B. Coping) und verschiedenen Indikatoren von Gesundheit und Wohlbefinden zu klären.

Ein besonderes Merkmal von ISTA ist, daß es darauf abzielt, Informationen über mehrere Quellen zu erheben. Es besteht aus einer Fragebogen-Version, die Informationen von den Inhabern der Arbeitsplätze einholt, sowie einer Rating-Version, die von geschulten Arbeitsanalytikern auf der Basis von Beobachtungs-Interviews ausgefüllt wird. Da die vorliegende Studie nur die Fragebogenversion betrifft und diese größtenteils dieselben Items enthält wie die Beobachtungsversion, beschränkt sich die folgende Darstellung des Instrumentes auf diese Datengewinnungsmethode.

2.1.2 Anwendungsbereiche

ISTA wurde ursprünglich für Produktionstätigkeiten entwickelt (Semmer, 1983). Zapf hat 1991 eine Büroversion vorgelegt. Derzeit wird die neueste Version des ISTA, die für ein breites Spektrum an Tätigkeiten einsetzbar ist, in verschiedenen Untersuchungen evaluiert.

2.1.3 Theoretische Fundierung

Der Entwicklung von ISTA liegen mehrere Quellen zugrunde. Zum einen ist es die handlungspsychologische Konzeption von Hacker (1986) und Volpert (1987), zum anderen baut sie auf psychologischen Streßkonzeptionen auf. Die handlungspsychologische Konzeption hat zur Folge, daß die Aufgabenbewältigung im Vordergrund steht. Unter Streßgesichtspunkten sind hier Störungen der Handlungsregulation von Bedeutung (Semmer, Zapf & Dunckel, 1997).

Der stresstheoretische Hintergrund ergibt sich aus dem Ansatz von Lazarus und seinen Mitarbeitern, z.B. von Lazarus & Folkman (1984). Im Gegensatz zu Lazarus' responsebezogenem Konzept von Stressoren wird hier von einem probabilistischen Stressorkonzept ausgegangen, d.h. es wird nicht angenommen daß ein Stressor bei jedem Individuum Streß auslöst, sondern daß er die Wahrscheinlichkeit von Streßreaktionen erhöht (Semmer & Dunckel, 1991). Dabei werden unter Stressoren Dimensionen (oder Ereignisse) verstanden, die die Wahrscheinlichkeit von Stressreaktionen erhöhen. Weiterhin wird die Rolle der objektiven Arbeitsgestaltung stärker gewichtet als das bei Lazarus der Fall ist.

Beiden theoretischen Quellen gemein ist die Betonung von Ressourcen. Ressourcen sind Merkmale der Person oder der Situation, die die Bewältigungsmöglichkeiten des Individuums erhöhen und dadurch Streßreaktionen reduzieren oder ganz verhindern können.

Eine zentrale situationale Ressource ist die Möglichkeit, Einfluß auf die eigene Tätigkeit zu nehmen (z.B. Handlungsspielraum). Zu den weiteren wichtigen Ressourcen zählen u.a.: Kommunikationsmöglichkeiten, ausreichende Regulationsanforderungen im Sinne der Komplexität und Variabilität der Arbeit und sozialer Unterstützung.

Daraus ergeben sich die Schwerpunkte von ISTA: die Probleme der Arbeitsaufgabe und Umgebungsbelastungen. Dazu kommen noch organisatorische und soziale Aspekte, die jedoch weniger stark im Vordergrund stehen (Semmer, Zapf & Dunckel, 1997).

2.1.4 Aufbau des Verfahrens

Im Folgenden wird das Instrument ISTA (Fragebogenversion), so wie es zum Zeitpunkt der Untersuchungsplanung vorlag, vorgestellt. Parallel zur vorliegenden Untersuchung fanden eine Reihe von Validierungsstudien statt, in denen sich manche Items als entbehrlich erwiesen haben.[1]

2.1.4.1 Merkmalsbereiche

Konzeptionell lassen sich die Merkmale, die von ISTA erfaßt werden in Merkmale, die sich positiv auf den Arbeitenden auswirken, in solche, die neben einer positiven Wirkung auch eine streßmildernde Wirkung haben und in Merkmale, die als Stressoren eine negative Wirkung haben, einteilen. Zur ersten Kategorie gehören die Regulationsanforderungen, repräsentiert durch Komplexität, Variabilität, Kooperationserfordernisse und soziale Anforderung der Arbeit. Zur zweiten Kategorie gehören Regulationsmöglichkeiten, repräsentiert durch Handlungs-, Zeit-, Kooperationsspielraum, Kommunikationsmöglichkeiten und soziale Unterstützung. Zu den Stressoren gehören Regulationsprobleme, -unsicherheit und -überfor- derung, Kooperationszwang und soziale Stressoren.

Die aufgabenbezogenen Arbeitsmerkmale sind anhand des hierarchisch-sequentiellen Handlungsmodells von Hacker (1986) und Volpert (1987) konzipiert. In diesem Modell wird eine Pyramide von Zielen und Plänen in eine Sequenz von Handlungen umgesetzt.

(Arbeits-)Komplexität korrespondiert dabei mit der Höhe der Pyramide und bringt zum Ausdruck, daß ein komplexes Geflecht von (Teil-)Zielen und (Teil-)Plänen abgearbeitet werden muß.

Variabilität entspricht der Breite der Pyramide. Damit ist die Unterschiedlichkeit einzelner Teilpläne angesprochen, die realisiert werden müssen, um Arbeitsaufgaben an einem Arbeitsplatz auszuführen.

Handlungsspielraum bezieht sich darauf, ob es genau eine Pyramide von Zielen und Teilzielen gibt um ein bestimmtes Ziel auszuführen, oder ob es ein ganzes Bündel möglicher Pyramiden gibt, um ein Ziel umzusetzen.

Zeitspielraum bezieht sich dabei auf die zeitlichen Freiheiten bei der Umsetzung von (Teil-) Zielen.

Stressoren werden handlungstheoretisch als Regulationsprobleme konzipiert. Diese werden weiterhin differenziert in Regulations-Hindernisse, -Unsicherheit und -Überforderung.

Regulations-Hindernisse (vgl. Leitner et al., 1987) implizieren, daß Ziele und Pläne im Grunde feststehen, um eine bestimmte Handlung auszuführen, daß aber bestimmte Umstände dazu führen, daß Handlungen nicht so wie geplant ausgeführt werden können, sondern ein gewisser Zusatzaufwand getrieben werden muß. Regulationsprobleme enstehen etwa wenn andere Personen den Arbeitsprozeß unterbrechen, notwendige Informationen fehlen oder ständig das Telefon klingelt (Arbeitsunterbrechungen) oder aufgrund arbeitsorganisatorischer Bedingungen, z.B. nicht verfügbare Werkzeuge, stockender Materialfluß, schlechtes Material u.ä. (Arbeitsorganisatorische Probleme).

Bei der Regulations-Unsicherheit dagegen sind Ziele und Pläne unklar, die Zielerreichung selbst ist gefährdet. Dies kann in einem Mißverhältnis zwischen den Leistungsvoraussetzungen des Individuums einerseits und der Komplexität der erforderlichen Handlungsschritte andererseits begründet sein, das wäre der klassische Fall der qualitativen Überforderung. Es kann aber auch in prinzipiellen Elementen der Tätigkeit selbst liegen, sei es daß widersprüchliche Anforderungen existieren und nicht zu entnehmen ist, für welches Ziel man sich entscheiden soll oder das beispielweise durch fehlendes Feedback nicht zu entnehmen ist, ob ein Ziel erreicht wurde (Unsicherheit) oder es ist nicht möglich, durch eine bestimmte Regulation von Handlungen Unfallgefahren auszuschließen (Unfallgefährdung).

Bei den Regulations-Überforderungen dagegen sind Ziele und Planung im Prinzip kein Problem, jedoch stößt man bei der Verarbeitung von Informationen an Kapazitätsgrenzen des Arbeitsgedächtnisses (Konzentrations-Anforderungen) oder es besteht das Problem, Ziele und Pläne in der gegebenen Zeit umzusetzen (Zeitdruck) (vgl. Semmer & Dunckel, 1991; Semmer, 1984; Zapf, 1993).

2.1.4.2 Skalen und Indizes

Die Erhebungsversion enthält neben soziodemographischen Fragen und Angaben zur Qualifikation folgende Skalen und Items:

Abbildung in dieser Leseprobe nicht enthalten

Die aktuelle Version 6.0 in kurzer Form enthält nur noch folgende Skalen und Items:

Abbildung in dieser Leseprobe nicht enthalten

2.1.4.3 Art der Fragen

Die Fragen beziehen sich meistens auf die Häufigkeit oder Intensität der Ausprägung eines Merkmals. Die Antwortmöglichkeiten sind vorgegeben und meistens fünfstufig, wobei sowohl Zahlen als auch verbale Abstufungen vorgegeben werden. Diese Abstufungen orientieren sich an den Ergebnissen von Rohrmann (1978). Wo jedoch feinere Abstufungen erforderlich sind oder mehrere Möglichkeiten existieren, wird von dieser Vorgabe abgewichen.

Um die Antwortmöglichkeiten besser zu verdeutlichen, wurden in Anlehnung an Caplan u.a. (1975) bei manchen Fragen unterschiedliche Formulierungen verwendet, die der Arbeit von Mitarbeiter „A“ die Arbeit von Mitarbeiter „B“ gegenüberstellen.

Die Beantwortung der ISTA-Fragen selbst nimmt eine knappe Stunde in Anspruch; dazu kommen je nach Untersuchungsziel und -umfang ein paar zusätzliche Skalen, so daß mit einer Befragungszeit von ca. 1,5 Stunden gerechnet werden muß.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1 Beispielfragen des ISTA

2.1.5 Kennwerte

Die Ergebnisse beinhalten zunächst in verbaler Form Aspekte, die an einzelnen Arbeitsplätzen auffällig waren, und ggf. mit Veränderungsvorschlägen versehen sind. Bezogen auf Gruppen von Arbeitsplätzen oder auf Organisationseinheiten werden Summenwerte der einzelnen Skalen dargestellt. Diese Darstellung ist numerisch; hinzu kommen graphische Aufbereitungen für betriebliche Rückmeldungen. Dabei werden Profile von Streßfaktoren und Ressourcen dargestellt.

Im Rahmen von Gruppendiskussionen werden die Belastungsschwerpunkte konkretisiert und Maßnahmen entwickelt.

Dieser Teil ist für die vorliegende Arbeit jedoch irrelevant, da ISTA als solches nicht ausgewertet wird. Es handelt sich, wie bereits gesagt, um eine Validierungsstudie bezüglich einer Sprache und deswegen interessiert nicht, ob die Probanden belastenden Faktoren ausgesetzt sind oder nicht. Die Schwerpunkte liegen in ganz anderen Bereichen, die im Folgenden vorgestellt werden.

2.2 Übersetzung von Fragebögen in der kulturvergleichenden Forschung

In der kulturvergleichenden Forschung gelten Alternativhypothesen im Sinne von Übersetzungsproblemen immer als Gefahr für die Glaubwürdigkeit der Ergebnisse, solange die Äquivalenz der Instrumente nicht bewiesen ist. Offenbare Einstellungsunterschiede zwischen den Kulturen aufgrund einer falschen Interpretation der Items mit linguistischen Mängeln können in Wirklichkeit semantischer Natur sein. So können, wenn eine der Stichproben mehrere "keine Meinung"-Antworten aufweist, die Ergebnisse zur Unterstützung einer Theorie herangezogen werden, obwohl sie vielleicht nur durch ein falsches Verständnis der Fragen aufgrund einer inadäquaten Übersetzung des Fragebogens zustande kamen.

Die Äquivalenz, deren Beweis notwendig ist, bedeutet in der kreuzkulturellen Forschung die Vergleichbarkeit der Instrumente. Diese ist dann gewährleistet, wenn die Instrumente sowohl die Gleichartigkeit des Inhaltes als auch der Meßeigenschaften vorweisen.

Im nächsten Abschnitt werden die methodologischen Fragen in Bezug auf die vorliegende Studie erläutert, deren Ziel es ist, Beweise für die Äquivalenz der deutschen und italienischen Version des ISTA zu bringen.

2.2.1 Richtlinien zur Übersetzung von Fragebögen

Die Internationale Testkomission (ITC) bildete 1993 ein Komitee von Psychologen aus verschiedenen Branchen in denen die Übersetzung von Tests eine wichtige Rolle spielt. Das Komitee formulierte 22 "Richtlinien zur Adaptation von Tests und psychologischen Instrumenten und zur Festlegung der Score-Äquivalenz zwischen Sprachen und/oder kulturellen Gruppen" (Hambleton, 1994, S230). Dabei wurden von der ITC der Terminus "Adaptation" dem der "Übersetzung " vorgezogen, da eine Adaptation ein breiterer Begriff sei, der den Prozeß der Vorbereitung eines Tests für die Anwendung in einer weiteren Sprache bzw. Kultur besser reflektiere. Eine Übersetzung, so die ITC, sei immer nur ein Teil der Adaptation, aber eben nur "einer der vielen Schritte die gemacht werden müssen, um einen Test oder ein Instrument zu produzieren, das in zwei oder mehreren Sprachen und Kulturen in gleichem Maße valide ist" (Hambleton, 1994, S.230).

In der vorliegenden Arbeit wird von einer Adaptation nur dann gesprochen, wenn es sich um die Vorbereitung eines Tests, für die Anwendung in einer anderen Kultur bzw. in einer anderssprachigen Stichprobe handelt, der bereits in einer Sprache entwickelt und validiert wurde. Der Begriff "Adaptation" charakterisiert dadurch auch das Unternehmen, ISTA für die Anwendung an italienischen Stichproben bereit zu stellen.

Die Richtlinien der ITC zur Übersetzung/Adaptation psychologischer Tests oder Instrumente umfassen vier Facetten multilingualer Studien, durch welche eine kreuz- kulturelle Äquivalenz der Instrumente gesichert werden soll:

1) den Kontext
2) die Entwicklung/Adaptation
3) die Anwendung
4) die Dokumentation/Score-Interpretation der Tests.[2]

Im nächsten Abschnitt werden die Richtlinien der ITC nach oben genanntem Einteilungskriterium erläutert und in Bezug zur vorliegenden Studie gestellt.

2.2.1.1 Kontextrichtlinien

Kontextrichtlinien beschreiben die Grundprinzipien multilingualer Studien und definieren somit den allgemeinen Hintergrund (Van deVijver & Hambleton, 1996). Sie betreffen Themen der Konstruktäquivalenz in den interessierenden Sprachen (Hambleton, 1994).

K(1) Die für das Hauptziel der Untersuchung nicht relevanten Effekte kultureller Unterschiede sollten soweit wie möglich minimiert werden.

Diese Richtlinie betrifft laut Van deVijver (1997, S.42) alle Stadien einer multilingualen Studie, von der Formulierung des theoretischen Hintergrundes bis hin zu der Darstellung der Ergebnisse. Sie drückt ein Grundprinzip der kreuz-kulturellen Forschung aus: der weitestgehenden Vermeidung von Konstrukt-, Methoden- und Itembias. Ohne ausreichende Vorsichtsmaßnahmen können Unterschiede zwischen den Gruppen auf viele Arten interpretiert werden. So können Score-Unterschiede im "Raven's Progressive Matrices"-Test bei zwei sehr unterschiedlichen kulturellen Gruppen aufgrund valider Intelligenzunterschiede, aber auch aufgrund von Unterschieden in der Vertrautheit mit dem Instrument oder der Testsituation etc. entstehen. Ohne ausreichende Informationen können Alternativerklärungen nicht eliminiert werden (Van deVijver & Hambleton, 1996).

Hier geht es also um die Eliminierung von Verzerrungsquellen in allen Stadien der Untersuchung, z.B. von Unterschieden in der Motivation, der Familiarität mit der Testsituation, dem Testmaterial etc. Es soll sichergestellt werden, daß alle Teilnehmer mit den gleichen Annahmen und Erwartungen bezüglich der Erhebung den Test ausfüllen (Hambleton, 1994).

In den entwickelten und "hoch psychologisierten" Ländern ist der Durchschnittsbürger mit vielen Testpraktiken vertraut. Dort ist der Wunsch, eine optimale Leistung bei einem Leistungstest zu erreichen oder ehrliche Antworten bei einem psychologischen Test zu geben, charakteristisch. In den sogenannten Entwicklungsländern kann ein solches Verhalten nicht erwartet werden, da das Testen als solches kein Teil der kulturellen Landschaft dieser Länder ist (Lonner, 1990).

In der vorliegenden Studie kann von einer gewissen Familiarität mit dem Testen als solches ausgegangen werden, da Deutschland, die Schweiz und Italien zu den sogenannten "hoch psychologisierten" Ländern zählen. Da dieselben bilingualen Probanden mit beiden Versionen des Instrumentes getestet wurden, kommen Unterschiede zwischen den Gruppen nicht in Frage, sondern nur Intergruppenunterschiede, die den Methodenbias betreffen. Durch die Bildung einer randomisierten Stichprobe wurden diese eliminiert.

K(2) Das Ausmaß der Überlappung der Konstrukte in den Populationen soll erhoben werden.

Unterschiede zwischen verschiedenen sprachlichen und kulturellen Gruppen sind nicht nur eine Funktion von unterschiedlichen Traditionen, Normen und Werten, sondern auch von unterschiedlichen Sichtweisen und Interpretationen. Somit ist es möglich, daß dasselbe Konstrukt von den zwei untersuchten Gruppen auf gänzlich verschiedene Weise verstanden und interpretiert wird (Hambleton, 1994). Es ist z.B. bekannt, daß das Konstrukt "Intelligenz" universell ist. In westlichen Kulturen wird es jedoch mit der Fähigkeit schnelle Antworten zu geben assoziiert, während es in östlichen Kulturen mit langsamen Gedankengängen, Reflexion und "das Richtige sagen" assoziiert wird (Lonner, 1990).

Diese Richtlinie betrifft demnach den Konstruktbias und die Notwendigkeit, Bedeutungs- und Verhaltensgleichheiten in den Populationen zu erheben. Dazu sind Pilotstudien notwendig, die nur dann einen Sinn machen, wenn eine kulturvergleichende Studie durchgeführt werden soll.

Bezüglich des Konstruktbias sei zu vermerken, daß das Streßkonzept in den westlichen Ländern weitgehend übereinstimmt und diese Frage erst bei kreuz-kulturellen Studien sehr unterschiedlicher Kulturen Bedeutung gewinnt.

2.2.1.2 Entwicklungsrichtlinien

Die Entwicklungsrichtlinien bezüglich der Entwicklung von psychologischen Instrumenten betreffen den Prozeß der Adaptation, von der Auswahl der Übersetzer bis zu den statistischen Methoden für die Analyse der empirischen Daten, mit denen die Score-Äquivalenz untersucht werden soll (Hambleton, 1994).

Es werden also Prozeduren zur Entwicklung multilingualer Instrumente empfohlen (Van deVijver & Hambleton, 1996). Da ISTA für eine Zielpopulation schon entwickelt und in der Quellsprache validiert wurde, lassen sich diese Richtlinien nur in vorgegebenem Rahmen berücksichtigen.

E(1) Der Entwickler eines Instrumentes sollte sicher gehen, daß der Übersetzungs-/Adaptationsprozeß die linguistischen und kulturellen Unterschiede zwischen den Populationen berücksichtigt.

In anderen Worten bedeutet dies, daß die Übersetzung eines Tests die Kenntnis beider Sprachen und Kulturen erfordert. Hambleton (1994, S.235) verdeutlicht dies durch ein Beispiel. In einem schwedisch-englischen Vergleich schulischer Leistung wurde folgendes Item verwendet:

Where is a bird with webbed feet most likely to live?

a. in the mountain
b. in the woods
c. in the sea
d. in the desert

Die schwedische Übersetzung von "webbed feet" wurde zu "swimming feet", da es im Schwedischen kein entsprechendes Äquivalenz gibt. Dadurch entstand für die schwedischen Kinder ein Hinweis für die richtige Antwort.

Solche sprach- und kulturspezifischen Elemente können leicht in die Übersetzung einfließen.

Hambleton (1994,) nennt drei Bedingungen zur Erfüllung dieser Richtlinie. So sollte der Übersetzer erstens Erfahrung mit beiden Kulturen haben, zweitens bereichspezifische Erfahrung besitzen, d.h. die Kenntnis der im Test repräsentierten Inhalte und drittens grundlegende Kenntnisse von Testentwicklung besitzen.

Diese Bedingungen werden von den zwei Übersetzern des ISTA erfüllt. Beide sind bilingual und haben Erfahrung sowohl mit der deutschen als auch mit der italienischen Kultur, beide sind angehende Sozialwissenschaftler in Arbeits- und Organisationspsychologie und haben theoretische und praktische Erfahrungen im Bereich der Testkonstruktion.

Die Richtlinien E(1) bis E(4) betreffen den Beweis der Angemessenheit der in Anleitung, Items und Handbuch verwendeten Sprache, sowie der Angemessenheit von Testform, Itemformat, Testkonventionen und -prozeduren für die Zielpopulation. Weiterhin betreffen sie den Beweis der Familiarität des Iteminhaltes und des Reizmaterials für die intendierte Population. Diese Punkte wurden bei der Übersetzung soweit möglich innerhalb des gegebenen Rahmens berücksichtigt.

E(5) Systematische Beurteilungen (linguistische und psychologische) sollen die Genauigkeit des Übersetzungs- /Adaptationsprozesses verbessern. Zudem sollen Beweise für die Äquivalenz der Versionen erbracht werden.

Der Akzent liegt hier bei der Bedeutungsgleichheit der Fragen/Aufgaben und Ratingskalen in verschiedenen Sprachen und Kulturen (Hambleton, 1994). Urteilsmethoden basieren auf der Entscheidung eines Individuums oder einer Gruppe von Individuen bezüglich der Übersetzungsäquivalenz jedes Items.

Es werden standardisierte Übersetzungsprozeduren empfohlen, wie z.B. die forward translation oder back-translation, auf deutsch: Übersetzung und Übersetzung/ Rückübersetzung (Hambleton, 1994). Bei der forward translation wird der Test von einem Individuum oder einer Gruppe in die Zielsprache übersetzt. Die Äquivalenz wird durch ein anderes Individuum oder einer Gruppe beurteilt.

Zur Feststellung der Bedeutungsäquivalenz (siehe auch Kapitel 2.2.3.1) wurde bei der ISTA- Adaptation die back-translation Methode gewählt.

E(6) Das Design der Datensammlung sollte den Gebrauch angemessener statistischer Techniken zur Feststellung der Item-Äquivalenz der Versionen sichern.

Das Untersuchungsdesign muß einen strengen Äquivalenztest erlauben (Van deVijver & Hambleton, 1996). Von der ITC wurden eine Reihe solcher Designs vorgeschlagen, so z.B: das bilingual testing design, bei dem bilinguale Probanden beide Versionen des Tests beantworten.

Durch diese Richtlinie wird aufgrund der Forderung der statistischen Äquivalenzprüfung eine große Stichprobe vorausgesetzt, die für den Kontext der Testübersetzung besonders relevant ist (Hambleton, 1994).

Die Nachteile einer kleinen Stichprobe müssen in dieser Arbeit in Kauf genommen werden, da aus dem ursprünglichen Probandenpool (N = 160) nur 33 Personen beide Versionen bearbeiteten. Andererseits erlaubt das hier gewählte Untersuchungsdesign (die Bearbeitung der Original- und Zielversion durch Bilinguale) trotz kleiner Stichprobe die Ausführung statistischer Tests, welche wichtige Hinweise bezüglich der Äquivalenz der Versionen ergeben. Das ausgewählte Design sichert, im Vergleich zur Bearbeitung der Versionen durch Monolinguale, die Gleichheit der Stichprobe (Van deVijver & Hambleton, 1996).

E(7) Angemessene statistische Techniken sollten verwendet werden zur (1) Feststellung der Äquivalenz der Versionen und (2) Identifikation problematischer Komponenten oder Aspekte, die für die Zielpopulationen nicht adäquat sein könnten.

Das bedeutet, daß die Evaluation der Angemessenheit einer Übersetzung durch Urteilsbeweise erfolgen sollte, wie sie durch Bedeutungsvergleich innerhalb der back-translation Methode stattfinden und durch statistische Beweise für die ein Reihe von Techniken zur Verfügung stehen. Häufig angewendet werden Faktorenanalysen (Van deVijver & Hambleton, 1996), die hier aufgrund der Stichprobengröße nicht durchführbar sind. Der Forderung nach Urteilsbeweisen wird indes durch die back-translation Methode Rechnung getragen.

E(8) Informationen über die Evaluation der Validität des Tests in der Zielpopulation sollten geliefert werden.

Hier geht es darum, daß die Validität des übersetzten Instrumentes nicht als selbstverständlich angenommen werden kann, da die nomologischen Netzwerke des Originals und der Übersetzung unterschiedlich sein können (Van deVijver,1997).

Die Adaptation eines Instrumentes hat eine Reihe von Vorteilen:

- Zeit und Kosten werden gespart
- es stehen Daten zur Verfügung mit denen die erhobenen Daten verglichen werden können
- die Sicherheit ist höher wenn ein etabliertes Instrument verwendet wird (Brislin, 1986).

Das Problem ist, daß Konstrukte, die in einer Kultur als selbstverständlich gelten, in einer anderen Kultur inexistent sein können. Dementsprechend bezieht sich diese Richtlinie laut Hambleton (1994) auf die Konstruktvalidität in der Zielpopulation. Je größer der kulturelle Unterschied ist, desto gefährdeter ist die Validität (Van deVijver & Hambleton, 1996). Man kann hier davon ausgehen, daß das dem ISTA unterliegende Streßkonzept den zwei sich nicht viel unterscheidenden europäischen Kulturen gemeinsam ist. Die vorliegende Studie schließt die Untersuchung der Konstruktvalidität des ISTA in der italienischen Population ein.

E(9) Statistische Belege für die Äquivalenz der Fragen für die intendierten Populationen sollen erbracht werden.

Grundsätzlich unterstützt der Beweis, daß Personen mit denselben Fähigkeiten dasselbe Antwortmuster abgeben, die Annahme der Testäquivalenz. Allgemein werden Unterschiede in der Bearbeitung der Tests erwartet. Um differentielle Items herauszufinden wurden in den letzten Jahren item bias Studien durchgeführt (Hambleton, 1994). Diese Richtlinie macht eine item bias- Analyse zur Bedingung, indem sie die Äquivalenz auf der Item-bei-Item Grundlage prüft (Van deVijver & Hambleton, 1996). Allgemein gibt es drei Methoden mit denen differentielle Items herausgefunden werden können: die item response Theorie, die Mantel-Haenszel Prozedur und die Logistischen Regressions-Prozeduren (Hambleton, 1994). All diese Methoden bedürfen großer Stichproben, die in dieser Untersuchung nicht erreicht werden konnten. In der vorliegenden Studie wird ein Item-bei-Item Vergleich mit Hilfe eines t-Tests gemacht.

E(10) Fragen, die sich in den Versionen als nicht äquivalent erweisen, sollten zur Entwicklung einer gemeinsamen Skala oder zum interkulturellen Vergleich nicht herangezogen werden. Sie sind jedoch nützlich für die Inhaltsvalidität der Scores der einzelnen Populationen.

Bezüglich dieser Richtlinie läßt sich sagen, daß sie für die vorliegende Arbeit nur im Rahmen der Interpretation und der Diskussion der Ergebnisse eine Rolle spielt, da kein interkultureller Vergleich vorgenommen wird.

2.2.1.3 Richtlinien der Testadministration

A(1) Probleme sollten durch die Vorbereitung angemessenen Materials und von Instruktionen antizipiert werden. Zudem sollten Lösungen erarbeitet werden.

Im allgemeinen gehen die erwarteten Administrationsprobleme mit dem kulturellen und linguistischen Unterschied zwischen den Populationen einher. Es wird die Forderung an die Kenntnis der Zielkultur und der Zielsprache gestellt. Probleme, welche die Vergleichbarkeit der Versionen betreffen, sollten diskutiert werden (Hambleton, 1994). Laut Van deVijver & Hambleton (1996) können solche Probleme in kleinen Pilotstudien aufgedeckt werden, z.B. indem von den Probanden verlangt wird Items zu paraphrasieren und ihre Antwort zu begründen. Viele Probleme, welche die Vergleichbarkeit der Versionen betreffen, werden jedoch im Laufe des Übersetzungsprozesses auch ohne Pretest sichtbar.

A(2) Reizmaterial, Anwendungsprozeduren und Antwortmodi, welche die Validität der Schlußfolgerungen gefährden, sollten vorausgesehen werden.

In dieser Richtlinie wird nochmals die Kenntnis der Zielkultur betont, da nur diese die Entdeckung von Aspekten ermöglicht, die besonderer Aufmerksamkeit bedürfen. Es geht hier um Faktoren, wie z.B. die Anzahl der Antwortkategorien (Hambleton, 1994), spezifische Beispiele, die für eine Gruppe nicht aussagekräftig sind, unübliche Wörter in den Instruktionen oder globale Faktoren, wie Fragen bzgl. intimer Bereiche (Van deVijver, & Leung, 1997).

Aufgrund dieser Überlegung wurden einige Änderungen bei ISTA vorgenommen, z. B. wurden die Zusatzskalen des ISTA, Version 5.1, eliminiert (siehe auch 3.3.2 Instrument).

A(3) Umgebungsaspekte, welche die Anwendung eines Tests beeinflussen, sollten für alle Populationen so ähnlich wie möglich sein.

Umgebungsaspekte von Laborstudien lassen sich leicht replizieren. Physikalische Bedingungen der Feldforschung hingegen, tendieren zu Idiosynkrasie und sind schwer replizierbar. Deswegen ist es wichtig, die grundlegenden Umgebungsfaktoren zu beachten. So z.B. müssen bei einem computergestützten Test die Distanz zum Bildschirm, die Lichtverhältnisse etc. berücksichtigt werden (Van de Vijver & Hambleton, 1996).

In der vorliegenden Studie erhielten alle Teilnehmer den Fragebogen postalisch, wodurch zwar einerseits die Gleichheit der Testumgebung gegeben war, andererseits jedoch weitere Faktoren nicht kontrollierbar waren. Alle Personen erhielten dasselbe Anschreiben, in dem das Vorhaben und der Ablauf der Untersuchung beschrieben wurden (siehe Anhang).

A(4) Die Testinstruktionen sollten den Einfluß ungewollter Variationsquellen in den Populationen minimieren.

Es geht hier um die Reduktion von Faktoren die in Intergruppen-Differenzen resultieren können, z.B. Reiz- und Testsituationsvertrautheit. Hinsichtlich der vorliegenden Studie wurde dieses Thema bereits unter K(1) erläutert.

Die restlichen administrativen Richtlinien betreffen die Spezifikation zu berücksichtigender Aspekte im Testmanual. Dieser Punkt spielt hier noch keine Rolle, da weitere Validierungsstudien notwendig sind, um ISTA in italienischer Form zu etablieren.

2.2.1.4 Richtlinien zur Dokumentation und Interpretation der Ergebnisse

Die Richtlinien zur Dokumentation der Untersuchung und Interpretation der Ergebnisse sollten Aspekte spezifizieren, die bei kreuz-kulturellen Studien berücksichtigt werden müssen.

I(1) Wenn ein Instrument für die Anwendung in einer anderen Population übersetzt/ adaptiert wird, sollten die Veränderungen am Instrument zusammen mit den Beweisen seiner Äquivalenz dokumentiert werden.

Linguistische und statistische Beweise, wie z.B. die Spezifikation der Übersetzungsprozedur oder die Ergebnisse eines Mittelwertsvergleiches, sollten beschrieben werden.

Diese Daten sollen den Untersuchern die Evaluation der Angemessenheit des Instrumentes in einem neuen kulturellen Kontext erleichtern. So kann z.B. das Wissen, daß bestimmte kulturelle Faktoren (ökonomische, soziale etc.) bei der Adaptation eines spanischen Tests für südamerikanische Länder berücksichtigt wurden, für die Entscheidung, den Test bei spanisch sprechenden Nordamerikanern anzuwenden, nützlich sein (Hambleton, 1994).

Diser Richtlinie folgend, enthält die vorliegende Studie eine detaillierte Beschreibung der gesamten Prozedur. Diese umfaßt das verwendete Design, Methoden zur Äquivalenz-bestimmung, Selektion der Übersetzer, Begründung der Modifikation und Ausschließung von Items, grundlegende Probleme und ihre Lösung, sowie Aspekte der Administration und die Interpretation der Ergebnisse.

I(2) Score-Unterschiede zwischen den Populationen sollten nicht als gegeben betrachtet werden. Weitere empirische Beweise sollten dazu erbracht werden.

Diese Richtlinie kann hier nur in übertragenem Sinne auf die Score-Unterschiede der zwei Versionen angewendet werden.

I(3) Vergleiche zwischen Populationen können nur auf dem für die Erhebungsskala festgelegten Level gemacht werden.

Ohne eine gründliche Untersuchung der Äquivalenz, können keine Behauptungen bezüglich kreuz-kultureller Unterschiede und Ähnlichkeiten gemacht werden (van de Vijver, 1997), d.h. die Interpretation der Gruppen-Scores kann nur dann gemacht werden, wenn die Übersetzungsäquivalenz, die Angemessenheit des Instrumentes für den neuen Kontext und die Äquivalenz der Scores untersucht wurden. Wenn die Äquivalenz des Instrumentes nicht untersucht wurde, bleiben die Schlußfolgerungen für alternative Interpretationen offen (Van deVijver & Hambleton, 1996).

Der Beweis der Äquivalenz ist das Ziel dieser Untersuchung. Schlußfolgerungen bezüglich interkultureller Unterschiede werden hier nicht gezogen.

I(4) Spezifische Information über die Art und Weise, auf die der sozio-kulturelle und der ökonomische Kontext der Population die Beantwortung der Fragen beeinflußt, sollten geliefert werden. Es sollte vorgeschlagen werden, wie man den Effekten dieser Faktoren in der Interpretation der Ergebnisse entgegenkommen kann.

In kulturvergleichenden Studien müssen Faktoren, die für die Erhebung relevant sind, berücksichtigt werden, um so das Verständnis der Ergebnisse zu erleichtern (Bracken & Barona, 1991). Unterschiedliche sozio-politische Faktoren, die gleichbleibend die Testleistung beeinflussen, werden allzu oft als gegeben angesehen (Van de Vijver & Poortinga, 1991). Z.B. können akademische Leistungsunterschiede von Studenten aus industrialisierten Ländern und sogenannten Entwicklungsländern, oder ruralen und urbanen Gesellschaften nicht aufgrund fehlender Fähigkeiten sondern aufgrund fehlenden Zugangs zu Ressourcen vorkommen (Hambleton, 1994).

Hier wird also die Forderung gestellt, relevante Kontextvariablen, wie z.B. relevante kulturelle Merkmale der Zielgruppe, Hintergrundfaktoren, wie z.B. Alter, Geschlecht und Schulbildung, im Testmanual zu spezifizieren und bei der Untersuchung zu berücksichtigen (Hambleton, 1994; Van de Vijver, 1997).

Solche Kontextvariablen sind in den soziodemographischen Fragen des ISTA enthalten und werden in der vorliegenden Studie berichtet.

2.2.2 Übersetzungsmethoden

In der kulturvergleichenden Forschungsliteratur werden unterschiedliche Prozeduren zur Übersetzung eines Instrumentes vorgeschlagen. Häufig werden diese auch als Methoden zur Festlegung der Äquivalenz übersetzter Tests bezeichnet (Hambleton, 1993, S.61). Dies wird verständlich, wenn man bedenkt, daß auf die Übersetzungsmethode eine unmittelbare qualitative Prüfung der Übersetzungsgüte folgt. Im folgenden Abschnitt werden Methoden der Übersetzung und der Äquivalenzbestimmung getrennt besprochen. Eine Übersetzungsmethode bezieht sich demnach nur auf die Art in der die Übersetzung an sich gemacht wird: forward oder back-translation, von einem Bilingualen oder einem Übersetzungskomitee etc. Eine Methode zur Äquivalenzbestimmung hingegen bezieht sich auf die Art und Weise, in der die Vergleichbarkeit des Tests geprüft wird: durch Urteils- oder statistische Beweise bzw. qualitativ oder quantitativ.

Ursprünglich als Kontrollmöglichkeit für Forscher angewandt, welche die Zielsprache nicht beherrschen, (Werner & Campbell, 1970) ist heute die back-translation die am häufigsten verwendete Methode. Wie bereits aufgezeigt, wurde sie auch für diese Untersuchung eingesetzt und wird im Folgenden als erste erläutert.

Nach einer kurzen Beschreibung der Vorgehensweise werden Vor- und Nachteile der Methoden - als Übersetzungsmodalität gesehen - im Hinblick auf die vorliegende Studie abgewogen. Die Vor- und Nachteile der Methoden bezüglich der Äquivalenzbestimmung werden unter Punkt 2.4.2.1 diskutiert.

2.2.2.1 Übersetzung/ Rückübersetzung (back-translation)

Die Vorgehensweise der back-translation ist folgende: ein Test wird von einem Bilingualen von der Quellsprache in die Zielsprache übersetzt, ein zweiter Bilingualer übersetzt diese Form zurück in die Originalsprache. Diese Prozedur kann beliebig wiederholt werden. Der Prozeß der Übersetzung/ Rückübersetzung sieht damit, graphisch dargestellt, folgendermaßen aus:

Abbildung in dieser Leseprobe nicht enthalten

Abb.2 Die Back-translation Prozedur

Man hat somit zwei Versionen der Originalsprache die man miteinander vergleicht. Sind sie identisch, deutet dieses darauf hin, daß die Zielversion und die Originalversion äquivalent sind

(Brislin & Lonner, 1973).

Die back-translation Methode bietet auch einige Variationsmöglichkeiten. Es können z. B. bilinguale Beurteiler oder Übersetzer eingesetzt werden, um die Quell- und Zielversion auf Bedeutungsgleichheit hin zu prüfen. Weiterhin lassen sich auch mehrere Bilinguale für die Übersetzung bzw. Rückübersetzung einsetzen. Bei der Übersetzung von ISTA in die italienische Sprache waren zwei Bilinguale tätig, bei der Rückübersetzung ein weiterer, unabhängiger Bilingualer.

Ein großer Vorteil dieser Methode ist, daß sie einen genauen Überblick über das Stadium der Testentwicklung und/oder der Übersetzung liefert. Durch Rückübersetzung kann nicht nur die Güte der Übersetzung, sondern auch die des Übersetzers festgestellt werden.

Bei existierenden Instrumenten, die für eine weitere Kultur adaptiert werden, d. h. im Sinne von Hambleton (1994) in eine andere Sprache übersetzt werden ohne daß die Originalversion modifiziert wird, liegt eine môt-a-môt Übersetzung auf der Hand. Der Nachteil einer wortwörtlichen Übersetzung ist, daß sie die Lesbarkeit und Natürlichkeit der Sprache der Zielversion beeinträchtigt und somit zu einer verunstalteten Zielsprache führen kann. Ein Übersetzer, der weiß, daß die Zielversion rückübersetzt werden soll, kann eine solche wortwörtliche Übersetzung favorisieren (Van deVijver & Hambleton, 1996).

In Zusammenhang mit der môt-a-môt Übersetzung steht auch die Bemerkung von Van deVijver & Leung (1997), daß die back-translation Methode mehr die Semantik und weniger die linguistischen Merkmale wie Konnotationen, Denotationen, Natürlichkeit und Verständlichkeit der Zielsprache berücksichtigt. Daraus können sich Nachteile für die Äquivalenz der Versionen ergeben. Die gleichmäßige Berücksichtigung o. g. linguistischer Merkmale ist nur bedingt möglich, wenn eine back-translation ohne Dezentrierung gemacht wird, d. h. ohne das Hin und Her Übersetzen und Ändern der Versionen in beiden Sprachen, wie das bei der Adaptation von ISTA der Fall ist.

Da jedoch die semantische Gleichheit als wichtigstes Urteilskriterium gilt (Brislin et al., 1973) und die Fragen des ISTA, laut Angaben der Autoren, sachlich formuliert sind, so daß sekundäre Bedeutungen (Konnotationen und Denotationen) keine sehr große Rolle spielen dürften, ist dieser Aspekt der back-translation für die vorliegende Studie nicht von Nachteil.

Ein weiteres Problem der back-translation, welches daraus resultiert, daß der Übersetzer die Zielsprache nicht gut genug kennt, ist die Verwendung von Ausdrücken oder Formulierungen, die der Zielpopulation unfamiliär sind.

In diesem Fall kann nach der ersten Übersetzung ein der Stichprobe ähnlicher Monolingualer hinzugezogen werden , der das Material so umschreibt, daß es der Zielpopulation verständlich wird (Brislin, 1986). Die Reihenfolge der Übersetzungsschritte ändert sich daraufhin wie folgt:

Abbildung in dieser Leseprobe nicht enthalten

Abb.3 Variante der back-translation.

Der Test wird von dem Bilingualen #1 in die Zielsprache übersetzt, die Zielsprache wird von einem Monolingualen revidiert und anschließend von dem Bilingualen #2 in die Ausgangssprache rückübersetzt.

Brislin et al. (1973) schreiben die erfolgreiche Anwendung dieser Methode zwei Umständen zu: die Originalversion war immer offen für Revisionen, und die Sprachen hatten ähnliche Strukturen. Wenn man dieser Behauptung Glauben schenkt, ergibt sich ein Nachteil für die aktuelle Studie, da ISTA in deutscher Sprache bereits validiert wurde, und dadurch für Änderungen gesperrt ist. Die Tatsache daß deutsch und italienisch indo-europäische Sprachen sind, wenn auch aus unterschiedlichen Branchen: germanisch und italienisch-latein (Taylor, 1990), ist dementsprechend von Vorteil.

Bei der Kombination der back-translation mit anderen Methoden werden ihre Nachteile kompensiert. Es gibt eine Reihe von Studien, in denen sie erfolgreich eingesetzt wurde (Brislin et al, 1986; Hambleton, 1993). So verwendeten Hulin, Drasgow & Komocar (1982) die back-translation Methode als vorausgehende Kontrolle der Übersetzungsqualität, bevor sie statistische Methoden zur Bestimmung der Äquivalenz einsetzten.

2.2.2.2 Committee approach

Der Begriff "Komitee" wird verwendet, wenn zwei oder mehrere Personen aus dem Original in die Zielsprache übersetzen und danach die Ergebnisse Item für Item diskutieren und/oder mit dem Ergebnis einer anderen Person vergleichen (Brislin et al.1973). Für diese Prozedur gibt es eine Reihe von Varianten:

Zwei Personen übersetzen in die Zielsprache, eine dritte Person wählt die ihm am geeignetsten erscheinende Itemversion aus. Alle Optionen werden anschließend diskutiert.

Zwei Personen übersetzen den Test, eine dritte kontrolliert die Qualität der Übersetzung.

Ein Komitee macht die Übersetzung, ein zweites die Rückübersetzung eines Instrumentes.

Das Komitee kontrolliert nur die Qualität einer Übersetzung (Bracken & Fouad, 1987).

Das Komitee macht die Übersetzung und einzelne Bilinguale kontrollieren ihre Genauigkeit (Sperber et al., 1994).

Die entscheidende Stärke dieser Methode besteht in der Verbesserung der Qualität der Übersetzung durch die kooperative Arbeit der Übersetzer, besonders wenn die Teilnehmer verschiedene Kompetenzen haben, z. B. wenn einer der Teilnehmer den kulturellen Hintergrund der Zielpopulation sehr gut kennt, ein anderer dafür die wichtigsten Aspekte des untersuchten Konstruktes.

Das Zusammenstellen eines kompetenten Komitees ist zeitaufwendig und kostspielig. Aus diesem Grund kam die Einsetzung eines Komitees in der vorliegende Studie nicht in Frage.

2.2.2.3 Kombination von Techniken

Um den Nachteilen einzelner Methoden entgegen zu wirken, empfiehlt sich ein multimodaler Ansatz. In der kulturvergleichenden Forschung gibt es eine Reihe von Untersuchungen, die eine Kombination von Methoden angewandt haben und von einer erfolgreichen Übersetzung berichten. Da sich die Validierungsstudie von ISTA in Bezug auf die italienische Sprache auch eines multimodalen Ansatzes bedient, werden im Folgenden einige Kombinations-möglichkeiten, inklusive der hier angewandten, aufgezeigt.

A. Komitee plus Bilinguale

Für den Komitee-Ansatz gibt es eine Reihe von Varianten (S. 2.2.2.2 Committee approach), die sich mit anderen Methoden kombinieren lassen.

So können z. B. zwei oder mehrere Personen den Test übersetzen, der anschließend einer Stichprobe von Bilingualen zur Bearbeitung gereicht wird. So berichtet z.B. Lonner (1968) die Übersetzung des Strong Vocational Interest Blank (SVIB) in die deutsche Sprache mit Hilfe von zwei Übersetzern (er selbst und ein weiterer Übersetzer). Anschließend wurden die zwei unabhängigen Übersetzungen verglichen und die Unterschiede eliminiert. Daraufhin folgte eine weitere Revision der Übersetzung durch eine Gruppe von bilingualen Psychologen und die Anwendung des Tests an einer bilingualen Stichprobe. Als Maß der Übersetzungsqualität wurde der Test-Retest-Score (die Korrelation der Skalen) genommen.

B. Back-translation plus Bilinguale

Bei der Testung von Bilinigualen wird angenommen, daß ein Subjekt, das ein Symptom aufweist, die gleiche Antwort gibt, wenn es in identischer Weise in zwei Sprachen danach gefragt wird (Prince & Mombour, 1967).

Die Kombination von back-translation mit bilingual testing wurde auch in der vorliegenden Studie eingesetzt. ISTA wurde in die Zielsprache übersetzt, in die Originalsprache zurück übersetzt, die Rückübersetzung wurde mit dem Original verglichen und anschließend wurde der Test in beiden Sprachen an einer bilingualen Stichprobe eingesetzt.

Diese Kombination von Methoden wurde in der kulturvergleichenden Forschung öfters erfolgreich eingesetzt. Choudry & Mumford (1990) berichten z.B. von der Übersetzung des Eating Attitude Tests (EAT-26) in Urdu durch ein Komitee und der Revision der Übersetzung durch zwei unabhängige Übersetzer. Die Rückübersetzung erfolgte durch fünf unabhängige Übersetzer. Anschließend wurde der Test in beiden Versionen einer bilingualen Stichprobe zur Bearbeitung vorgelegt. Zur Bestimmung linguistischer Äquivalenz wurden die Antworten mittels eines t-Tests für gepaarte Stichproben verglichen. Items mit diskrepanten Ergebnissen wurden modifiziert und anschließend an einer weiteren bilingualen Stichprobe getestet. Zur Bestimmung der Skalenäquivalenz wurde geprüft, ob die beiden Testversionen dieselben Individuen mit hoher Ausprägung identifizierten.

C. Back-translation , Pretest und Monolinguale

Ein Pretest eignet sich für die Aufdeckung problematischer Aspekte der übersetzten Version. In der Studie von Bullinger (1995) wurde z.B. die back-translation von Ratings der Übersetzungsqualität begleitet und bezüglich der Übersetzungsklarheit und -anwendbarkeit im voraus getestet. Anschließend wurde der Test an einer monolingualen Stichprobe getestet.

Auf einen Pretest wurde in der vorliegenden Studie jedoch aus ökonomischen Gründen verzichtet. Es wurde versucht, die Vorteile eines solchen mit der Revision der Übersetzung durch einen Monolingualen und das mehrfache Korrekturlesen weiterer unabhängiger Bilingualen zu ereichen.

An diesen Beispielen wird die Fülle der Kombinationsmöglichkeiten ersichtlich, mit deren Hilfe die Nachteile einzelner Methoden ausgeglichen werden können. In vorliegender Studie wurde, wie bereits erwähnt, die back-translation Methode mit dem bilingual testing kombiniert. Die wichtigsten Überlegungen, die zur Auswahl dieser Methodenkombination führten, waren, daß der Untersucher, auch wenn er die Sprache nicht so gut kennt, mit Hilfe der Übersetzung/ Rückübersetzung die Möglichkeit hat, die Genauigkeit der Übersetzung zu kontrollieren. Außerdem gilt diese Methode inzwischen als Standardprozedur (Van deVijver & Hambleton, 1996). Die bilingual testing Methode wurde, wie bereits oben erwähnt, aufgrund der Annahme eingesetzt, daß ein Subjekt mit einer bestimmten Merkmalsausprägung die gleiche Antwort gibt, wenn es auf identische Weise in zwei Sprachen danach gefragt wird.

2.2.3 Qualität und Äquivalenz der Übersetzungen

In Anschluß an die Darstellung der Übersetzungsmethoden werden die Gesichtspunkte erläutert, nach denen man Qualität und Äquivalenz von Übersetzungen bestimmen kann. Im Folgenden werden zuerst die Äquivalenzkriterien besprochen und anschließend die Methoden, durch welche sich diese bestimmen lassen.

2.2.3.1 Äquivalenzkriterien

Äquivalenzkriterien sind Kennwerte dafür, daß zwei Tests mit Recht als äquivalent angesprochen werden dürfen (Lienert, 1989). Gefordert wird hiermit die Gleichartigkeit des Testinhaltes und der Meßeigenschaften des Instrumentes. D.h. mit anderen Worten, um sicher zu gehen, daß die Unterschiede einer kulturvergleichenden Studie nicht aufgrund von Unterschieden in dem Original und der Übersetzung entstehen, muß sowohl eine linguistische als auch eine psychometrische Äquivalenz festgelegt werden (Ellis, 1989).

In der vorliegenden Arbeit werden zwei Äquivalenzbereiche unterschieden: der psychologische und der psychometrische Bereich. Wie schwierig es ist, diese Kategorien auseinander zu halten, zeigt ein Blick in die kulturvergleichende Literatur. Nicht selten wird hier in übergreifendem Sinne von translation adequacy oder comparability (Butcher &Gur, 1974, S.220), score equivalence (Hambleton, 1994, S.230), oder einfach nur von translation equivalence (Brislin et al.,1973, S.51) gesprochen.

Vor allem lassen sich linguistische und psychologische Äquivalenz schwer auseinanderhalten, da der eine Aspekt den anderen impliziert. So sprechen z.B. Van de Vijver & Leung (1997) von linguistischer Äquivalenz im Zusammenhang mit Semantik, Konnotationen, Natürlichkeit und Verständlichkeit der Begriffe bzw. des Textes. Im Folgenden werden diese Bereiche separat erläutert und die Zusammenhänge zwischen ihnen aufgezeigt.

A. Linguistische Äquivalenz

Bei der Übersetzung von Instrumenten wird unter anderem die Forderung nach der linguistischen Äquivalenz der übersetzten Items und Skalen psychologischer Tests gestellt. Für Hulin (1987) bedeutet dies nicht nur die Entsprechung der semantischen Bedeutung, sondern auch der linguistischen Struktur und der grammatikalischen Form.

Brislin (1980) gibt eine Definition linguistischer Äquivalenz als äquivalente Bedeutungen der Morpheme, welche die Zielsprache bilden. Die kleinste Bedeutung tragende Einheit kann jedoch kein Maßstab für die linguistische Äquivalenz sein, da das Ganze mehr als die Summe seiner Teile ist.

Übersetzungen werden normalerweise nach ihren linguistischen Zielen eingeteilt. Casagrande (1954) hat vier Arten von Übersetzungen entsprechend ihrer Ziele beschrieben: die pragmatische, ästhetisch-poetische, ethnographische und linguistische.

Ästhetisch-poetische Übersetzungen haben das Ziel dieselben Effekte in den Lesern der Zielsprache zu induzieren. Das Ziel der Übersetzung psychologischer Skalen ist nicht, identische Zustände und Gefühle in beiden Sprachen hervorzurufen, sondern den Probanden zu ermöglichen, Nuancen dieser Zustände in der Zielsprache so zu berichten, wie sie es in der Originalsprache tun würden (Hulin, 1987).

Ethnographische Äquivalenz ist dann erforderlich, wenn die Items Reaktionen auf kulturelle Ereignisse erheben. Eine pragmatische Übersetzung akzentuiert die akkurate Weitergabe der Information in die Zielsprache, ohne auf den Stil oder die ästhetische Qualität des Ergebnisses zu achten (Bontempo, 1993). Für Brislin et al.(1973) impliziert die Methodologie des kreuz- kulturellen Vergleichs eher pragmatische Übersetzungen. Für Hulin (1987) müssen die übersetzten Items bzw. Skalen eher linguistisch äquivalent sein, da das Ziel linguistischer Äquivalenz nicht eine äquivalente Struktur an sich zu erreichen ist, sondern eine äquivalente Materialstruktur zu produzieren, um äquivalente Reize zu erzeugen.

[...]


[1] Mein herzlicher Dank gilt Vanda Descombes della Schiava für die Übersetzung der zweiten Hälfte des ISTA und der Akquisition von Probanden, Dr. Willi Nagel für die Unterstützung bei der statistischen Auswertung der Daten, Priv. Doz. Dr. Wolfgang Weber für die Unterstützung der Finanzierung und der Betreuung, Rocco Ditaranto für die Revision der Übersetzung, Peter Gahl für seine nützlichen Kommentare und der Probandenakquisition, Hansjörg Meier, Philippo de Sanctis & Axel Baumgartner für die Probandenakquisition, Prof. Dr. Dieter Zapf für die Betreuung, Robert Heider für den Bedeutungsvergleich der Versionen, Christine Engel und Thomas Weber für die Korrekturarbeit und Prof. Dr. Fons Van de Vijver für die Beratung.

[1] Deswegen liegt die aktuelle Version 6.0 z.Z. sowohl in langer als auch kurzer Form vor. Das Ziel der ISTA Forschung ist es, die kurze Version für zukünftige Studien zu validieren, da die Länge des Fragebogens erhebliche Nachteile auf die Antwortrate hat und weitere neue Konzepte dazukommen. In der vorliegenden Untersuchung wurde zur Datenerhebung die Version 5.1 eingesetzt. Aufgrund o.g. Entwicklungen wurden bei der Auswertung nur noch die Items der kurzen Version 6.0 berücksichtigt.

[2] Eine Zusammenfassung der Richtlinien findet sich bei Hambleton, 1994; Van deVijver & Hambleton, 1996 und Van deVijver & Leung, 1997.

Details

Seiten
106
Jahr
1999
ISBN (eBook)
9783668317901
Dateigröße
956 KB
Sprache
Deutsch
Katalognummer
v341812
Institution / Hochschule
Universität Konstanz
Note
sehr gut
Schlagworte
kreuzkulturelle studie arbeitsanalyseverfahren validierung fragebogens ista bezug sprache

Autor

Zurück

Titel: Kreuzkulturelle Studie psychologischer Arbeitsanalyseverfahren. Validierung des Fragebogens ISTA in Bezug auf die italienische Sprache