TRI-Q-Sort: Triadische elterliche Kapazität und psychische Kindesentwicklung

Entwicklung des TRI-Q-Sort zum Triadeninterview von Prof. Dr. med. Kai von Klitzing


Doktorarbeit / Dissertation, 2006

227 Seiten


Leseprobe


Inhaltsverzeichnis

DANKSAGUNG

ZUSAMMENFASSUNG

EINLEITUNG

1 THEORIE
1.1 Triadische elterliche Kapazität und Kindesentwicklung
1.1.1 Das Triadische in der entwicklungspsychologischen Forschung
1.1.2 Konzepte und Untersuchungen von Bürgin & von Klitzing
1.1.3 Hinweise zur Generierung des TRI-Q-Sort
1.2 Das Triadeninterview (von Klitzing 1996)
1.2.1 Ergebnisse der Triadeninterview-Untersuchung
1.2.2 Hinweise zur Generierung des TRI-Q-Sort
1.3 Das Q-Sort-Verfahren und Theorie der Testentwicklung
1.3.1 Konstruktion eines Q-Sorts
1.3.1.1 Q-Sort Struktur
1.3.1.2 Q-Sort Referenzgrösse
1.3.1.3 Generieren eines Q-Sort Itemsamples
1.3.2 Gütekriterien eines Q-Sorts
1.3.2.1 Objektivität
Durchführung
Auswertung
Interpretation
1.3.2.2 Reliabilität
Stabilität
Aequivalenz
Homogenität
1.3.2.3 Validität
Inhaltsvalidität
Kriteriumsvalidität
Konstruktvalidität
1.3.2.4 Nebengütekriterien
1.3.3 Itemanalyse
1.3.3.1 Rohwerte
1.3.3.2 Itemschwierigkeit
1.3.3.3 Trennschärfe
1.3.3.4 Dimensionalität
1.3.4 Hinweise zur Generierung und Ueberprüfung des TRI-Q-Sort

2 METHODE
2.1 Zielsetzung
Test-Konstruktion und Ueberprüfung des TRI-Q-Sort
2.2 Fragestellungen
2.2.1 1. Fragestellung: TRI-Q-Sort Itemgenerierung und -erprobung
2.2.2 2. Fragestellung: TRI-Q-Sort Gütekriterien
2.2.3 3. Fragestellung: TRI-Q-Sort Itemanalyse
2.3 Stichproben
2.4 Versuchsplan

3 RESULTATE
3.1 Resultate zur 1. Fragestellung:
TRI-Q-Sort Item-Generierung und -Erprobung
3.1.1. TRI-Q-Sort - Item-Generierung (Vorstudien)
3.1.2. TRI-Q-Sort - Item-Erprobung (Pilotstudie)
3.2 Resultate zur 2. Fragestellung: Gütekriterien des TRI-Q-Sort
3.2.1 Resultate zur Objektivität des TRI-Q-Sort
3.2.1.1 Durchführung
3.2.1.2 Auswertung
Konzeptebene
Profilebene
Itemebene
3.2.1.3 Interpretation
Zusammenfassung
3.2.2 Resultate zur Reliabilität des TRI-Q-Sort
3.2.2.1 Retest
3.2.2.2 Paralleltest
3.2.2.3 Inter-Item-Konsistenz
Zusammenfassung
3.2.3 Resultate zur Validität des TRI-Q-Sort
3.2.3.1 Inhaltsvalidität
3.2.3.2 Kriteriumsvalidität
Konzeptebene
Itemebene
3.2.3.3 Konstruktvalidität
Zusammenfassung
3.2.4 Nebengütekriterien
Gesamtzusammenfassung zu den TRI-Q-Sort Gütekriterien
3.3 Resultate zur 3. Fragestellung: TRI-Q-Sort Itemanalyse
3.3.1 Quantitative Itemanalyse
3.3.1.1 Kennwerte und Ergebnisse
3.3.1.2 Zusammenhänge zwischen Kennwerten
3.3.1.3 Selektions- und Optimierungs-Kriterien
3.3.1.4 Erste Selektion von TRI-Q-Sort Items
Zusammenfassung
3.3.2 Qualitative Itemanalyse
3.3.2.1 Optimierungskriterien
Zusammenfassung
3.3.2.2 Zweite Selektion & Optimierung der TRI-Q-Sort Items
Optimierungsbeispiel
Reduktion, Optimierung und Definition des TRI-Q-Sorts
1) Die TRI-Q-Sort Items der Dimension „Dialog“
Zusammenfassung
2) TRI-Q-Sort Items der Dimension „Triangularität“
Zusammenfassung
3) TRI-Q-Sort Items der Dimension „Flexibilität“
Zusammenfassung
4) TRI-Q-Sort Items der Dimension „Ambivalenz“
Zusammenfassung
5) TRI-Q-Sort Items der Dimension „Kohärenz“
Zusammenfassung
Gesamtzusammenfassung zurTRI-Q-Sort Itemanalyse
3.4 Der TRI-Q-Sort (Final Version)

4 DISKUSSION

Aussagekraft und Einsetzbarkeit des TRI-Q-Sort in Forschung und Prävention und Innovationen zur Q-Sort Methodik

5 VERZEICHNIS: ABBILDUNGEN, TABELLEN, HISTOGRAMME

6 LITERATUR

LEBENSLAUF

ZUSATZBAND: TRI-Q-SORT DOKUMENTATION

A) TRI-Q-Sort (Final Version) mit Testmanual

B) TRI-Q-Sort Ergebnisse der Hauptstudie: Histogramme und Tabellen

C) TRI-Q-Sort der Pilotstudie und der Vorstudien: Testerprobung und Testgenerierung

DANKSAGUNG

Die vorliegende Arbeit ist auf Anfrage von Prof. Dr. med. Kai von Klitzing nach Abschluss der Nationalfondsstudien von ihm selbst, von Prof. Dr. med. Dieter Bürgin und von Dr. phil. Heidi Simoni entstanden. Die Förderung dieses sozialwissenschaftlichen Messinstruments durch die Stiftungen Dürr und Vontobel hat die eingehende Beschäftigung mit dem Thema sowie die Anwendung und Weiterentwicklung der spezifischen Testmethodik möglich ge- macht. Im Rahmen der Forschungsabteilung an der Kinder- und Jugendpsychiatrischen Uni- versitätsklinik und -poliklinik Basel fand das Projekt grundlegend wertvolle Unter-stützung und Anregung.

Allen voran danke ich Herrn Prof. Dr. rer. nat. Udo Rauchfleisch, Professor für Klinische Psychologie an der Universität Basel und Psychoanalytiker, Herrn Prof. Dr. med. Kai von Klitzing, Leitender Arzt der Kinder- und Jugendpsychiatrischen Universitätsklinik und - poliklinik Basel, Psychoanalytiker SGPsa, und Frau Dr. phil. Sonja Perren, Forschungs- psychologin in Basel und Assistenzprofessorin für Jugendforschung in Zürich, die mich in allen wichtigen Abschnitten der wissenschaftlichen Arbeit fachlich und durch ihre Ermuti- gung ausstrahlende Grundhaltung entscheidend gefördert haben. Als herausragende Experten waren sie mit ihrer Kompetenz zu anschaulichen Darstellungen und Analysen methodischer Zusammenhänge und mit ihrer Klarheit bei der Verwendung der testtheo-retischen Begriff- lichkeit meine wichtigsten Gesprächspartner bei der Konzeptualisierung und Ausgestaltung der Arbeit.

Besonders wichtige Ansprechpartner zu ausgewählten Fragen des Q-Sorts, des Triadeninterviews und der Statistik waren mir Herr PD Dr. Psych. Blaise Pierrehumbert, Universität Lausanne, Frau Dr. phil. Agnes von Wyl, Forschungsmitarbeiterin in Basel, Frau Dr. phil. Heidi Simoni, Forschungsleiterin Marie-Meierhofer Institut für das Kind, Zürich, und Frau Dr. phil. Ilse Braun, Wettingen. Zusammen mit dem Raten der vielen Videoaufzeichnungen von Herrn lic.phil. Gabriel Pfändler, Herrn lic.phil. Felix Amsler und Frau lic.phil. Anne D’Aujourdhui haben sie nachhaltig zur inhaltlichen und methodischen Entwicklung und Bearbeitung des Messinstruments beigetragen.

Ein besonderer Dank gilt den vielen Eltern, die durch ihre Teilnahme an den Triaden- interviews und mit ihrem Einverständnis zu weiterführender Forschung anhand der Videoauf- zeichnungen diese Arbeit erst ermöglichten. Sie gaben mir damit eine einzigartige Gelegen- heit zu einem vertieften Einblick in das wohl grösste aller menschlichen Wunder, das Werden einer Familie.

In den Jahren dieser polyadisch fruchtbaren Zusammenarbeit wurden meine Kenntnisse wissenschaftlichen Arbeitens und mein Verständnis für die Vielfalt triadischer Beziehungsentwicklung in meinem privaten und beruflichen Leben entscheidend erweitert und verfeinert, wofür ich allen sehr dankbar bin.

Zürich, 6. Januar 2006

ZUSAMMENFASSUNG

Die Generierung, Ueberprüfung und Optimierung des TRI-Q-Sorts als standardisiertes, ökonomisches Auswerteverfahren zum Triadeninterview von Klitzings für die Einschät- zung triadisch elterlicher Kapazität hinsichtlich deren Bedeutung für die psychische Ent- wicklung des Kindes wurde in der vorliegenden Arbeit in drei Etappen vorgenommen. In den Vorstudien zum TRI-Q-Sort wurde in Zusammenarbeit mit den Triadeninterview-Experten das TRI-Q-Sort Itemsample in seiner Grundstruktur generiert. Eine erste Erprobung des TRI- Q-Sorts erfolgte in der Pilotstudie mittels eines Triadeninterview-Video-Ratings anhand einer kleinen Stichprobe durch zwei unabhängige Rater . Abschliessend wurde der TRI-Q-Sort in der Hauptstudie an einer heterogenen Eichstichprobe von 78 Triadeninterview-Videos durch dieselben Rater auf sein Testgüte überprüft und itemanalytisch und bezüglich Objektivität optimiert. Mit dem TRI-Q-Sort liegt nun ein reliables und valides Test- und Auswertungsver- fahren zum Triadeninterview von Klitzings für den Einsatz in der Forschung vor. Die An- wendung des TRI-Q-Sorts in der Routinediagnostik der Prävention bedingt noch die Erfül- lung der idealen Testgütekriterien. Es wird davon ausgegangen, dass die Nachweise dazu mit der vorliegenden TRI-Q-Sort Final Version erbracht werden können.

Parallel zur Generierung des TRI-Q-Sorts wurden drei methodische Neuerungen für den Bereich der Q-Sort Testentwicklung erarbeitet. Als erstes konnten aufgrund der spezifi- schen Konzeptualisierung des TRI-Q-Sort mit einem paritär bipolaren und deshalb rekodier- baren Itemsample erstmalig für einen Q-Sort die Test- und Item-Homogenität wie auch die Trennschärfe berechnet werden. Die neu entwickelte Adaptation dieser traditionellen Test- prüfmethoden auf das Q-Sort Verfahren ermöglicht es künftig, einen Q-Sort ebenso wie ein traditionell entwickeltes Testverfahren einer unabdingbaren, wissenschaftlich überprüfbaren Itemanalyse zu unterziehen. Ebenfalls erstmalig in der Domäne des Q-Sort wird zum zweiten dank der Konzeptionalisierung des TRI-Q Sort mit 60 objektiven, homogenen und validen Items und einem hälftig aufteilbaren TRI-Q-Sort Profil auf der Basis eines normierten Ratings mittels Experten-Ideal-Profil künftig eine Reliabilitätsprüfung des TRI-Q-Sort Itemsamples mit einem TRI-Q-Sort Paralleltest hinsichtlich Aequivalenz durchführbar, zusätzlich zur Prü- fung der Stabilität mittels Retest und der Konsistenzanalyse mittels Homogenitätsprüfung. Die dritte Neuerung entstand durch die Evaluation der TRI-Q-Sort Testnormierung mittels Cut-Off-Werten zu den TRI-Q-Scores. Diese Methode der Q-Sort Normierung unterscheidet sich von den bisherigen Verfahren mittels Q-Sort Prototypen in der Q-Sort Forschung. Weite- re Untersuchungen werden zeigen, welches Verfahren sich als das geeignetere erweisen wird.

Entwicklung und Evaluation des TRI-Q-Sort (Triadeninterview Q-Sort) und Innovationen zu den Q-Sort Testgütemethoden

Fragestellung: Ziel dieser Arbeit war die Entwicklung und Evaluation eines standardisierten, ökonomischen Auswertungsinstruments zum Triadeninterview von Klitzings (1996) mit den fünf Dimensionen Dialog, Trilog, Flexibilität, Ambivalenz und Kohärenz. Auf der Theorieba- sis der triadisch elterlichen Kapazität (Bürgin 2000 und von Kliltzing 1996) sollte mit dem TRI-Q-Sort Beziehungseinstellungen und Beziehungsverhalten werdender Eltern bezüglich ihres Schutz- oder Risikofaktors für die psychische Entwicklung des erwarteten Kindes ein- schätzbar werden.

Methode: Der TRI-Q-Sort wurde mit 74 paritär verteilten Items zu den fünf Dimensionen und den beiden Schutz- und Risikofaktoren um die inhaltliche, bipolare Null-Achse des vor- gegebenen Q-Sort-Normalverteilungsprofils generiert und anhand des Expertenprofils veran- kert. Nach der Expertenbeurteilung wurde er an 20 Triadeninterview-Videos der Untersu- chung von Klitzings (1996) erprobt. Die Evaluation der TRI-Q-Sort Testgüte erfolgte durch ein normiertes Rating zweier unabhängiger Rater an einer heterogenen Eichstichprobe von 78 Triadeninterview-Videos mit Ein- und Paar-Eltern aus der Untersuchung Simonis (1996).

Ergebnisse: Die spezifische Testkonstruktion des TRI-Q-Sorts ermöglichte eine Rekodierung der Risiko-Items und damit individuelle Mittelwertsberechnungen zu den TRI-Q-Sort Ein- schätzungen. Auf dieser Datenbasis wurden für einen Q-Sort innovativ traditionelle, statisti- sche Testgüteverfahren zur Objektivität (Interraterkorrelation; Testnormierung), Reliabilität (Inter-Item-Konsistenz; Paralleltest) und Validität (Kriteriumsvalidität) entwickelt und durch- geführt und mit einer Itemanalyse (Itemschwierigkeit, Trennschärfe und Homogenität) abge- schlossen. Objektivität: r = 0.7 - 0.9 bei Ein- und Paar-Eltern-Triadeninterviews; Testnor- mierung noch ausstehend. Reliabilität: Inter-Item-Konsistenz x = .223 und x = .211 mit Al- pha .958 und .955. Validität: r = .439** - .534** (Pearson) mit ICC .769; gemäss Posthoc Vergleichen nach LSD werden Eltern mit tiefer triadischer Kapazität von denjenigen mit ho- her triadischer Kapazität signifikant und alle drei Gruppen mit F = 8.448*** und F = 14.606*** sehr gut unterschieden. Anhand der Itemanalyse wurden die TRI-Q-Sort Items optimiert und 14 Items selektioniert.

Der TRI-Q-Sort ist im Vergleich zur halbstandardisierten Auswertungsmethode von Klitzings ein mehrfach ökonomischeres Auswertungsinstrument.

Schlussfolgerungen: Der TRI-Q-Sort hat eine gute Testgüte und kann für Forschungszwecke eingesetzt werden. Für seine Anwendung in der Präventionsdiagnostik bedarf es noch einer Testnormierung in einer weiteren Untersuchung mit dem TRI-Q-Sort Final Version. Keywords: TRI-Q-Sort (Triadeninterview-Q-Sort); Innovationen der Q-Sort Methodik (Test- konstruktion, Testgüteprüfung); Triadisch elterliche Kapazität; Prävention psychischer Ent- wicklungsstörungen - (Engl.: TRI-Q-Sort (Triadic-Interview-Q-Sort); Innovations in Q-Sort Methods (construction, quality testing); Triadic capacity of parents; Prevention of psycholo- gical development disturbancies

EINLEITUNG

Demografische Vergleiche in der Kinder- und Jugendpsychiatrischen Universitätspoliklinik Basel, geleitet von Prof. Dr. med. Dieter Bürgin und Prof. Dr. med. Kai von Klitzing, zeigten auf, dass überwiegend Kinder aus Familien ohne oder nur mit einem Elternteil in der Poliklinik Hilfe suchten. In der schweizerischen Gesamtbevölkerung macht der Anteil dieser Kinder jedoch nur einen geringen Prozentsatz aus. Psychische Störungen haben ihre Wurzeln in biologischen Gegebenheiten, im kindlichen Temperament und in elterlichen Einstellungen. Die Vernetzung dieser Faktoren ist die weitaus häufigste Ursache. Beziehungen bilden ab Geburt den Bereich, in dem sich die Dysregulationen abspielen. Hier werden sie am ehesten sichtbar und können deshalb auch therapeutisch angegangen werden.

Den Längsschnittuntersuchungen von Bürgin (2000) und von Klitzing et al (1999) zufolge kann der Beginn von Beziehungsstörungen beim Kind im familiären Bezugsrahmen bereits im ersten Lebensquartal einsetzen. Sind das elterliche Beziehungsverhalten und die elterlichen Einstellungen durch mangelnde psychische Integration konfliktualisiert, ergibt sich mit dem Hinzukommen des Kindes als Drittem die Tendenz, notbehelfsmässig zu zweit ausschliessen- de Bündnisse gegen die dritte Person - den Partner, die Partnerin, das Kind und nachfolgende Geschwister - zu bilden. Damit ist die triadische Kapazität der Eltern beeinträchtigt. Triadisch ausschliessendes, elterliches Konfliktverhalten prägt die emotionale und kognitive Bahnung des Kindes während der impliziten Gedächtnisentwicklung in der ersten Lebensphase grund- legend. Die psychische Entwicklung seiner Selbstregulation, Fremdwahrnehmung und Anpas- sung und später seiner Selbstreflexion, Selbststeuerung und seines Sozialverhaltens werden durch mangelnde triadische Beziehungskapazität der Eltern geschwächt. Zwecks Prävention einer psychopathologischen Kindesentwicklung, beginnend mit Regulationsstörungen des Schlaf-, Trink- und Schreiverhaltens und sich fortsetzend mit Aufmerksamkeits-, Anpas- sungs- und Hyperaktivitätsstörungen, sind daher eine Frühdiagnostik der triadischen elterli- chen Beziehungsfähigkeit und familientherapeutische Interventionen in den ersten Lebens- monaten des Kindes wichtig.

Kai von Klitzing hat mit dem Triadeninterview zur Einschätzung der familiären Beziehungsfähigkeit werdender Eltern und mit der Einrichtung einer Schrei-Sprechstunde für Babies mit Regulationsstörungen die geeigneten Mittel geschaffen, um Familien im Umgang mit ihrem Kind zu helfen und damit einem schädigenden Prägungseffekt in der ersten Lebenszeit ihres Kindes entgegenzuwirken.

In der vorliegenden Arbeit ging es darum, ein standardisiertes Auswertungsverfahren zum Triadeninterview von Klitzings (1996) zu entwickeln - den TRI-Q-Sort. Er soll die bisher halbstandardisierte, personal- und zeitaufwändige Auswertungsmethode ersetzen, damit das Triadeninterview in Forschung und Prävention zweckdienlicher und ökonomischer angewendet werden kann. Der TRI-Q-Sort wurde an Videos von 78 Triadeninterviews mit werdenden Ein- und Paar-Eltern aus Untersuchungen von Klitzings (1996) und Simonis (1996) der Längsschnittstudie Bürgins (2000) durchgeführt.

Im Theorie-Teil der Arbeit wird zum einen das Triadeninterview im Zusammenhang mit dem dem Konzept triadisch elterlicher Kapazität und ihrer Wirkung auf die Kindesentwicklung erläutert und zum andern die Q-Sort Methode als Einschätzungs- und Auswertungsverfahren von Stephenson dargestellt. Beide Teile bilden die inhaltliche und methodische Grundlage für die Konzeptionalisierung des TRI-Q-Sort, welche in die Test-Generierung integriert werden mussten:

Dies sind in Kapitel 1.1 die triadische Beziehungskapazität von Eltern in seinen verschiede- nen Ausprägungen als Schutz-, beziehungsweise Risiko-Faktoren für die kindliche Entwick- lung; in Kapitel 1.2 die inhaltliche Struktur des Triadeninterviews mit den fünf Dimensionen Dialog, Trilog, Flexibilität, Ambivalenz und Kohärenz; in Kapitel 1.3 die Grundprinzipien der Q-Sort Methode mit erzwungener Item-Normalverteilung und entsprechenden Itemformulie- rungsregeln. In einer Analyse der Q-Sort Gütekriterien wird die Q-Sort Methode als standar- disiertes Messverfahren anhand der Q-Sort Literatur hinsichtlich ihrer bisherigen Testgüte- Nachweise durchleuchtet. Essentielle traditionelle Testgüte-Prüfmethoden, welche bis anhin in Q-Sort Verfahren nicht zur Anwendung kamen, werden für die Testgüteprüfung des TRI- Q-Sorts geplant.

Im Methoden-Teil der Arbeit wird in Kapitel 2.1 die Zielsetzung festgelegt, einen TRI-Q-Sort mit nachweisbarer, traditioneller Testgüte zu generieren. In Kapitel 2.2 werden drei Fragestellungen zur TRI-Q-Sort Generierung, zu den TRI-Q-Sort Gütekriterien und zur TRI-Q-Sort Itemanalyse formuliert, die Triadeninterview-Video-Stichprobe vorgestellt und die Durchführung der TRI-Q-Sort Entwicklung und -Prüfung im Versuchsplan aufgezeigt.

Die Resultate zum TRI-Q-Sort werden im dritten Teil der Arbeit ausführlich dargestellt und im vierten Teil zusammenfassend diskutiert.

1 THEORIE

1.1 TRIADISCHE ELTERLICHE KAPAZITÄT UND KINDESENTWICKLUNG

Die triadische elterliche Kapazität als Konzept von Bürgin und von Klitzing (1998) ist eine Weiterentwicklung und Synthese der psychoanalytischen Paradigmen der Triangulierung (Abelin 1975) als entwicklungspsychologischer Reifungsschritt einerseits und der Triade (Bucholz 1990) als familiendynamische Beziehungsstruktur andererseits. Die theoretischen und empirischen Grundlagen und der Bedeutungsgehalt des Konzepts triadische elterliche Kapazität werden nachfolgend vorgestellt.

1.1.1 Das Triadische in der entwicklungspsychologischen Forschung

Der Psychoanalytiker Winnicott war in den 50-er Jahren der erste und für lange Zeit der einzige Forscher, welcher der Entwicklung der triadischen Beziehungsfähigkeit des Kindes in den ersten Lebensmonaten Bedeutung zumass. Bereits 1941 hält er fest: „Dieser Schritt ... in der Entwicklung des Kindes, der es befähigt, mit seiner Beziehung zu zwei ihm wichtigen Menschen, seinen Eltern, zur gleichen Zeit umzugehen, ist sehr wichtig Solange das Kind ihn nicht getan hat, kann es seinen Platz in der Familie oder in einer sozialen Gruppe nicht zufrieden stellend einnehmen Dieser wichtige Schritt wird innerhalb des ersten Lebensjahres zum ersten Mal vollzogen.“ (Winnicott 1941, S. 47)

Dessen ungeachtet konzeptionalisiert Mahler (1968) in ihren Untersuchungen zur Symbiose und Individuation des Kindes den Vater als Dritten erst ab dem zweiten Lebensjahr. Sie misst ihm als Garant für die Individuationsentwicklung und als Retter gegen den regressiven, psychopathologisch disponierenden Sog der Symbiose mit der wiederverschlingenden Mutter eine Bedeutung von entscheidender Tragweite für eine gesunde psychische Entwicklung des Kindes zu. Denn „schwache und begrenzte Beziehungsangebote führen zur Schwächung und zum Scheitern der Symbolisierung, die in Wechselbeziehung eingebunden ist“ (Leber 1995).

1971 entdeckt Abelin, ein Forschungsmitarbeiter von Mahler, bereits während der symbioti- schen Entwicklungsphase im ersten Lebensjahr den Beginn einer spezifischen Beziehungs- aufnahme des Kindes zum Vater. Mahlers Konzept erweiternd erstellt er das Konzept der „frühen Triangulierung“ (Abelin 1975) als Prozess, welcher der psychischen Organisation des Kindes ermöglicht, sich vom Niveau der agierten, sensomotorischen Beziehung hin zu symbolisierten inneren Vorstellungen von sich selbst und den Bezugspersonen zu entwickeln (Fonagy 1998 und 2004).

In der psychoanalytischen und entwicklungspsychologischen Forschung erhält das Konzept der Triangulierung erst wieder ab 1980 durch Rotmann (1980), Stork (1986), Buchholz (1990), Bürgin (1998), Dammasch & Metzger (1999), Fivaz-Depeursinge (2001) und von Klitzing (1994, 1996, 1999, 2002) weitere Ausdifferenzierungen. Hiervon sind insbesondere die Arbeiten von Fivaz-Depeursinge und von Bürgin und von Klitzing zum Triadischen in der Kindesentwicklung von herausragender Bedeutung, da sie Winnicotts phänomenologisch em- pirische Befunde zur triadischen Beziehungsentwicklung im ersten Lebensjahr erstmals wis- senschaftlich überprüfbar bestätigen.

Fivaz-Depeursinge (2001) hat mit der Erfindung des „Jeux à trois“, dem einzigen, standar- disierten Untersuchungsinstrument für triadische Eltern-Kind-Beziehungen ab den ersten Le- bensmonaten, den Nachweis erbracht, dass sich durch das Beziehungserleben mit den Eltern beim Kind bereits ab dem dritten Lebensmonat erste Muster der individuellen triadi- schen Beziehungsgestaltung als Schema im impliziten, prozeduralen, dem Bewusstsein nicht zugänglichen Gedächtnis konstituieren. Dieses Ergebnis deckt sich mit den von Stern (1985) erforschten generalisierten Interaktions-Repräsentanzen vom zweiten bis achten Le- bensmonat, den sogenannten RIG’s (represented interactions generalized). Piaget (1954) defi- nierte es in der sensomotorischen Entwicklungsphase als Schema, als erworbene Reaktions- muster des Kindes auf seine Eltern, welche zur Wiederholung und Generalisierung tendieren.

Neueste Forschungsergebnisse (Lewis 1988, Fonagy 1998 und 2004, Fivaz-Depeursinge 2001, Grossmann 2004) weisen darauf hin, dass der Beginn von Beziehungsstörungen beim Kind im familiären Bezugsrahmen bereits im Beziehungsverhalten von werdenden Eltern vor der Geburt des Kindes wurzelt und ab dem ersten Lebensquartal einsetzt. Nach Schleske (1992) existiert das „phantasmatische Kind“ in den Vorstellungen der werdenden Eltern be- reits vor seiner Zeugung und kann zum Träger elterlicher positiver Idealisierungen und nega- tiver Projektionen werden. Insbesondere die intrapsychische Verleugnung und Abspaltung unerträglicher, aggressiver Erfahrungs- und Persönlichkeitsanteile der Eltern können dazu führen, dass diese abgespaltenen Anteile in einer Zwei-Personen-Beziehungsdynamik jeweils auf das Gegenüber übertragen und projiziert werden, damit individuell eine psychi- sche Entlastung erzielt werden kann. Die Paarbeziehung wird dadurch jedoch konfliktualisiert und der oder die Partner/in gar als Sündenbock bekämpft. Durch das Hinzukommen des Kindes als Drittem kommt es bei Eltern mit dieser schwachen psychischen Integration und mit dem Ziel einer individuellen psychischen Entlastung von unerträglichen, aggressiven Persönlichkeitsanteilen zu der Tendenz, zu zweit ausschliessende Bündnisse gegen die dritte Person - den Partner, die Partnerin oder das Kind - zu bilden. Derart konflikthaftes elterliches Beziehungsverhalten prägt das Kind psychisch während der impliziten Gedächtnisentwicklung nachhaltig in aggressivierten Gefühlszuständen und Beziehungsmustern und behindert es in der Entwicklung seiner Selbststeuerung, Fremdwahrnehmung, Selbstreflexion und im Sozialverhalten (Fonagy 1998).

Psychische Störungen können ihre Wurzeln in biologischen Gegebenheiten, im kindlichen Temperament, in elterlichen Einstellungen oder - bei weitem am häufigsten - in einer Ver- netzung dieser Aspekte haben. Die Beziehung ist jedoch der Bereich, in dem sich die Dysre- gulationen abspielen. Hier werden sie am ehesten sichtbar und können deshalb auch therapeu- tisch angegangen werden. Angesichts dieser grundlegenden ersten psychischen Prägung des Kindes durch die Elternbeziehungen in den ersten zwei bis drei Lebensmonaten werden zwecks Prävention einer psychopathologischen Kindesentwicklung eine Frühdiagnostik der triadischen elterlichen Beziehungsfähigkeit (von Klitzing 1996) und familienthera- peutische Interventionen ab Geburt des Kindes (von Klitzing 2002 a)) eminent wichtig.

1.1.2 Konzepte und Untersuchungen von Bürgin und von Klitzing

In der von Bürgin und von Klitzing geleiteten Kinder- und Jugendpsychiatrischen Universitäts-Poliklinik Basel lebten 1995 von den über 800 Kinderpatienten 65% der Kinder in Familien mit keinem oder nur mit einem Elternteil, hauptsächlich der Mutter. In der schweizerischen Gesamtbevölkerung entsprachen die Kein- oder Ein-Eltern-Kinder jedoch nur 13%. Bürgin und von Klitzing nahmen an, dass diese Vaterlosigkeit eine ursächliche Bedeutung für die Störung hat, die ein Kind die Behandlung führt.

Ausgehend von Mahler und Abelin wurde vermutet, dass die Anwesenheit und beziehungs- mässige Verfügbarkeit des Vaters oder eines bedeutungsvollen Dritten als Bezugsperson für das Kind zusammen mit der Mutter für die kindliche Entwicklung eine Ressource, bezie- hungsweise einen protektiven Faktor darstellt. Demgegenüber würde die Abwesenheit oder beziehungsmässige Nicht-Verbundenheit des Vaters oder eines bedeutungsvollen Dritten als Bezugsperson für das Kind zusammen mit der Mutter für die kindliche Entwicklung eine Erschwernis, beziehungsweise einen Risikofaktor bedeuten.

1997 - nach Vorstudien seit 1992 - starteten Bürgin und von Klitzing mit der Basler Forschungsgruppe „Frühe Kindesentwicklung und Familienbeziehung“, unterstützt vom schweizerischen Nationalfonds und im Austausch mit Forschungsteams in Genf (Fivaz- Depeursinge), Frankreich (Lamour), Deutschland (Papousek), England (Fonagy) und in den USA (Emde) - erstmalig in der psychoanalytisch-entwicklungspsychologischen Forschung - mit einer Langzeitstudie zur triadischen elterlichen Kapazität mit Einbezug des Vaters und mit Beginn vor der Geburt des ersten Kindes.

Ihr Interesse konzentrierte sich auf die Fragestellung, ob bei werdenden Eltern bereits vor der Geburt auf interpersonal-verhaltensbezogener und intrapsychisch-vorstellungsbezogener Ebe- ne eine triadische Beziehungskapazität erfasst und nach der Geburt mit dem Verlauf der kind- lichen Entwicklung in Bezug gesetzt werden kann. Mit dem Begriff „Kapazität“ anstelle von „Kompetenz“ ist eine Beziehungsfähigkeit gemeint, die sich je nach Kontext unterschiedlich im Beziehungsverhalten und in den Beziehungsvorstellungen manifestiert (Bürgin 1998, von Klitzing 1998).

Triadische elterliche Kapazität hat ihre Wurzeln in vergangenen Beziehungserfahrungen der Eltern (meistens während der eigenen Kindheit), und sie wird durch aktuelle Beziehungs- erfahrungen (meistens in der elterlichen Partnerschaft) immer wieder umgearbeitet. Sie ist eine psychische Fähigkeit, mit der werdende und faktische Eltern ihre familiären Beziehun- gen antizipieren und konzeptionalisieren und ihr Kind als Drittes sowohl in ihren Vorstel- lungen als auch in ihrem Verhalten in die familiäre Beziehungswelt integrieren, ohne sich selbst oder den/die Partner/in auszuschliessen (Bürgin 1998, von Klitzing 1998).

Diese elterlich vorgegebene Beziehungswelt bildet einen psychosozialen Entwicklungsraum für das Kind, in den das Kind hineingeboren wird. Er beinhaltet für die Kindesentwicklung ab den ersten Lebensmonaten sowohl Chancen als auch Risiken, indem die triadische elterliche Kapazität die Entwicklung der äusseren und inneren Beziehungswelt des Kindes entscheidend beeinflusst. Denn die Fähigkeit des Kindes zu emotionaler Regulation und kognitiver und sozialer Kompetenz entsteht und entwickelt sich innerhalb des Kontextes interpersona- ler Bedeutungen, welche in interaktiv-emotionalen Austauschvorgängen zwischen dem Kind und seinen primären Bezugspersonen vermittelt werden (Bürgin 1998, von Klitzing 1998).

Laut Bürgin (1998, S. 31) ist die triadische Beziehung zwischen Kind, Mutter und Vater in der Innenwelt des Kindes von Anfang an potentiell vorhanden. Im Verlaufe der Indi- viduationsentwicklung nach Mahler, welche mit Unterscheidungsprozessen der Selbst- Repräsentanzen von den elterlichen Objekt-Repräsentanzen einhergeht, wird die triadische angelegte psychische Beziehungswelt des Kindes erst allmählich erlebnisbezogen belebt und im Kontakt mit den Eltern spezifisch ausgefüllt. Wird nach dem Erreichen der verbalen Phase während der Individuationsphase und nach weiteren Entwicklungsschritten die prä-ödipale Dreisamkeit mit den Triebimpulsen der infantilen Sexualität aufgeladen, so bildet sich die komplexere Form der ödipalen Dreisamkeit. Für eine bestmögliche psychische Entwicklung des Kindes ist es entscheidend, ob die Eltern zur triangulären Beziehungsgestaltung fähig sind. Wenn nicht, gerät das Kind in eine präödipale und ödipale Beziehungsdynamik, in der es dauernd in eine Fusion mit einem Elternteil hineingezogen und von der Beziehung zum andern Elternteil abgeschnitten wird. Eine elterliche Verbündungs- und Ausschluss- Dynamik mit dem Kind behindert es in der Lösung seiner Individuations- und ödipalen Konlikte und dadurch in seiner emotionalen, kognitiven und sozialen Entwicklung. Laut von Klitzing (2002 b)) sind die frühe Triangulierung des Kindes und die triadische Bezie- hungskapazität von Eltern somit DIE Voraussetzungen für eine gelingende Individuati- ons- und ödipale Entwicklung.

Von Klitzing (2002 b), S. 880) hält hierzu die Längsschnittstudie vorläufig zusammenfassend fest:

„Die Ergebnisse unserer Studien unterstützen weitgehend die psychoanalytischen Konzepte, in denen die psychischen Entwicklungen von Kindern von Anbeginn an als Triangulierungsprozesse verstanden werden. Die Sichtweise, nach der die präödipa- le Entwicklung durch dyadische Beziehungsprozesse geprägt ist und erst in der ödipalen Entwicklung die Triade eine Rolle zu spielen beginnt, hat ausgedient Anstatt die Prä-Oedipalität als eine Entwicklungsphase zu sehen, in der nur die Dyade eine Rolle spielt, sollte der Oedipus-Komplex als eine Kulminationsphase im Kontinuum innerer und äusserer triadischer Entwicklungserfahrungen kon- zipiert werden.“ (Hervorhebungen von M.V.)

1.1.3 Hinweise zur Generierung des TRI-Q-Sort:

Die Items des TRI-Q-Sort sind so zu gestalten, dass die triadische Kapazität werdender Eltern in geäusserten Beziehungs-Vorstellungen und beobachtbarem Beziehungsverhalten eingeschätzt und in ihrer möglichen Auswirkung als Risiko- oder Schutz-Faktoren für die Kindesentwicklung angenommen werden können.

1.2 DAS TRIADENINTERVIEW

Ausgangspunkt der Längsschnittuntersuchung von Bürgin und von Klitzing war das „Basler Elterninterview“ (von Klitzing 1996) - später „Triadeninterview“ genannt. Mit diesem Instrument untersuchte von Kitzing et al. (1999) in mehreren Studien in halbstrukturierten, tiefenpsychologisch orientierten Paarinterviews Ein-Eltern und Paar-Eltern im letzten Trimester der Schwangerschaft mit dem erstgeborenen Kind zu deren triadischer elterlicher Kapazität. Der Interviewer spricht darin mit den werdenden Eltern entlang einem Gesprächs- leitfaden über deren eigene Kindheitsgeschichte und ihre Beziehung zu den Herkunftseltern, die Geschichte und das Erleben ihrer Partnerschaft sowie über ihre inneren Bilder und Phan- tasien vom zukünftigen Kind.

Die ca. 120 durchschnittlich zweistündigen Interviews mit Paar-Eltern und Ein-Eltern wurden auf Video aufgezeichnet. Diese wurden von zwei bis drei geschulten Klinikern nach intensi- vem Training und nebst Supervision mit durchschnittlicher Dauer von anderthalb Stunden ausgewertet. Die triadische Kapazität wurde in fünf Dimensionen mit einer Fünferskala anhand eines halbstandardisierten, inhaltsanalytischen Auswertungsmanuals quantifi- ziert. Diese fünf Dimensionen wurden jeweils für Vater und Mutter getrennt und für das elter- liche Paar als Ganzes bewertet. Die summierten und gemittelten Werte der Einschätzungen zu den fünf Dimensionen wurden in einer Gesamtbeurteilung zur Bewertung der triadischen el- terlichen Kapazität zusammengefasst.

Der Kodiervorgang orientierte sich explizit am Inhalt des Elterngesprächs, an den Elternbe- obachtungen während des Interviews und an den subjektiven Eindrücken der Interviewer und Rater. Der Einbezug der emotionalen Reaktionen von Interviewer und Rater ist kein üb- liches empirisches, sondern ein phänomenologisch psychoanalytisches Forschungsverfahren. Es trägt der Tatsache Rechnung, dass es unmöglich ist, die Qualität der inneren und äusseren Beziehungen ohne die subjektiv erlebten Gefühle des Beobachters als „Empfänger“ zu erfas- sen. Entscheidend für eine valide Einschätzung der Versuchspersonen ist daher nicht das Um- gehen dieses subjektiven Teils des Messverfahrens, sondern dass die von den Versuchsperso- nen ausgelösten Empfindungsreaktionen von den Ratern erkannt und in die Beurteilung mit einbezogen werden.

Mit den Gesamtbeurteilungen wurde festgehalten, in welchem Ausmass die Eltern (jeder El- ternteil separat und das Paar als Ganzes) potentiell über innere und partnerschafltiche Voraus- setzungen verfügen, das Kind in ihre Beziehungswelt zu integrieren und mit ihm die Partner- schaft als Eltern befriedigend fortzusetzen. Mittels Aussenkriterien - FPI-Fragebogen und Giessen-Test - wurden die Ergebnisse validiert und für weitere Analysen in den anschlies- senden Erhebungen der Langzeitstudie verwendet (Simoni 1996, von Klitzing 1996).

Die fünf Dimensionen der triadischen elterlichen Kapazität im Triadeninterview (Bürgin: SNF-Bericht 2000, 3.12):

1. Persönlichkeit und Partnerschaftsdynamik Partnerbeziehung mit Akzeptanz der Persönlichkeitsunterschiede und mit der Fähigkeit zu Ambivalenz in der Beziehung zum Partner versus Neigung zu Projektionen und psychischer Fusion in der Partnerschaft
2. Flexibilität von positiven und negativen Vorstellungen versus Rigidität von einseiti- gen Vorstellungen zum zukünftigen Kind
3. Triangularität der familiären Vorstellungen und des Gesprächsverhaltens im Inter- view versus Verbündung zu zweit mit Ausschluss einer Drittperson
4. Dialogfähigkeit der Eltern zum ungeborenen Kind und insgesamt im Interview- Gesprächsverhalten versus wenig Austausch zwischen den Eltern
5. Kontinuität der Beziehungserfahrungen und Kohärenz der Erzählungen zur eigenen Herkunftsgeschichte und im Interview-Gesprächsverhalten versus Diskontinuität in den Beziehungserfahrungen aufgrund unverarbeiteter, ungelöster Konflikte (vgl. auch von Klitzing (1996, Zusatzband): Einschätzungsskalen für Dimensionen 1-5)

Nach von Klitzing greifen die fünf Dimensionen „einzelne Aspekte eines komplexen Bezie- hungsgefüges auf. Es muss davon ausgegangen werden, dass all diese Aspekte untereinander in einem dynamischen Zusammenhang stehen. So hängen beispielsweise die intrapsychischen strukturellen Voraussetzungen bei beiden Eltern mit ihren Beziehungserfahrungen in der ei- genen Kindheit zusammen und haben deshalb einen grossen Einfluss auf die partnerschaftli- che Beziehung. Zeichnet sich die Partnerschaft durch eine ausgewogene Beziehungsdynamik aus, so erleichtert das eine flexible Ausgestaltung der Vorstellungen vom Kind, auch im Zusammenhang mit dem Partner (trianguläres Niveau), was wiederum eine Rückwirkung auf die Partnerschaft hat. Auch die Dialogfähigkeit und -bereitschaft in der Partnerschaft steht in einer wechselseitigen Abhängigkeit zu den vorher genannten Bereichen. Hiermit in engem Zusammenhang steht das Einbeziehen des Kindes als Dialogpartner. Die reale Persönlichkeit des Kindes, wie sie sich im Laufe der Entwicklung zunehmend differenzierter gestaltet, hat umgekehrt auch einen Einfluss auf die inneren Bilder der Eltern vom Kind, welche sich ja auch nach der Geburt weiterentwickeln“ (von Klitzing 1996, S. 8-9).

1.2.1 Ergebnisse

Das Triadeninterview wurde in modifizierter Form mit dem anwesenden Kind nach dem ers- ten Lebensmonat und mit dem Kind von 12 Monaten wiederholt. Die Inter-Rater-Reliabilität von 0.69 im Triadeninterview vor der Geburt, von 0.82 einen Monat und von 0.75 ein Jahr nach der Geburt sind adäquat bis zufriedenstellend. Die Ergebnisse zur triadischen elterlichen Kapazität im pränatalen Triadeninterview korrelieren zum Triadeninterview mit den Eltern des einjährigen Kindes hochsignifikant. Das heisst, mittels Triadeninterview ist triadische elterliche Kapazität bereits in der Schwangerschaft reliabel und valide evaluierbar. Es wurde ausserdem deutlich, dass ein hohes Mass an durchgearbeiteten und gelösten entwick- lungsspezifischen triadischen Konflikten (speziell in den Beziehungen zu den Herkunftsfami- lien) eine wichtige Voraussetzung für die Bildung von triadischen Beziehungen mit dem Part- ner und dem Kind bilden.

Die Bindungsforscherin Main hat hierzu bereits 1985 empirisch nachgewiesen, dass es keine einfache lineare Verknüpfung zwischen „guten Kindheitserfahrungen“ und späterer „guter Elternschaft“ gibt. Auch negative Beziehungserfahrungen in der Familiengschichte führen nicht automatisch zu unlösbaren Problemen mit den eigenen Kindern. Wichtiger ist die narra- tive Kontinuität in den Beziehungserfahrungen. Das heisst, entscheidend für eine gute El- ternschaft ist nicht das Ausmass entstandener intrapsychischer und interpersoneller Konflikte. Entscheidend ist, ob sie durchgearbeitet und damit in die eigene Persönlich- keit integriert werden konnten. Die emotionale Verarbeitung von eigenen Kindheitskonflik- ten kann trotz ausgesprochen negativer Kindheitserfahrung in ein kohärentes Selbstgefühl münden. Gerade dies macht es möglich, die Konflikte und Probleme anzugehen, die übli- cherweise in der Beziehung zu den eigenen Kindern aufkommen können.

Bei Eltern mit genügender aber vorübergehend geschwächter triadischer Kapazität in einer erschwerten Eingewöhnungszeit mit dem Kind besteht insbesondere während der ersten Säuglingszeit ein familientherapeutischer Behandlungsbedarf zur Behebung der situativ bedingten, psychischen Ueberlastung der Eltern und der damit einhergehenden familiären Konflikte. Damit kann eine mögliche psychopathologisch induzierende Prägung des Kindes während der ersten Lebensmonate präventiv behoben werden. Demgegenüber tendierten je- doch in den pränatal vorgestellten Beziehungen unhinterfragte selbst-, partner- oder kind- ausschliessende Phantasien bei beiden Eltern nach der Geburt des Kindes rigid zu werden und nur schwer durch reale, positive Alltagserfahrungen mit dem Kind veränderbar zu sein.

Explorativ wurde in der Längsschnittstudie zudem untersucht, welchen Einfluss die pränatal eingeschätzten Organisation der inneren Vorstellungswelt beider Eltern auf die Fähigkeit des Säuglings hatte, eine Dreierinteraktion überhaupt einzugehen. Dies führte zum unterwarteten Resultat, dass die Trilogfähigkeit des Säuglings (das heisst, die Fähigkeit zu gleichzeitiger Bezogenheit auf beide Eltern) besonders mit den Repräsentanzen des Vaters zusammenhing (r=.56; p > 0.001). Je mehr der Vater bereits während der Schwangerschaft sich innerlich auf das Kind eingestellt und sich diesem gegenüber als eine relevante Bezugsperson antizipiert hatte, ohne dabei die Mutter innerlich auszuschliessen, und je mehr dies auf positiven Identifikationen mit seinen Eltern beruhte, um so fähiger war das Kind im Alter von vier Monaten mit beiden Bezugspersonen ausgewogen Kontakt aufzunehmen.

Gemäss von Klitzing (2002) weisen die Ergebnisse der Längsschnittstudie bis dato darauf hin, dass diejenigen Eltern über eine bleibend gute triadische Kapazität verfügen, die bereits vor der Geburt des Kindes auf einer phantasmatischen Ebene das kommende Kind in ihre innere und äussere triadische Beziehungswelt während der Schwangerschaft integrieren konn- ten - das heisst ohne Ausschlusstendenzen von sich selbst, dem Kind oder gegenüber dem Beziehungspartner.

Insgesamt entstammen die Längsschnittergebnisse allerdings einer kleinen selektionierten Stichprobe und sind noch nicht in grösseren Stichproben repliziert worden. Für die Untersu- chung mit einer grösseren Stichprobe ist eine standardisierte und ökonomischere Aus- wertungsmethode notwendig. Dies soll mit dem TRI-Q-Sort ermöglicht werden.

1.2.2 Hinweise zur Generierung des TRI-Q-Sort:

Für die Entwicklung des TRI-Q-Sort sind folgende Inhalte und Merkmale der halbstandardisierten Triadeninterview-Auswertemethode zu berücksichtigen:

a) Der TRI-Q-Sort beinhaltet thematisch die Fragestellungen des Triadeninter- view-Leitfadens für Ein-Eltern- und Paar-Eltern-Interviews.
b) Der TRI-Q-Sort braucht theoriegeleitete Iteminhalte zur triadischen elterlichen Kapazität auf der Ebene von Vorstellungen und Verhalten eingeteilt in fünf Dimensionen:
1 Paardynamik, Persönlichkeit - Ambivalenz
2 Flexibilität
3 Triangularität
4 Dialog
5 Kontinuität - Kohärenz
c) Sind emotionalen Reaktionen von Interviewer und Rater als reliabel und valide Hinweise für die triadische elterliche Kapazität im TRI-Q-Sort messbar?
d) Die Halbstandardisierte Auswertemethode ist zu standardiesieren.
e) Die Aussenkriteriums-Validierung ist gesichert.
f) Die Interview-Auswertungsdauer von 90 Minuten ist zu reduzieren.

1.3 Q-SORT-VERFAHREN UND TESTENTWICKLUNG

Das Q-Sort-Verfahren wurde von Stephenson 1935 und 1953 als standardisierte Auswerte- methode für ipsative Daten von Persönlichkeitseinschätzungen entwickelt. Laut Stephen- son (1953, S. 344 ff) vergleicht der Q-Sort Individuen (anstatt Tests) mit einer inversen Fak- torenalanyse.

„ Factor analysis in the past ... has concerned itself with individual differencies; its variables have been estimates or tests, its populations are groups of persons. The analysis I am to describe serves a very different, yet complementary purpose; its variables are persons, whilst its populations are groups of tests or estimates. This very simple inversion of all previous factor theorems and techniques leads unexpectedly to many new fields of experimental work. “

Jones (1990, S. 1988), der zu den gegenwärtigen Forschern mit der Q-Sort-Methode zählt, hielt zur Entwicklungsmethodik eines Q-Sorts fest, „ there exists no standard Q-set ; rather, the goal is to provide a set of items that can capture as comprehensively as possible the critical dimensions of variation among cases under study. “

Der Q-Sort fand in den USA und in Deutschland ursprünglich v.a. als Selbsteinschätzungs- verfahren in der demografischen Meinungsforschung mit unterschiedlichstem Inhalt Ver- wendung.

Nach dem zweiten Weltkrieg wurden mit diesem Verfahren zu den Selbst- auch Fremdeinschätzungen erhoben und miteinander korreliert. Für spezifische klinische Fragestellungen mit oder ohne Theoriebezug wurden verschiedene Q-Sorts als standardisierte Evaluationsinstrumente für Moment- und Verlaufsanalysen zur Ueberprüfung sowohl von inter- als auch intraindividuellen Differenzen entwickelt. Die bekanntesten Beispiele sind:

Beispiele: Nicht-theoriegeleitete Q-Sorts:

1 The California Q-Sort (Block 1961)
2 The Psychotherapy Process Q-Set (Jones 1985)

Theoriegeleitete Q-Sorts:

3 The Attachment Interview Q-Set (Kobak 1993; In: Zimmermann 1994)
4 The Riverside Behavioral Q-Sort (Funder et al 2002)

1.3.1 Konstruktion eines Q-Sort

Die Konstruktion und die Struktur eines Q-Sorts als standardisiertes Testverfahren entsprechen in den Grundzügen der üblichen Testtheorie, weichen jedoch infolge der spezifischen Q- Sort Item-Verteilungsstruktur in entscheidenden Punkten davon ab. Dies bedingt ein modifiziertes Vorgehen für die Testentwicklung und -überprüfung des TRI-Q-Sort.

1.3.1.1 Q-Sort Struktur

Ein Q-Sort besteht aus einem Sample von Items. Anzahl und Sortiermodus der Items sind nach Pierrehumbert (2000) statistisch optimal mit 50-100 Items zu einer vorgegebenen Gauss’schen Normalverteilung (vgl. Rauchfleisch 1994, Abbildung 1) auf 9 bis 11 Kategorien mit mindestens 20-50 Versuchspersonen pro Eichstichprobe (Mowrer 1953; Block 1961). Nach Block sind bei 40 Versuchspersonen mit 100 Items auf 9 Kategorien 6.45 x 1085 Kombinationen möglich. Mit diesen Richtgrössen können für Anwendungsuntersuchungen sowohl Alpha- als auch Beta-Fehler bestmöglich minimiert werden.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Gauss'sche Normalverteilung und Skalierung (Rauchfleisch 1994, S. 82)

Durch die vorgegebene feste Verteilungsform der Items sind Einschätzungen nach sozialer Erwünschtheit oder beeinflusst durch Voreingenommenheit erschwert. Da alle Items zugeteilt werden müssen und die Häufigkeit pro Ausprägung festgelegt ist, ist ein Vermeiden der Extrempole einer Skala oder das Vergeben nur mittlerer Werte auf einer Skala wie beim Fragebogen nicht möglich (Zimmermann 1994). Bei der Beschreibung einer Person mittels Q-Sort werden die Q-Sort-Items miteinander verglichen und vom Untersucher pro Rating mit einer erzwungenen Normalverteilung in einem Item-Profil mit festgelegten Häufigkeiten passend zur Einschätzung der Versuchspersonen sortiert.

Obwohl mit einem reliablen und validen Q-Sort die intervallskalierten Daten der zu einer Person in den Item-Profilen mit der erzwungenen Normalverteilung für statistische Vergleiche formal normativ, dh multivariat ausgewertet werden können (Regressions-, Diskriminanz-, Faktoren- und Clusteranalyse), bleiben die Q-Sort-Daten ipsativ, d.h. sie sind inhaltlich nicht von einem Nullpunktwert aus skalierbar (Minsel 1983). Gemäss Block (1961) und den Attachmentforschern Waters & Deane (1985), Zimmermann (1994) und Pierrehumbert (2000) ist daher für die Aussagekraft einer individuellen Q-Sort-Einschätzung die Korrelation mit einer normativen, Q-Sort-immanenten Referenzgrösse erforderlich (Prototyp, Ideal-Profil oder statistisches Aehnlichkeitsmass).

1.3.1.2 Q-Sort Referenzgrösse

Mangels Item-Nullpunktwerten sind für die reliable und valide Aussagegültigkeit von Q- Sort-Einschätzungen normative, testimmanente Referenzgrössen, auch Prototypen oder Ex- perten-Ideal-Profile, erforderlich. In einem bestehenden Q-Sort wird ein Q-Sort-immanente Referenzgrösse theoriegeleitet oder statistisch generiert. Eine theoriegeleitete Referenzgrös- se wie beispielsweise im Attachment Q-Sort von Kobak (1993) wird von Experten erstellt, welche mit dem vorgegebenen Item-Sample eine idealtypische Wertung, das heisst ein Ex- perten-Ideal-Profil zur gegebenen Fragestellung festgelegen. Statistische Referenzgrössen (vgl. Block 1961 und Jones 1985) werden mit einem reliablen und validen Itemsample ermit- telt, indem anhand der Q-Sort-Werte einer Eich-Stichprobe mittels Faktorenanalyse bestimm- te Itemkonfigurationen als signifikante Merkmale oder für das ganze Item-Sample ein statis- tisch signifikantes Profil (Prototyp) eruiert werden. Beide Arten von Referenzgrössen die- nen als Normwerte für die Persönlichkeits-Einschätzungen eines bestimmten Q-Sorts. Ein Experten-Ideal-Profil kann ausserdem mit einem reliablen und validen Item-Sample mit- tels Konvergenz von faktorenanalytischer und itemmetrischer Analyse mit einer konfirmatori- schen Clusteranalyse validiert werden.

Ein methodischer Vergleich von theoriegeleiteten mit nicht-theoriegeleiteten Q-Sorts zeigt, dass deren unterschiedliche Referenznormen beträchtliche Unterschiede hinsichtlich dem Design der Testentwicklung und der teststatistischen Ueberprüfung ihrer Reliabilität mit sich bringen: Ein theoriegeleiteter Q-Sort wie bei Kobak (1993) kann in der teststatistischen Ue- berprüfung des Messinstrumentes reliable Ergebnisse erbringen, soweit er von theorievertrau- ten Experten-Untersuchern durchgeführt wird und die Reliabilität mittels Re-Test (Stabilität) überprüfbar ist. Demgegenüber erfordern nicht-theoriegeleitete Q-Sorts wie diejenigen von Block (1961) und Jones (1985) für den Nachweis der Reliabilität des Messinstrumentes eine teststatistische Ueberprüfung auf einer Datenbasis von mehreren hundert Items, einer grossen Stichprobenzahl und mindestens 60-70 Untersuchern (Block 1961). - Ein derartiger Q-Sort wird in der Anfangsphase seiner Entwicklung von thematisch verschiedenen, theorievertrau- ten Experten- und Laien-Untersuchern erprobt und kann in den Folgephasen ausschliesslich von Laien-Untersuchern durchgeführt werden.

1.3.1.3 Generieren eines Q-Sort Itemsamples

In der Methodik zum Q-Sort-Verfahren „little attention has given to sampling theory“ (Mowrer 1953, S. 358) und Block (1961, S. 98) hält gar fest, „there exists no criteria on forming and testing items“. Pragmatisch orientiert sich die Erstellung eines Q-Sorts zur Auswertung eines Interviews an den Inhalten und an den Auswertungsergebnissen der vor- gegeben Interviews. Aus den Theorie- und Beobachtungs-Kontexten werden jeweils typische Items zusammengestellt, mit denen sowohl die Narrative der Interviewten als auch die Ein- schätzung der Versuchspersonen durch den Rater beschrieben werden können (Zimmermann 1994).

Die Bedeutsamkeit von Items für eine Persönlichkeitseinschätzung wird somit nach subjekti- ven, als auch nach theoriegeleiteten Kriterien festgelegt. Die Itemformulierung sollte derart sein, dass sie eine Verhaltens- oder Persönlichkeitsausprägung eindeutig beschreibt, die in einem polaren Kontinuum von „nicht charakteristisch“ bis „charakteristisch“ einge- schätzt und graduell in + 10 Stufen unterteilt werden kann. Block (1961, S. 78) empfiehlt für eine Item-Zusammenstellung mit der erzwungenen Normalverteilung eine Anzahl positi- ver, neutraler und negativer Inhalte im Verhältnis 1:2:1. Diese Verteilung ergibt sich auch automatisch, wenn nur negative und positive Iteminhalte im Vergleich mit dem Experten- Ideal-Profil mit unterschiedlicher Gewichtung im Verhältnis 1:1 für das Itemsample ausge- wählt werden. Ein auf diese Weise generierter Q-Sort wird auf seine Reliabilität und seine Validität als Gesamttest und in jedem Item an einer möglichst heterogenen Eichstichprobe überprüft. Daran anschliessend wird mit einer Itemanalyse die Brauchbarkeit jedes Items für die Messung des Untersuchungsmerkmals untersucht (vgl. 1.3.3.).

1.3.2 Gütekriterien eines Q-Sorts

Die drei Hauptgütekriterien eines Tests sind gemäss Bortz et al, (2002, S. 193-202) Objek- tivität, Reliabilität und Validität: Die Objektivität eines Tests gibt an, in welchem Ausmass die Testergebnisse vom Testanwender unabhängig sind. Die Reliabilität (Zuverlässigkeit) eines Tests kennzeichnet den Grad der Genauigkeit, mit dem das geprüfte Merkmal gemessen wird. Sie lässt sich durch Erhöhung der Objektivität verbessern. Die Validität (Gültigkeit) eines Tests gibt an, wie gut der Test in der Lage ist, genau das zu messen, was er vorgibt.

Im Q-Sort Verfahren mit seiner Spezifizität der erzwungenen Normalverteilung erfährt die Ueberprüfung der genannten Testgütekriterien insbesondere in den Bereichen der Objektivität und der Reliabilität entscheidende Modifikationen. Diese werden im Vergleich zur traditionellen Testtheorie anhand der Ausführungen der Q-Sort-Methodiker Stephenson (1936) und Block (1961) und auf dem Hintergrund der nachhaltigsten Q-Sort-Anwender, den Attachmentforschern Waters & Deane (1985) und Ijzendoorn (2004), dargestellt.

Lienert (1969, S. 18-19) und Rauchfleisch (1994, S. 64-65) weisen zudem auf Nebengütekri- terien hin, die zu einem Test beachtenswert sind: Vergleichbarkeit, Oekonomie und Nütz- lichkeit.

1.3.2.1 Objektivität

Objektivität in der Testtheorie und im Q-Sort-Verfahren

Gemäss Lienert (1969, S. 13-14), Rauchfleisch (1994, S. 55-57) und Bortz (2002, S. 194-195) ist für eine gute Reliabilität eines Tests und damit auch eines Q-Sorts eine gute TestObjektivität bezüglich seiner Durchführung, Auswertung und Interpretation erforderlich. Die Objektivität eines Q-Sorts wird mittels Berechnungen zur Interrater-Korrelation in unterschiedlichen Zusammenhängen gemessen.

A) Objektivität der Durchführung

Den drei genannten Autoren zufolge sollte mit einer objektiven Testdurchführung das Testergebnis vom Untersucher (Triadeninterviewer und TRI-Q-Sorter) unbeeinflusst sein. Verletzt wäre die Forderung nach Durchführungsobjektivität, wenn eine Versuchsperson die Frage bei einem Testleiter (Triadeninterviewer) nicht versteht, hingegen bei einem anderen problemlos beantworten kann. Unvergleichbar werden Testergebnisse von Versuchspersonen, denen nicht dieselben Fragen gestellt werden. Soll die Durchführungsobjektivität maximal hoch werden, dann muss die Instruktion an den Untersucher (Triadeninterviewer und TRI-Q-Sorter) schriftlich so genau wie möglich festgelegt und die Untersuchungssituation (Triadeninterview und TRI-Q-Sort) so weit wie möglich standardisiert werden.

B) Objektivität der Auswertung

Laut Lienert (1969), Rauchfleisch (1994) und Bortz (2002) betrifft die Auswertungsobjektivi- tät die numerische oder kategoriale Auswertung des registrierten Testverhaltens nach vorge- gebenen Regeln. Sie hängt von der Art der Itemformulierung ab und wird erhöht mit eindeu- tigen Vorgaben zur Fragenstellung und deren Beantwortung (richtig-falsch oder multiple- choice versus offene Fragen und Beantwortung) und zur Antwortbewertung (wie viele Punkte werden für welche Antwort vergeben). Die Auswertungsobjektivität wird mittels Korrelation der Messwerte verschiedener Untersucher geprüft.

So wird seit Stephenson (1936; zit. nach Mowrer 1953, S. 328), dem Erfinder des Q-Sort Ver- fahrens, gemäss Block (1961, S. 100-107) dem bekanntesten Q-Sort Testentwickler und in Uebereinstimmung mit Waters & Deane (1985), den heute noch tätigen Q-Sort Anwenderin- nen in der Attachment-Forschung, die Interrater-Korrelation eines Q-Sorts auf drei Ebe- nen untersucht: 1) auf Konzept-Ebene, 2) auf Profil-Ebene und auf 3) Item-Ebene.

1. Die Auswertungs-Objektivität auf Konzept-Ebene (Interraterkorrelation)

Die Auswertungsobjektivität auf Konzept-Ebene gibt an, ob ein Q-Sort seiner konzeptuel- len Referenzgrösse entsprechend messgenau ist. Laut Block (1961, S. 100-107) ist die Be- rechnung der Interrater-Korrelation auf Konzept-Ebene in einem Q-Sort notwendig, weil die erzwungene Normalverteilung im Q-Sort-Verfahren dazu führt, dass jedes Q-Sort Profil den- selben Mittelwert hat und dadurch die Interraterkorrelationen nicht auf einen konzeptuellen Nullpunkt bezogen berechnet und geprüft werden können. Die dafür notwendige testimma- nente Referenzgrösse wird in der Form eines Q-Sort-Idealprofils erstellt und für die Berech- nung von Q-Korrelationen verwendet. Die Auswertungsobjektivität auf Konzeptebene wird durch die Interraterkorrelation der Q-Korrelationen bestimmt. Diese werden von nun an TRI- Q-Scores genannt. Sie sind das Uebereinstimmungsmass der Q-Sortings der Rater mit der konzeptuellen Normgrösse des Q-Sort Ideal-Profils.

2. Auswertungs-Objektivität auf Profil-Ebene (Interraterkorrelation) und

3. Auswertungs-Objektivität auf Item-Ebene (Interraterkorrelation)

Waters & Deane (1985, S. 54) beschreiben die Vorgehensweise zur Berechnung der Interraterkorrelationen auf Item- und Profil-Ebene wie folgt:

„ In Q-sort data, agreement can be assessed in terms of the reliability of individual i- tems or of an entire sort. Item agreement is assessed by intercorrelating the scores assigned by two sorters across a sample of subjects. Agreement on a complete sort can be assessed first within each subject by intercorrelating the arrays of scores as signed to a particular subject by two sorters, and second mean agreement can be as sessed by computing the average agreement across all the subjects in a sample “ (Hervorhebungen und Einf ü gungen von M. Vogel).

Oser (1993, S. 158) und Rauchfleisch (1994, S. 60) ergänzen dazu, jedoch ohne genauere Angaben dazu zu machen, dass auf Item-Ebene niedrigere Korrelationskoeffizienten zu erwarten sind als auf Profil- und Konzept-Ebene.

Als Erklärung für die unterschiedliche Verwendung des Begriffs „reliability“, wie er beispielsweise bei Waters & Deane auftritt, sei darauf hingewiesen, dass sie in der empirischen Forschung im amerikanischen Gesundheitswesen in der Regel dem Objektivitätskriterium der Untersucher-Uebereinstimmung entspricht und nicht der Reliabilität in ihrem eigentlichen Sinne, dem des untersucherunabhängigen Merkmalszusammenhangs.

C) Objektivität der Interpretation

Die Interpretationsobjektivität betrifft den Grad der Unabhängigkeit der Interpretation des Testergebnisses von der Person des interpretierenden Testauswerters, der nicht mit dem Un- tersucher identisch zu sein braucht. Sie ist gegeben, wenn aus den gleichen Auswertungser- gebnissen verschiedener Versuchspersonen gleiche Schlüsse gezogen werden. In einem Test- manual sollten möglichst genaue Hinweise darüber gegeben werden, wie ein bestimmtes Testverhalten zu interpretieren ist. Dabei orientiert man sich an Vergleichswerten, bezie- hungsweise Testnormen, die anhand repräsentativer Stichproben und mittels Expertenbeur- teilung ermittelt werden. Sie gelten als Testnormierung. Im TRI-Q-Sort sind dies die Cut- Off-Werte der TRI-Q-Scores, welche mittels Q-Korrelation an einer Eichstichprobe ermit- telt und an Aussenkriterien (vgl. Kapitel Validität) überprüft werden. Die Cut-Offs der TRI- Q-Scores zu den Merkmalsausprägungen hoher, mittlerer und tiefer triadischer elterlicher Kapazität ermöglichen die Einordnung des individuellen TRI-Q-Sort Ergebnisses (Rohdaten) in ein Bezugssystem (Standardwerte). Ein Test, der für die Routinediagnostik und nicht nur für wissenschaftliche Untersuchungen eingesetzt werden soll, bei denen es in der Regel nur um den Vergleich von Gruppen geht, bedarf in jedem Fall einer Normierung (Lienert, 1969 und Rauchfleisch, 1994).

Zusammenfassung: Die Objektivität im TRI-Q-Sort

Die Objektivität des TRI-Q-Sort kann wie folgt gewährleistet werden:

a) Die Objektivität der TRI-Q-Sort Durchführung mit einer genau festgelegten Testin- struktion und einer möglichst standardisierten Untersuchungssituation

b) Die Objektivität der TRI-Q-Sort Auswertung mit einer numerischen und kategoria- len Antwortbewertung nach vorgegebenen Regeln

c) Die Objektivität der TRI-Q-Sort Interpretation mit einer Normierung mittels TRI-Q- Scores.

Die teststatistische Ueberprüfung der TRI-Q-Sort Objektivität insbesondere der TRI-Q-Sort Auswertung kann auf drei Ebenen mittels Berechnungen der Interrater-Uebereinstimmung durchgeführt werden:

Erstens auf der TRI-Q-Sort-Konzept-Ebene mittels Q-Korrelation.

zweitens auf der TRI-Q-Sort-Profil-Ebene mittels Interraterkorrelation bezüglich der Versuchspersonen-Profile und deren Mittelwerte, drittens auf der TRI-Q-Sort-Item-Ebene mittels Interraterkorrelation bezüglich der Items.

Die Prüfung der TRI-Q-Sort Objektivität betreffend Durchführung, Auswertung und Inter- pretation kann qualitativ und quantitativ vorgenommen werden. Das Mass der Interrater- Uebereinstimmung in den Berechnungen zur TRI-Q-Sort Auswertung und zur TRI-Q-Sort Interpretation wird mit der Korrelation nach Pearson (r) und mit der Intra-Class-Correlation (ICC) geprüft.

1.3.2.2 Reliabilität

Reliabilität in der Testtheorie und im Q-Sort Verfahren

Nach Bortz (2002, S. 195) gibt die Reliabilität den Grad der Messgenauigkeit eines In- strumentes an. Die Reliabilität ist um so höher, je kleiner der zu einem Messwert gehörende Fehleranteil (Fehlervarianz) ist. Perfekte Reliabilität würde bedeuten, dass der Test in der Lage ist, den wahren Wert (wahre Varianz) ohne jeden Messfehler zu erfassen. Dieser Ideal- fall tritt in der Praxis leider nicht auf, da sich Fehlereinflüsse seitens der Versuchspersonen durch situative Störungen, Müdigkeit der Probanden, Missverständnisse oder Raten nie ganz ausschliessen lassen. Nach Lienert (1969, S. 211) fallen als Fehlerquelle seitens der Unter- sucher insbesondere Unterschiede in der Testdurchführung und als Fehlerquelle aus der Testkonstruktion eine schwache Homogenität der Testaufgaben ins Gewicht. Die Analyse und Behebung von Fehlerquellen seitens der Versuchspersonen und seitens der Untersucher gehört als Ueberprüfung von Testgütekriterien in die Evaluation der Test-Objektivität (vgl. Kapitel Resultate, Abschnitt Objektivität). Demgegenüber ist die Evaluation der Testkon- struktion ein Prozess, der bereits mit der Generierung eines Tests beginnt.

Im Hinblick auf die Reliabilitätsprüfung eines Tests erläutert Schelten (1997, S. 109-110) bezüglich Testkonstruktion, dass „ungenaue Messergebnisse sich neben der mangelnden Prä- zision des Messinstrumentes auch auf den Messgegenstand zurückführen lassen. Dies trifft zu, wenn der Gegenstand, der gemessen werden soll, sich rasch verändert. Solche instabilen Persönlichkeitsmerkmale können z.B. sein: die Stimmung, der Neurotizismus, die Angst. Wenn die Stabilität des zu messenden Merkmals gering ist, wird das einzelne Messergebnis unzuverlässig. Die punktuell vorgenommene Messung gibt nur eine recht ungenaue Abschät- zung der Ausprägung des zu messenden Merkmales wieder.“ Diese mögliche Fehlerquelle als unerwünschte Einflussgrösse auf die Test-Reliabilität gilt es bei der Testkonstruktion zu be- rücksichtigen (vgl. Kapitel Resulate, Abschnitt Item-Generierung). Gemäss gemäss Bortz (2002, S. 196-198), Rauchfleisch (1994, S. 57-60) und Lienert (1969, S. 234) sind vier Me- thoden zu unterscheiden, mit denen die Reliabilität von eindimensionalen Testskalen berech- net werden kann: Retest-Reliabilität, Paralleltest-Reliabilität, Testhalbierungs-Reliabilität und Interne Konsistenz. Diese vier Methoden der Reliabilitätseinschätzung ordnen die Autoren drei verschiedenen Konzepten zu:

A) Stabilitätskonzept (Re-Test)

(zeitliche Merkmalskonstanz)

B) Aequivalenzkonzept (Paralleltest, Halbierungsmethoden)

(Merkmalskonstanz in unterschiedlichen Tests)

C) Homogenitätskonzept (Inter-Item-Konsistenz)

(instrumentelle Konstanz, dh Leistungsfähigkeit des Tests als Messinstrument)

Bei der Reliabilitätsbewertung ist die Art der Reliabilitätsbestimmung zu beachten. Erfasst ein Test ein stabiles Persönlichkeitsmerkmal mit hoher zeitlicher Variabilität bzw. hoher „Funktionsfluktuation“ - Lienert und Raatz, (1994, S. 201) verstehen hierunter Merkmale, deren Bedeutung sich mit der Testwiederholung ändern -, „erweist sich eine hohe Paralleltest- Reliabilität als günstig. Beansprucht der Test jedoch, zeitlich stabile Merkmalsausprägungen zu messen, sollte besonderer Wert auf eine hohe Retest-Reliabilität gelegt werden. Hohe in- terne Konsistenz ist indessen von jedem Test zu fordern“ (Schelten 1997, S. 109-110). Lienert (1969, S. 309) schlägt als Reliablitätskoeffizienten folgende Werte vor: Konsistenz (standar- disierte Tests) r > 0,9; Re-Test- oder Paralleltest-Reliabilität r > 0,8. Laut Bortz (2002, S. 199) sollte „ein guter Test ... eine Reliabilität von über 0,8 aufweisen. Reliabilitäten zwischen 0,8 und 0,9 gelten als mittelmässig. Reliabilitäten über 0,9 gelten als hoch. Bortz (2002, S. 195) hält zusammenfassend zur Reliabilität eines Tests fest, je grösser die Aehnlichkeit zwischen Messwertreihen (Re-Test, Paralleltest, Halbierungsverfahren, Inter-Item- Konsistenz), umso höher ist der Anteil der systematischen, gemeinsamen Variation der Werte und umso geringer ist der Fehleranteil. Ist die Reliabilität eines Tests erwiesen, sind Mess- wertunterschiede zwischen den Versuchspersonen nicht „zufällig“, sondern systematisch; sie gehen auf „wahre“ Merkmalsausprägungen zurück und konstituieren die „wahre“ Varianz (Bortz 2002, S. 195).

In Bezug auf die Testmethodik im Q-Sort Verfahren schildert Minsel (1985, S. 144) in der Enzyklopädie der Psychologie: Trotz der Beliebtheit des Q-Sort-Verfahrens in der Persön- lichkeits- und Psychotherapieforschung liegen „insgesamt sehr wenig Untersuchungen vor, die sich mit der Reliabilität von Q-Sorts befassten. Zudem sind kleine Stichprobengrössen und fehlende Angaben zu Zeitintervallen und Repräsentativität der Untersuchung die Regel. (...) Wenn die Reliabilität untersucht wurde, dann unter dem Aspekt der Stabilität. Andere Formen der Reliabilitätsprüfung, z.B. Paralleltest- und Halbierungs-Reliabilität fehlen ganz.“ Zudem hat sich die einzige, von Minsel (1985, S. 143) angeführte Methode Konsistenzbe- rechnung mit „einem Koeffizienten für die Homogenität der Items innerhalb der Zellen“ nach Neff & Cohen (1967) als ungeeignet erwiesen, da sie lediglich eine Differenzierung der Inter- rater-Korrelationsberechnungen beinhaltet. Auch in der Metaanalyse zur Reliabilitäts- und Validitätsprüfung in der Q-Sort Methode von Van Ijzendoorn et al (2004) werden keine ande- ren Ermittlungsmethoden zur Berechnung von Q-Sort Objektivität und Q-Sort Reliabilität aufgeführt als diejenigen der Interrater-Korrelation und des Retest-Verfahrens.

A) Stabilitätskonzept (Re-Test)

Zur Bestimmung der Retest-Reliabilität wird gemäss Bortz (2002, S. 197) derselbe Test derselben Stichprobe zweimal vorgelegt, wobei das zwischen den Messungen liegende Zeitintervall variiert werden kann. Die Retest-Reliabiliktät ist definiert als Korrelation beider Messwertreihen. Diese Korrelation gibt an, wie viel Prozent der Gesamtunterschiedlichkeit der Testergebnisse auf „wahre“ Merkmalsunterschiede zurückzuführen sind. Eine RetestReliabilität von Rel = 0.76 lässt darauf schliessen, dass 76 % der Merkmalsvarianz auf „wahre“ Merkmalsunterschiede zurückgehen und nur 24 % auf Fehlereinflüsse.

Bei der Reliabilitätsbestimmung nach der Testwiederholungsmethode besteht die Gefahr, dass die Reliabilität eines Tests überschätzt wird, d.h. eine sogenannte Scheinreliabiliät zustande kommt, wenn die Lösungen der Testaufgaben erinnert werden, womit vor allem bei kurzen

Tests mit inhaltlich interessanten Items zu rechnen ist. Die Wahrscheinlichkeit von Erinnerungseffekten nimmt jedoch mit wachsendem zeitlichem Abstand zwischen den Testvorgaben zu. Lienert (1969, S. 217) vermerkt zur der häufig gestellten Frage, wie viel Zeit zwischen dem Test und seiner Wiederholung liegen soll:

„ Einmal sollen die Erinnerungsspuren möglichst verblassen, das Intervall also mög lichst gross sein; zum anderen soll das untersuchte Persönlichkeitsmerkmal möglichst unverändert bleiben, was wiederum ein kurzes Intervall w ü nschenswert erscheinen lässt. Je nach der Eigenart des Testinhaltes werden die Zeitabstände zwischen Test und Wiederholung von Tagen bis zu Monaten variieren. “

Die Bestimmung der Retest-Reliabilität ist nach Rauchfleisch (1994, S. 58) bei einer Reihe von Testverfahren häufig die einzige anwendbare Methode zur Ueberprüfung der Reliabilität des betreffenden Messinstruments, bietet sie doch die Möglichkeit, auch bei solchen Tests, für die keine Parallelformen vorliegen oder die sich nicht in zwei äquivalente Hälften unterteilen lassen, einigermassen verlässliche Reliabilitätsschätzungen vorzunehmen. Wenig brauchbar ist die Testwiederholungsmethode nach Bortz (2002, S. 196-197) bei Tests, die instabile bzw. zeitabhängige Merkmale erfassen, d.h. eine hohe Merkmalsfluktuation aufweisen. Hierbei wäre dann unklar, ob geringe Test-Tetest-Korrelationen für geringe Reliabilität des Tests oder für geringe Stabilität des Merkmals sprechen. Als Beispiel beschreibt Bortz einen Test, der verschiedene Stimmungen erfassen soll, die typischerweise sehr starken intraindividuellen Schwankungen unterliegen. Die Reliabilitätsschätzung mittels Retest-Methode ergibt z.B. Rel = 0.34. Dies würde einem Anteil von 34 % „wahrer“ Varianz in den Messwerten enstprechen, bzw. 66 % Fehlervarianz. Es wäre jedoch verfehlt, den Test nun wegen vermeintlich fehlen- der Messgenauigkeit abzulehnen, da in diesem Fall unsystematische Messwertdifferenzen zwischen den Untersuchungszeitpunkten nicht nur Fehlereffekte, sondern auch „echte“ Ver- änderungen darstellen. Laut Schelten (1997, S. 116) wird die Retest-Reliabilität eines Tests immer höher sein als seine Paralleltest-Reliabilität. Bei der Wiederholung ein und desselben- Tests ist der Testinhalt der gleiche. Es wird nicht eine neue Stichprobe von Testaufgaben aus dem Aufgabenuniversum dargeboten, wie dies bei der Reliabilitätsbestimmung über Parallel- tests der Fall ist. Während bei der Paralleltest-Reliabilität eine Korrelation von 0.80 und höher verlangt wird, kann bei der Retest-Reliabilität ein Wert von 0.85 und höher gefordert werden.

Der Q-Sort Methodenübersicht von Minsel (1985, S. 144) folgend ist die Reliabilitätsein- schätzung mittels Retest die einzig angewendete Methode, nach der die Reliabilität in den unterschiedlchen Q-Sort Verfahren geprüft wird. Zur Ermittlung der TRI-Q-Sort Reliabili- tät mittels Retest sind die Untersuchungsbedingungen mit einer Test-Wiederholung der Tri- adeninterview-Video-Auswertungen an der Eichstichprobe bei genügendem Zeitabstand der TRI-Q-Sort Ratings optimal gegeben.

B) Aequivalenzkonzept (Paralleltest, Halbierungsmethoden)

Nach Lienert (1969, S. 349-365), Schelten (1997, S. 109-116) und Bortz (2002, S. 196-197) erfordert die Ermittlung der Paralleltest-Reliabilität die Entwicklung von zwei Testversionen, die beide Operationalisierungen desselben Konstrukts darstellen, wobei die möglichst hohe Uebereinstimmung der Mittelwerte und der Varianzen der beiden Testformen zu prüfen ist. Je ähnlicher die Ergebnisse beider Tests ausfallen, umso weniger Fehlereffekte sind offensicht- lich im Spiel, d.h. die wahre Varianz wird hier als Kovarianz zwischen den Testwerten einer Personenstichprobe auf beiden Paralleltests geschätzt. Das Ergebnis einer Reliabilitätsprüfung nach der Paralleltest-Methode sind stets zwei Testformen, die sich entweder beide als reliabel oder beide als unreliabel erweisen.

Die Konstruktion von zwei Paralleltests erfolgt nach einer Itemanalyse mit Trennschärfe- und Schwierigkeits-Berechnungen, indem das Itemsample in Itempaare mit vergleichbarer, äquivalenter Schwierigkeit und Trennschärfe zusammengestellt und danach die Itempaare auf zwei Paralleltests aufgeteilt werden. Für heterogene Tests wird dabei noch auf die Gleichartigkeit des Testinhaltes zu achten sein und ist ein Aussenkriterium vorhanden, empfiehlt Lienert die Selektion, um Aufgabenpaare gleicher Validität zu gewinnen.

Eine Reliabilitätsüberprüfung mittels Testhalbierung kommt für das Q-Sort Verfahren nicht in Frage, da diese Methode aufgrund der erzwungenen Q-Sort Normalverteilung für beide Testhälften identische Ergebnisse erbringen würde. Die Paralleltest-Reliabilität hin- gegen kann in einem Q-Sort ermitelt werden, indem zusätzlich zu den genannten Regeln und den geforderten Itemkriterien Trennschärfe und Schwierigkeitsgrad beide Tests dieselbe er- zwungene Profil-Normalverteilung aufweisen müssen, damit die Mittelwerte und die Varian- zen der Paralleltests nicht infolge unterschiedlicher erzwungener Normalverteilungs-Profile als Paralleltest unvergleichbar sind.

C) Homogenitätskonzept (Inter-Item-Konsistenz)

Zur Inter-Item Konsistenz, auch interne Konsistenz genannt, vermerkt Lienert (1969, S. 235), dass „die Kennwerte der Reliabilität, wie sie durch Testhalbierung oder durch Konsis- tenzanalyse ermittelt werden, der grundlegenden Idee, dem Wesen der Reliabilität, am nächs- ten kommen. Der Konsistenzkoeffizient steht daher in einem teilweisen Gegensatz zu den beiden anderen Reliabilitätskennwerten, die mehr eine Information für die Testpraxis als eine Aussage über die Qualität des Testmittels darstellen.“ Aus diesem Grunde bezeichnet Lienert (1969) die Homogenität eines Tests als funktionale Reliabilität. Die Berechnung der Inter- Item-Konistenz, auch interne Konsistenz genannt, stellt nach Bortz (2002, S. 198)

„ eine Erweiterung der Testhalbierungs-Methode dar und zwar nach der Ueberlegung, dass sich ein Test nicht nur in Testhälften, sondern in so viele „ kleinste “ Teile zerle gen lässt, wie er Items enthält. Es kann also praktisch jedes einzelene Item wie ein „ Paralleltest “ behandelt werden. “

Die Berechnung des Reliabilitätskoeffizienten der Inter-Item-Konsistenz kann in einem Test mit polytomen, bipolaren Items über die „Kuder-Richardson-Formel“ erfolgen (Dieterich 1973, Scheltern 1997). Nach Bortz (2002, S. 198) sind heute jedoch die Intraclass-Correlation Koeffizienten (Shrout & Fleiss 1979) und der Alpha-Koeffizient von Cronbach (1951, S. 1953) am gebräuchlichsten, welche sowohl auf dichotome als auch auf polytome Items anwendbar sind. Da das Cronbach-Alpha den auf eine Merkmalsdimension zurückgehenden Varianzanteil aller Items erfasst, wird das Mass der Inter-Item-Konsistenz auch als Homogenitätsindex verwendet und Bortz (2002, S. 198) ergänzt:

„ Formal entspricht der Alpha-Koeffizient der mittleren Testhalbierungs-Reliabilität eines Tests f ü r alle möglichen Testhalbierungen Alpha ist umso grösser, je mehr I- tems die Skala enthält und je höher die Item-Korrelationen sind “ .

Rauchfleisch (1994) vermerkt zu den verschiedenen Verfahren der Reliabilitäsprüfung, dass je nach Testverfahren unter Umständen nur eine bestimmte Methode der Reliabilitätseinschätzung möglich ist und dies bei vielen Tests auf zwei Ebenen: auf der Item-Ebene und auf der syndromalen Gesamttest-Ebene. Die Ergebnisse auf diesen beiden Ebenen seien zudem unterschiedlich zu gewichten:

„ Da die Reaktionen auf die einzelnen Testitems stets gewissen Schwankungen unter worfen sind, m ü ssen wir in der Regel bei Reliabilitätspr ü fungen auf der Item-Ebene niedrigere Koeffizienten erwarten als bei Schätzungen der Reliabilität auf syndroma ler Ebene “ (Rauchfleisch 1994, S. 60).

Die Homogenität im Q-Sort, resp. im TRI-Q-Sort, kann infolge der erzwungenen Item- Normalverteilung an sich nicht berechnet werden, wie die Q-Sort Literatur zeigt. Im spezifi- schen Fall des TRI-Q-Sort kann jedoch aufgrund der speziellen Testkonstruktion des TRI-Q- Sort mit einer Testaufteilung in Risiko- und Schutz-Items eine Skalentransformation vorge- nommen werden, welche Homogenitätsberechnungen auf Gesamttest- und auf Item-Ebene ermöglicht.

Zusammenfassung: Reliabilität des TRI-Q-Sort

Die Reliabilität des TRI-Q-Sort kann mit folgenden Methoden der drei Konzepte erstellt wer- den:

a) Die Reliabilität des TRI-Q-Sort betreffend Stabilität ist mit einem Retest über- prüfbar, wenn eine Testwiederholung der Triadeninterview-Auswertungen an der Eichstichprobe mit einem genügend grossen Zeitabstand von den TRI-Q-Sort Ratern vorgenommen werden kann.

b) Die Reliabilität des TRI-Q-Sorts betreffend Aequivalenz kann mit dem Parallel- test-Verfahren untersucht werden, nicht jedoch mittels Testhalbierung. Ein Parallel- test kann durchgeführt werden, wenn die TRI-Q-Sort Items bezüglich Trennschärfe und Schwierigkeit so quantifizierbar sind, dass der TRI-Q-Sort in geeignete Item- Paare eingeteilt und diese auf zwei identische normalverteilte Tests aufgeteilt werden können.

c) Die Reliabilität des TRI-Q-Sorts betreffend Homogenität ist im TRI-Q-Sort trotz der erzwungenen Item-Normalverteilung aufgrund der spezifischen TRI-Q-Sort Itemkonstruktion mit gleichverteilten Risiko- und Schutz-Items mit einer Skalentransformation sowohl auf Gesamttest- als auch auf Item-Ebene berechenbar.

1.3.2.3 Validität

Im Unterschied zu Minsel (1983, S. 145), der bezüglich dem Q-Sort-Verfahren festhält, dass die Validität der meisten Q-Sorts überwiegend ungeklärt ist, wird nachfolgend die Theorie zur Validitätsprüfung eines Tests dargestellt und - soweit möglich - am TRI-Q-Sort eine Validi- tätsprüfung vorgenommen. Die Gründe für Minsels Befund liegen primär darin, dass für spe- zifische Fragestellungen immer wieder neue Q-Sorts zusammengestellt wurden, ohne den Aufwand einer teststatistischen Ueberprüfung einzugehen. Diese Tendenz wurde unterstützt durch den nicht berücksichtigten Widerspruch ipsativer Datenerhebung und normativer Da- tenverrechnung, der eine teststatistische Validierung als vernachlässigbar erscheinen liess. Messinstrumente können jedoch sehr exakt immer das Falsche messen; dann sind sie zwar reliabel, aber nicht valide.

Nach Rauchfleisch (1994, S. 60) stellt die Validität „das wohl wichtigste, zugleich aber empi- risch am schwierigsten überprüfbare Gütekriterium dar“. Die Bestimmung der Validität kann fast nie als endgültig betrachtet werden, weil die Validität streng genommen nur mittels eines anderen Messinstruments geprüft werden kann, dessen Validität bereits bekannt sein müsste.

Der Minimalanspruch an die Validität eines Tests ist laut Bortz (2002, S. 201), dass die Entscheidungen und Vorhersagen, die auf der Basis eines Tests getroffen werden, tauglicher sind als Entscheide und Vorhersagen, die ohne Test möglich wären. Bortz (2002, S. 199-202), Rauchfleisch (1994, S. 60-63), Dieterich (1973, S. 99-143) und Lienert (1969, S. 255-313) unterscheiden drei Hauptarten von Validitätsuntersuchungen zu einem Test:

A) Inhaltsvalidität (logische Validität)

B) Kriteriumsvalidität (empirische Validität)

C) Konstruktvalidität

A) Inhaltsvalidität (logische Validität)

Strenggenommen handelt es sich bei der Inhaltsvalidität nicht um ein Testgütekriterium, son- dern nur um eine Zielvorgabe, die bei der Testkonstruktion bedacht werden sollte. Ein Test, für den Inhaltsvalidität in Anspruch genommen wird, wird als repräsentative Stichprobe aus jener Population von Verhaltensweisen aufgefasst, auf die man vom Test aus schliessen will. Der Test ist dann so valide, wie die mit ihm erfasste Verhaltensstichprobe repräsentativ für den interessierenden Verhaltensbereich ist. Diese Repräsentativität kann nach Amelang (2001) nicht gemessen, sondern muss - am sinnvollsten durch Experten - geschätzt werden. „Es geht letztlich darum, dass eine Messung das relevante Phänomen möglichst in allen Spektren erfasst, und dies kann nur durch Forschen, Nachdenken und Kommunikation zwi- schen Wissenschaftlern herausgefunden werden und nicht durch bestimmte ‚Techniken’“ (ILMES, 2004).

Inhaltsvalidität ist ausserdem gegeben, wenn der Inhalt der Test-Items das zu messende Konstrukt in seinen wichtigsten Aspekten erschöpfend erfasst. Die Grundgesamtheit der Testitems, die potentiell für die Operationalisierung eines Merkmals in Frage kommen, müs- sen sehr genau definiert werden. Dieterich (1973, S. 42-63) empfiehlt hierzu eine sprachliche Analyse und Normierung der Testitems. Nach Lienert (1969, S. 265-294) hingegen ist für die exakte Gewinnung subjektiver Kriterien eine genaue Definition oder eine ausführliche Um- schreibung der Aspekte, nach denen die Beurteilung der Versuchspersonen erfolgen soll, die wichtigste Voraussetzung. Für Lienert (1969, S. 265-267) und Bortz et al (2002, S. 199-201) ist die Einschätzung der Inhaltsvalidität abschliessend auch noch von Bedeutung, weil qualita- tiv „logisch-inhaltliche Analysen der Testitems Hinweise geben können, ob tatsächlich das fragliche Konstrukt oder ein alternatives Konstrukt gemessen wird“ (Bortz 2002, S. 201).

B) Kriteriumsvalidität (empirische Validität)

Bei der Kriteriumsvalidität geht es um die Uebereinstimmung eines Messinstruments mit an- deren relevanten Merkmalen, sogenannten Aussenkriterien. Genauer unterscheidet man hier zwischen der Uebereinstimmungsvalidität, in der das Aussenkriterium gleichzeitig erhoben wird , und der Vorhersagevalidität, bei der das Aussenkriterium erst später gemessen wird (ILMES, 2004). Grundlage der Kriteriumsvalidität ist der Korrelationsschluss: Bei empirisch gesicherter Korrelation zwischen Test und Kriterium darf vom Test auf das Kriterium ge- schlossen werden, auch wenn die Korrelation theoretisch nicht erklärt werden kann (Amelang 2001). Ebenso wie bei der Objektivitäts- und Reliabilitätsprufung wird auch die empirische Validität eines Messinstruments anhand von gemessenen Kriteriums-Zusammenhängen quan- tifiziert. Dabei gelten auf Gesamttestebene Korrelationskoeffizienten zwischen 0,4 und 0,6 als mittelmässig und Koeffizienten über 0,6 als hoch (Bortz 2002, S. 201) Auf Itemebene ist der grösseren Variabilität entsprechend mit niedrigeren Koeffizienten zu rechnen.

Gemäss Rauchfleisch (1994, S. 61) setzt eine Ueberprüfung der empirischen Validität eines Tests voraus - und darin liegt das Hauptproblem -, dass sich empirisch fassbare, reliable und valide Aussenkriterien finden lassen, zu denen die Testreaktionen in Beziehung gesetzt wer- den können. Dass bei diesem Ausgangspunkt eine Validierung von Testverfahren mit tiefen- psychologischen Konstrukten besonders grosse Probleme aufwirft, da sie selbst oft vieldeutig und zum Teil so komplex sind, dass sie sich nicht leicht empirisch erfassen lassen, liegt auf der Hand.

[...]

Ende der Leseprobe aus 227 Seiten

Details

Titel
TRI-Q-Sort: Triadische elterliche Kapazität und psychische Kindesentwicklung
Untertitel
Entwicklung des TRI-Q-Sort zum Triadeninterview von Prof. Dr. med. Kai von Klitzing
Hochschule
Universität Basel  (Psychologische Fakultät)
Autor
Jahr
2006
Seiten
227
Katalognummer
V178012
ISBN (eBook)
9783640999118
ISBN (Buch)
9783640998869
Dateigröße
3991 KB
Sprache
Deutsch
Anmerkungen
ZUSATZBAND mit detaillierten Angaben zu Item-Inhaltsanalysen, Item-Homogenität und Item-Objektivität bei der Autorin erhältlich.
Schlagworte
Q-Sort, Testentwicklung, Triadische Beziehungskapazität, Elternschaft, Psychische Entwicklung in der frühen Kindheit
Arbeit zitieren
Miriam Vogel (Autor:in), 2006, TRI-Q-Sort: Triadische elterliche Kapazität und psychische Kindesentwicklung, München, GRIN Verlag, https://www.grin.com/document/178012

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: TRI-Q-Sort: Triadische elterliche Kapazität und psychische Kindesentwicklung



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden