Faktorenanalyse und Mokkenskalierung

Ein Anwendungsbeispiel


Essay, 2006

20 Seiten, Note: 1,0


Leseprobe


Inhaltsverzeichnis

1 Einleitung

2 Zu den Daten

3 Zur Durchführbarkeit der Faktorenanalyse
3.1 Korrelationsmatrix und Signifikanzniveau
3.2 Kaiser-Mayer-Olkin Kriterium

4 Diskussion verschiedener Lösungsmöglichkeiten

5 Endgültiges Modell
5.1 Erklärte Gesamtvarianz
5.2 Kommunalitäten
5.3 Rotierte Faktorladungen
5.4 Inhaltliche Interpretation
5.5 Reliabilitätstests
5.6 Summenscores

6 Mokkenskalierung
6.1 Itemschwierigkeiten
6.2 Paarweise Homogenitäts-Koeffizienten
6.3 Bildung der Skalen
6.4 Summenscores

7 Überblick über die Ergebnisse

8 Anhang
8.1 Syntax
8.2 Die wichtigsten Tabellen und Grafiken

1 Einleitung

Die folgenden Analysen beziehen sich auf den Datensatz der Europäischen Wertestudie von 1999 in Deutschland. Die betrachteten Variablen a124 bis a151 befassen sich mit dem Thema Nachbarschaft. Zu diesem Zweck sollten die Befragten ankreuzen, welche der genannten Personengruppen sie nicht gerne als Nachbarn hätten.

Sowohl die Faktorenanalyse als auch die Mokkenskalierung sind sog. Struktur entdeckende Verfahren, die dazu dienen, in einem Pool von Items Dispositionen aufzuspüren. Dispositionen werden hier als konsistente, situationsübergreifende Handlungstendenzen verstanden, die das Antwortverhalten auf bestimmte Items steuern. Es geht somit darum herauszufinden, welche Typen von unbeliebten Nachbarn aus den einzelnen Items gebildet werden können.

2 Zu den Daten

Die vorliegenden 14 Variablen liegen bereits in binärer Form vor, was bei der Faktorenanalyse den Vorteil hat, dass man sich nicht weiter mit dem Ordinalskalenproblem auseinandersetzen muss. Da die Variablen jedoch noch Antwortverweigerungen sowie die Residualkategorie „weiß nicht“ enthalten, muss vor der eigentlichen Analyse noch eine kleine Datenanpassung vorgenommen werden: Um die Vergleichbarkeit der beiden Verfahren sicherzustellen, werden die Daten umkodiert und die Antwortverweigerungen und die Residualkategorie als System Missing definiert. Daraus ergeben sich dann folgende Variablen:

Tabelle 2.1: Übersicht über die verwendeten Variablen

Abbildung in dieser Leseprobe nicht enthalten

Die Daten sind somit vorbereitet und können nun zur Analyse verwendet werden.

3 Zur Durchführbarkeit der Faktorenanalyse

Die Faktorenanalyse wird nach der Hauptkomponentenmethode durchgeführt. Da später die Mokkenskalierung nur mit listenweisem Fallauschluss arbeiten kann, wird auch bei der Faktorenanalyse diese Methode verwendet. Weiterhin wird als Abbruchkriterium ein Eigenwert von < 1 herangezogen. Aus Übersichtlichkeitsgründen werden nur Werte angezeigt, die > 0,3 sind.

3.1 Korrelationsmatrix und Signifikanzniveau

In der Korrelationsmatrix (siehe Anhang, Tabelle A1) lassen sich bei näherer Betrachtung hauptsächlich vergleichsweise niedrige Korrelationen erkennen, jedoch auch einige größere (diese größeren Werte – über 0,3 – wurden zur Veranschaulichung fett markiert). Die Heterogenität dieser Werte ist ein Indiz dafür, dass keine Eindimensionalität gegeben ist und legt somit die Vermutung nahe, dass hinter den Zusammenhängen mehrere latente Hintergrundvariablen verborgen sind.

Auch die Signifikanzen der dargestellten Korrelationen sprechen für die Faktorenanalyse: die meisten Werte sind hochsignifikant, es gibt nur wenige Abweichungen. Die Faktorenanalyse ist daher sinnvoll durchführbar.

3.2 Kaiser-Mayer-Olkin Kriterium

Das Kaiser-Mayer-Olkin Maß hat einen Wert von 0,831 (siehe Anhang, Tabelle A2). Nach Kaiser und Rice ist dieser Wert „verdienstvoll“ und die vorliegende Stichprobe somit gut zur Durchführung einer Faktorenanalyse geeignet.

4 Diskussion verschiedener Lösungsmöglichkeiten

SPSS schlägt anhand des Eigenwertkriteriums eine 4faktorielle Lösung vor, der Screeplot (siehe Anhang, Grafik G1) veranschaulicht dies grafisch. Ein weiteres Kriterium zur Entscheidung für ein Modell ist das sog. Ellbogenkriterium. Dieses würde bei den vorliegenden Daten zu einer Lösung mit nur einem Faktor raten – das halte ich jedoch nicht für sinnvoll. Der erste Faktor alleine erklärt nur etwa 26% der Varianz (siehe Tabelle 4.1.1.), zu viele Informationen würden durch die Beschränkung auf einen Faktor verloren gehen. Außerdem war ja bereits zuvor bei Betrachtung der Korrelationsmatrix aufgefallen, dass keine Eindimensionalität vorliegt. Diese extreme Lösung ist somit auszuschließen.

Auch die andere extreme Lösung, also die Verwendung von mehr als der anhand des Eigenwertkriteriums bestimmten 4 Faktoren, wäre mit Problemen verbunden. Da jeder zusätzliche Faktor den Eigenwert von 1 unterschreiten würde, käme dies einer Verschlechterung der Daten gleich: die einzelnen Variablen würden mehr erklären als der gebildete Faktor. Daher sind auch Lösungen mit mehr als 4 Faktoren nicht sinnvoll.

5 Endgültiges Modell

Im weiteren Verlauf der Analysen wurde die Variable a132a ausgeschlossen. Letzen Endes habe ich mich zur Verwendung der 3faktoriellen Lösung entschlossen. Die ausschlaggebenden Gründe für die getroffenen Entscheidungen werden an der jeweiligen Stelle näher erläutert.

5.1 Erklärte Gesamtvarianz

Wie Tabelle 5.1.1 und Grafik G2 (siehe Anhang) zeigen, erfüllen nach Ausschluss der Variable a132a noch 3 Faktoren das Eigenwertkriterium:

Tabelle 5.1.1: Erklärte Gesamtvarianz (Modell ohne a132a)

Abbildung in dieser Leseprobe nicht enthalten

Ein Vergleich mit Tabelle A3 (siehe Anhang) lässt erkennen, dass der Ausschluss der Variable sogar zu besseren Ergebnissen hinsichtlich der erklärten Gesamtvarianz führt. Dies sei mit folgender Tabelle noch einmal veranschaulicht:

Tabelle 5.1.2: Erklärte Gesamtvarianzen im Vergleich

Abbildung in dieser Leseprobe nicht enthalten

Wie man erkennen kann, sind beim Modell ohne a132a die einzelnen Werte etwas besser als im ursprünglichen Modell. Jeder einzelne Faktor kann hier mehr Varianz erklären, als dies vorher der Fall war. Gegen das Argument, dass jetzt nur noch drei Faktoren das Eigenwertkriterium erfüllen lässt sich einwenden, dass die 4faktorielle Lösung – wie später noch gezeigt wird – aus inhaltlichen Gründen nicht sinnvoll wäre und daher ohnehin die 3faktorielle Lösung zur Verwendung käme – und in diesem Fall ist das Modell ohne a132a besser geeignet.

5.2 Kommunalitäten

Die Kommunalitäten haben nach der Rotation nur noch mittelmäßige Werte (siehe Anhang, Tabelle A4), sie schwanken zwischen etwa 0,3 und 0,7. Den kleinsten Wert hat Variable a151a mit 0,293. Da jedoch die Kommunalitäten auch in den anderen Modellen nicht wesentlich bessere (in fast allen Fällen sogar deutlich schlechtere) Werte liefern, kann man hiermit nicht eindeutig gegen die Verwendung des Modells argumentieren.

5.3 Rotierte Faktorladungen

Wie Tabelle 5.3.1 verdeutlicht, eignen sich die Faktoren sehr gut, um die Items zu erfassen. Mit Ausnahme von a130a laden alle Items auf genau einen Faktor hoch, es gibt keine negativen Ladungen. Die Werte liegen im Bereich von 0,46 (Ausnahme ist auch hier wieder a130a) bis 0,85 und sind somit gut geeignet.

Tabelle 5.3.1: Rotierte Komponentenmatrix(a)

Abbildung in dieser Leseprobe nicht enthalten

Extraktionsmethode: Hauptkomponentenanalyse.

Rotationsmethode: Varimax mit Kaiser-Normalisierung.

a Die Rotation ist in 5 Iterationen konvergiert.

Zum Vergleich habe ich im Anhang auch die rotierten Komponentenmatrizen der 4- sowie 3-faktoriellen Lösung des Modells mit a132a abgebildet. Wie man erkennen kann sind diese Ergebnisse deutlich schlechter: bei der Lösung mit 4 Komponenten fehlt die angestrebte Einfachstruktur völlig, bei vielen Items gibt es Zuordnungsprobleme. Die Lösung mit 3 Faktoren ist wesentlich besser, jedoch besteht auch hier das Problem mit a130a. Allein auf Grund der rotierten Komponentenmatrizen der beiden 3faktoriellen Lösungen ist es relativ schwierig, ein Modell als „besser“ als das andere einzustufen, da die Werte sich sehr ähnlich sind. Das entscheidende Kriterium für den Ausschluss der Variable a132a liefern die inhaltlichen Aspekte.

[...]

Ende der Leseprobe aus 20 Seiten

Details

Titel
Faktorenanalyse und Mokkenskalierung
Untertitel
Ein Anwendungsbeispiel
Hochschule
Otto-Friedrich-Universität Bamberg  (Fakultät für Sozial- und Wirtschaftswissenschaften)
Veranstaltung
Datenanalyse am PC
Note
1,0
Autor
Jahr
2006
Seiten
20
Katalognummer
V117120
ISBN (eBook)
9783640199273
ISBN (Buch)
9783640205172
Dateigröße
542 KB
Sprache
Deutsch
Schlagworte
Faktorenanalyse, Mokkenskalierung, Datenanalyse
Arbeit zitieren
Florian Wohlkinger (Autor:in), 2006, Faktorenanalyse und Mokkenskalierung, München, GRIN Verlag, https://www.grin.com/document/117120

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Faktorenanalyse und Mokkenskalierung



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden