Lade Inhalt...

Kreuztabellen und zugehörige statistische Analyseverfahren

Hausarbeit 2018 12 Seiten

Statistik

Leseprobe

Inhaltsverzeichnis

1. Motivation und Zielsetzung dieser Arbeit

2. Methodische Vorgehensweise
2.1 Erstellung der Kreuztabelle
2.2 Prüfung des Zusammenhangs
2.2.1. Statistische Unabhängigkeit
2.2.2. Stärke des Zusammenhangs

3. Zusammenfassung und praktische Anwendungsfelder

4. Literaturverzeichnis

1. Motivation und Zielsetzung dieser Arbeit

Bei der Auswertung von Daten ist es häufig nicht ausreichend, nur die Verteilung der einzelnen Variablen zu betrachten. Oft benötigt man zur Beantwortung der Fragestel- lung eine Untersuchung der Beziehung bzw. des Zusammenhangs zwischen den Merkmalen (Jann, 2005, S.59). Deshalb wird in dieser Arbeit die Vorgehensweise der bivariaten deskriptiven Statistik anhand der Kreuztabellierung und den zugehörigen statistischen Analyseverfahren genauer erläutert. Die Methode wird verwendet, wenn nicht nur einzelne voneinander isolierte Variablen untersucht werden, sondern wenn die Betrachtung der Verteilung der unterschiedlichen Wertekombinationen aus zwei unterschiedlichen Variablen notwendig ist (Holling und Gediga, 2011, S.153).

Die vorliegende Arbeit gliedert sich zu diesem Zweck in drei Abschnitte. Im ersten Schritt wird die Logik von Kreuztabellen und Kontingenztafeln erläutert. Des Weiteren erfolgt die Darstellung der methodischen Vorgehensweise für nominalskalierte Vari- ablen. Hierfür wird die statistische Unabhängigkeit geprüft und das jeweilige Zusam- menhangsmaß verwendet. Im letzten Teil erfolgt dann eine Zusammenfassung und eine Anwendungsempfehlung.

2. Methodische Vorgehensweise

2.1 Erstellung der Kreuztabelle

Zur Darstellung von Häufigkeitsverteilungen von zwei Merkmalen wird in der deskrip- tiven Statistik eine Kontingenztabelle oder auch Kreuztabelle verwendet. Sie gibt die Ergebnisse einer Datenerhebung tabellarisch wieder und zeigt die bivariate Häufig- keitsverteilung auf (Rönz, Strohe und Eckstein, 1994, S.193). Unter „Kontingenz ver- steht man das gemeinsame Auftreten von zwei Ereignissen“ (Holling und Gediga, 2011, S.153). Die Kreuztabelle kann für alle Skalenniveaus verwendet werden. Aller- dings ist es aufgrund der vielen Informationen, die in ordinal-, intervall- oder ratioska- lierten Variablen enthalten sind, notwendig weitere Maßzahlen in die statistische Aus- wertung mit einzubeziehen, um eine möglichst gehaltvolle Aussage treffen zu können. Aufgrund des Umfanges dieser Arbeit wird im methodischen Teil aber nur auf die no- minalskalierten Variablen eingegangen. Bei einer zu starken Ausprägung der Merk- male müssen diese allerdings zusammengefasst werden, da die Kreuztabelle sonst zu unübersichtlich wird (z.B. Einkommen in „niedrig“, „mittel“ und „hoch“) (Jann, 2005, S.60). Wenn beide Variablen eine Ausprägung von zwei haben entsteht eine 2×2-Kontingenztabelle, auch Vierfeldertafel genannt. Je nach Anzahl der Ausprägung ergibt sich so eine k×m-Kreuztabelle, wie in Tabelle 1 dargestellt. Hierbei ist die Variable X ein k-fach und die Variable Y ein m-fach gestuftes Merkmal. In der ersten Spalte stehen die Ausprägungen der Variable Y (i=1, …, k) und in der ersten Zeile die Ausprä- gungen von X (j=1, …, m). Die jeweils letzte Spalte bzw. Zeile zeigen die Randverteilungen der Merkmale an (Rönz et al., 1994, S.193). Wenn angenommen wird, dass eine der beiden Variablen von der anderen abhängt, dann wird die abhängende Variable oft über die Spalten hinweg verteilt und die unab- hängige Variable in die Zeilen geschrieben (Holling und Gediga, 2011, S.154).

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1 Formale Darstellung einer Kontingenztabelle k×m

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 2 Zusammenhang von Geschlecht und Lieblingsfach in der Schule, Daten aus der Studie zur Berufswahl von Abele, Schute und Andrä (1999)

Um die verschiedenen Arten der Kreuztabelle besser darstellen zu können, werden die Daten einer Studie zur Berufswahl, die von Abele, Schute und Andrä (1999) mit 1482 Studierenden durchgeführt wurde, verwendet. Die Ausgangskreuztabelle (Ta- belle 2) zeigt die absolute Häufigkeitsverteilung der Merkmale Geschlecht und Lieb- lingsfach in der Schule und in Abbildung 1 wird diese Verteilung mithilfe eines Balken- diagrammes grafisch dargestellt.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1 Grafische Darstellung der absoluten Häufigkeit

Eine weitere Art der Kreuztabelle ist die Kontingenztafel mit relativen Häufigkeitsver- teilungen (Tabelle 3). Hierfür werden die einzelnen absoluten Häufigkeiten durch die gesamte Stichprobe (n) geteilt, dadurch zeigt sich, welchen Anteil die Antwortkombi- nation an der Gesamtheit hat (Fromm und Baur, 2008, S.242).

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 3 Kontingenztabelle mitrelativer Häufigkeit (Angaben in %)

Zur genaueren Untersuchung der Zusammenhänge reichen diese beiden Tabellen al- lerdings nicht. Sie geben lediglich Rückschlüsse auf eventuelle Unregelmäßigkeiten in der Feldbesetzung (Jann, 2005, S.62). Deshalb verwendet man hierfür die bedingte Häufigkeitsverteilung. Die Befragten werden anhand ihrer Antworten in Untergruppen eingeteilt. Dies kann anhand der Spalten- oder der Zeilenausprägung passieren. Sollte davon ausgegangen werden, dass eine der beiden Variablen eine abhängige Variable ist, so unterteilt man die Stichprobe nach der Ausprägung des anderen Merk- mals (Fromm und Baur, 2008, S.243). In Tabelle 4 wird die bedingte Häufigkeit für die Wahl des Lieblingsfaches in der Schule gezeigt. Das Merkmal Geschlecht wird in zwei Subgruppen unterteilt und daraufhin wird der Anteil der Studenten bzw. Studentinnen für die jeweilige Ausprägung des Lieblingsfaches errechnet. Somit ist die bedingte Häufigkeitsverteilung des Lieblingsfaches für die Studentinnen die relative Häufig- keitsverteilung, wenn nur das weibliche Geschlecht betrachtet wird. Das Ganze kann aber auch spaltenweise berechnet werden und gibt dann die bedingte Häufigkeit für die Variable Geschlecht an (Holling und Gediga, 2011, S.155). Die Ergebnisse der Tabelle 4 zeigen eine starke Unterscheidung zwischen den Geschlechtern.

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 4 Kreuztabelle mit den bedingten Häufigkeiten für die Wahl des Lieblingsfaches (Angabe in %)

2.2 Prüfung des Zusammenhangs

Im nächsten Schritt soll nun geprüft werden, ob sich die Zusammenhänge, die in der Kreuztabelle erkennbar wurden, auch auf die Gesamtheit übertragen lassen oder ob es sich nur um einen willkürlichen Zufall handelt (Backhaus, Erichson, Plinke und Wei- ber, 2016, S.367). Da bei nominalskalierten Variablen kein genauer Abstand zwischen den Werten definiert ist und diese auch nicht in eine Rangfolge gebracht werden kön- nen (Rönz et al. 1994, S.328), wird bei der Kontingenzanalyse die Stärke des Zusam- menhanges über das Ausmaß der Abweichung von der Unabhängigkeit untersucht (Holling und Gediga 2011, S.187). Dafür ist es notwendig die statistische Unabhän- gigkeit der Variablen zu ermitteln und daraufhin die Stärke des Zusammenhanges mit- hilfe darauf aufbauender Koeffizienten zu bestimmen.

2.2.1. Statistische Unabhängigkeit

Ob zwischen zwei Merkmalen eine statistische Unabhängigkeit besteht, lässt sich an- hand der bedingten Häufigkeitsverteilung zeigen. Wenn diese für die Variable Y für alle Ausprägungen von X identisch sind. Das bedeutet, dass in jeder Zeile die gleiche bedingte Verteilung für Y steht. Formal entspricht die statistische Unabhängigkeit der Verteilung ܻȁܺ ൌ ݔ௜ ݂òݎ ݈݈ܽ݁ ݅ ݀݁ݎ ܴܽ݊݀ݒ݁ݎݐ݈݁݅ݑ݊݃ ݒ݋݊ ܻ. Und auch umgekehrt ܺȁܻ ൌ ݕ௝ ݂òݎ ݈݈ܽ݁ ݆ ݀݁ݎ ܴܽ݊݀ݒ݁ݎݐ݈݁݅ݑ݊݃ ݒ݋݊ ܺ (Jann, 2005, S.66). Demnach spricht man von einer Abhängigkeit, wenn sich die bedingten Häufigkeitsverteilungen einer Variablen für zwei oder mehrere Ausprägungen der anderen Variable unterscheiden (Holling und Gediga, 2011, S.156). Das Ausmaß der Abweichungen von der statistischen Un- abhängigkeit lässt sich mit einem Vergleich der tatsächlichen Werte in der Kreuztab- elle und der erwarteten Werte in der sogenannten Unabhängigkeitstabelle oder Indif- ferenztabelle bestimmen. Die Indifferenztabelle wird gebildet, indem man die absolute Häufigkeit der einen Variable (hier X) in der Tabelle stehen lässt und für das andere Merkmal die relativen Häufigkeitsverteilungen (hier Y) nimmt. Das Innere der Tabelle, welche die Werte zeigt, die vorliegen, wenn die Variablen unabhängig voneinander wären, bildet sich dann durch das Produkt der jeweiligen relativen und absoluten Häu- ௛Ǥೕ figkeit (vgl. Tabelle 5). Formal bedeutet das ݄෨ ௜௝ ൌ ௡ כ ݄௜Ǥ. Die Randverteilungen sind weiterhin die absoluten Häufigkeiten, wie bei der Kontingenztabelle. Die Ergebnisse werden nun mit der ursprünglichen Kreuztabelle verglichen und je mehr sich die Werte der beiden Tabellen unterscheiden, desto größer ist der Zusammenhang zwischen den Merkmalen (Holling und Gediga, 2011, S.189).

[...]

Details

Seiten
12
Jahr
2018
ISBN (eBook)
9783668939219
ISBN (Buch)
9783668939226
Sprache
Deutsch
Katalognummer
v468336
Institution / Hochschule
Universität Bayreuth
Note
1,3
Schlagworte
Kreuztabelle chi-quadrat-test

Autor

Teilen

Zurück

Titel: Kreuztabellen und zugehörige statistische Analyseverfahren