Homepage > Katalog > Pflegewissenschaft - Pflegemanagement

Verfahren statistischer Datenanalyse. Eine Fallaufgabe

Name: Verfahren statistischer Datenanalyse. Eine Fallaufgabe
Price: 15.95 EUR
Availability: InStock
Author: Manuel Anhold
ISBN: 9783346048318

Ausarbeitung, 2014

12 Seiten, Note: 1,0

Manuel Anhold (Autor:in)

Leseprobe

Inhaltsverzeichnis

Abkürzungsverzeichnis

Formel- und Tabellenverzeichnis

1 Patienten aus dem schizophrenen Formenkreis: Vergleich von Modell- und Kontrollregion
1.1 Erkrankungsdauer der Patienten der Kontrollgruppe: Mittelwert, Varianz und Standardabweichung
1.2 Vergleich der Erkrankungsdauern in der Interventionsgruppe und der Kontrollgruppe
1.3 Testzuordnung und Interpretation der Tabelle
1.4 Berechnung des Standardfehlers der Differenz
1.5 Berechnung von Kovarianz und Pearson-Korrelationskoeffizient für die Patienten in der Modellregion
1.6 Interpretation von Kovarianz und Korrelationskoeffizienten
1.7 Alternativer Korrelationskoeffizient

2 Analyse von Veränderungen in der Gruppe der Modellregion Integrierte Versorgung
2.1 McNemar - Statistik
2.2 Vergleich zwischen Modellregion und Kontrollregion

3 Auswahl von Testverfahren
3.1 Zusammenhang Geschlecht und Krankenhausaufenthalt
3.2 Signifikanz von Veränderungen der Krankenhaustage bei Messwerten ohne Normalverteilung

Literaturverzeichnis

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Formel- und Tabellenverzeichnis

Formel 1: Mittelwert

Formel 2: Varianz

Formel 3: Standardabweichung

Formel 4: t-Wert

Formel 5: Freiheitsgrade

Formel 6: Standardfehler der Differenz

Formel 7: Kovarianz

Formel 8: Pearson-Korrelationskoeffizient

Formel 9: McNemar-Statistik

Formel 10: Chi-Quadrat-Test im Beispiel

Tabelle 1: Vergleich zwischen Modell- und Kontrollregion

1 Patienten aus dem schizophrenen Formenkreis: Vergleich von Modell- und Kontrollregion

1.1 Erkrankungsdauer der Patienten der Kontrollgruppe: Mittelwert, Varianz und Standardabweichung

Der Mittelwert (arithmetisches Mittel, Erwartungswert) ist ein Maß der mittleren Tendenz. Dieser errechnet sich als Summe der einzelnen Beobachtungswerte (xi) dividiert durch die Summe der Fälle n [vgl. Meyer 2011, S. 18]. Die nachfolgende Formel 1 zeigt die Berechnung an.

Abbildung in dieser Leseprobe nicht enthalten

Formel 1: Mittelwert

In der Kontrollgruppe ergibt sich für die Erkrankungsdauer der Kontrollgruppe der Mittelwert:

Abbildung in dieser Leseprobe nicht enthalten

Bei der Varianz handelt es sich um ein Streuungsmaß eines Merkmals, das als mittlere quadratische Abweichung vom Erwartungswert nach der berechnet wird. Es ergeben sich aufgrund der Bildung von Quadraten stets positive Werte für die Varianz [vgl. Meyer 2011, S. 18].

Formel 2: Varianz

Im Beispiel errechnet sich die Varianz der Erkrankungsdauer wie folg (verkürzte Darstellung):

Abbildung in dieser Leseprobe nicht enthalten

Die Standardabweichung ist ebenfalls ein Streuungsmaß, welche eine Aussage über die Abweichung der einzelnen Messwerte bezogen auf den Mittelwert macht. Sie ergibt sich als Quadratwurzel aus der Varianz [vgl. Bühner 2004, S. 26]. Im Beispiel ist die Standardabweichung:

Abbildung in dieser Leseprobe nicht enthalten

Formel 3: Standardabweichung

In den verwendeten Formeln bedeutet xi ein Einzelmesswert, n meint die Anzahl aller Messwerte (Stichprobenumfang), Mx ist der Mittelwert, Vx ist die Varianz und Sx ist die Standardabweichung.

1.2 Vergleich der Erkrankungsdauern in der Interventionsgruppe und der Kontrollgruppe

Bei der Betrachtung und Analyse von statistischen Daten muss deren Verteilung beachtet werden. Diese ist durch Mittelwert und Standardabweichung gegeben. Bei den gegebenen Daten liegt der Mittelwert der Erkrankungsdauern in der Gruppe Modellregion Integrierte Versorgung bei 15,5 Jahren bei einer Standardabweichung von 12,45 Jahren. In der Kontrollgruppe (vgl. Abschnitt 1.1) beträgt der Mittelwert 15 Jahre, die Standardabweichung liegt bei 11,55 Jahren.

Bisher unbeachtet blieb der Stichprobenumfang. In beiden Datenreihen liegt dieser bei n=10 Patienten, also bei einer sehr niedrigen Zahl. Die Zuverlässigkeit von Mittelwert und Standardabweichung korreliert mit dem Stichprobenumfang. Bei den obigen Daten wird bereits unmittelbar ersichtlich, dass eine jeweils große Streuung der Einzelmesswerte um die betreffenden Mittelwerte vorliegt. Die Vergleichbarkeit von Lage- und Streuungsmaß erscheint dennoch zufällig. Statistisch signifikante Unterschiede [vgl. Hoem 2008] auf einer üblichen Signifikanz-niveauschwelle von 5% steht nicht zu erwarten [vgl. Meyer 2012, S. 3 ff].

1.3 Testzuordnung und Interpretation der Tabelle

Bei dem aufgrund der Daten in der vorgestellten Ergebnistabelle handelt es sich um den Zwei-Stichproben-t-Test für unabhängige Stichproben („two-sample t-test“), der zu den parametrischen Testverfahren zählt. Mit diesem lässt eine Aussage dahingehend treffen, ob sich zwei Stichproben bzw. Gruppen (hier: Gruppe Modellregion Integrierte Versorgung und Kontrollgruppe) hinsichtlich ihrer empirischen gefundenen Mittelwerte systematisch unterscheiden. Voraussetzung ist eine Intervallskalierung der unter-suchten Variablen und eine unabhängige Werteausprägung zwischen den Gruppen. Außerdem ist eine Normalverteilung in den Grundgesamtheiten zu fordern [vgl. Meyer 2011, S. 40 ff; Student 1908].

Im vorliegenden Beispiel kann Unabhängigkeit der beiden Gruppen angenommen und Normalverteilung hinsichtlich der Erkrankungsdauer bei Erkrankungen des schizophrenen Formenkreises postuliert werden.

In der Tabelle ist zunächst der t-Wert mit t = 0,093 aufgeführt. Unter diesem versteht man die standardisierten Differenzen der Stichprobenmittelwerte, der sich folgendermaßen errechnet:

Abbildung in dieser Leseprobe nicht enthalten

Formel 4: t-Wert

Im Zähler befindet sich als Stichprobenkennwert die mittlere Differenz der beiden Gruppen, die in der Tabelle korrekterweise mit 15,5 – 15 = 0,5 angegeben ist. Im Nennen findet sich der Standardfehler (standard error) der Differenz, der im Abschnitt 1.4 berechnet wird. Das dortige Ergebnis wird hier bereits verwendet. Der t-Wert errechnet sich damit wie in der Ergebnistabelle angegeben zu:

In Spalte 2 wird mit df die Anzahl der Freiheitsgrade angegeben. Diese errechnen sich aus den Stichprobenumfängen als:

Abbildung in dieser Leseprobe nicht enthalten

Formel 5: Freiheitsgrade

Die Spalte 3 zeigt die Signifikanz (2-seitig), die gleichbedeutend dem p-Wert ist. Der angegebene p-Wert liegt bei 0,927. Dies bedeutet, dass mit einer 92,7 %-igen Wahrscheinlichkeit der Unterschied von 0,5 Jahren zwischen den Mittelwerten der Erkrankungsdauern zwischen der Modellregion- und der Kontrollgruppe als zufällig angesehen werden kann. Vor dem Hintergrund der Kenntnis der kleinen Stichproben und der großen Streuungen ist dies absolut nachvollziehbar. Eine Signifikanz-niveauschwelle von 5% wird definitiv nicht eingehalten, so dass nicht von einem statistisch signifikanten Ergebnis ausgegangen werden kann. Umgekehrt kann logisch gefolgert werden, dass die Ähnlichkeit der Mittelwerte in den beiden Gruppen mit hoher Wahrscheinlichkeit zufällig entstanden ist und bei größeren Stichprobenumfängen durchaus Abweichungen in beiden Gruppen apparent werden könnten.

1.4 Berechnung des Standardfehlers der Differenz

Der Standardfehler (se=standard error) der Differenz kann mithilfe der nachfolgenden Formel [vgl. Meyer 2011, S. 42, Formel 3.2] unter Einsetzung der vorgegebenen bzw. in Abschnitt 1.1 errechneten Standardabweichungen aus der Gruppe Modellregion und der Kontrollgruppe des Fallbeispiels errechnet werden:

Abbildung in dieser Leseprobe nicht enthalten

Formel 6: Standardfehler der Differenz

Das Ergebnis für den Standardwert der Differenz ( ) wird in Abschnitt 1.3 zur Errechnung des t-Wertes weiter verwendet.

1.5 Berechnung von Kovarianz und Pearson-Korrelationskoeffizient für die Patienten in der Modellregion

Unter Berücksichtigung der einschränkenden Annahmen der Aufgabenstellung (Intervallskalierung und Normalverteilung) lassen sich die Kovarianz (Kov) und Pearson-Korrelationskoeffizient (r) errechnen. Die Kovarianz stellt dabei ein Maß für den Zusammenhang zwischen zwei intervallskalierten und normalverteilten Variablen dar. Diese sind in der Gruppe Modellregion Integrierte Versorgung die Erkrankungsdauer (x) sowie der Anzahl der Krankenhausaufenthalte (letzte 12 Monate).

Abbildung in dieser Leseprobe nicht enthalten

Formel 7: Kovarianz

Im Fallbeispiel errechnet sich die Kovarianz zu einem Wert von -21,22 nach folgender Berechnung:

Abbildung in dieser Leseprobe nicht enthalten

Eine Standardisierung hinsichtlich der Skalierung erfolgt bei der Berechnung des Pearson-Korrelationskoeffizienten. Hierbei werden die Standardabweichungen der Variablen einbezogen [vgl. Meyer 2011, S. 22]:

Abbildung in dieser Leseprobe nicht enthalten

Formel 8: Pearson-Korrelationskoeffizient

1.6 Interpretation von Kovarianz und Korrelationskoeffizienten

In Abschnitt 1.5 wird für die Kovarianz ein negativer Wert errechnet. Hieraus kann auf einen negativen Zusammenhang zwischen Erkrankungsdauer und Krankenhaus-aufenthalten für die betrachtete Gruppe geschlossen werden. Über das Ausmaß der Korrelation sagt der Wert der Kovarianz zunächst nichts aus.

Mit dem Korrelationskoeffizienten wird eine Standardisierung vorgenommen. Dieser kann Werte Intervall -1 bis +1 annehmen. Ein Wert von 0 besagt, dass keine Korrelation zwischen den Variablen besteht. Bei r=-1 besteht ein streng negativer Zusammenhang zwischen den Variablen, bei r=+1 ein streng positiver Zusammenhang (je größer Variable 1, desto größer Variable 2). Ein Korrelationskoeffizient um r= verweist auf einen milden Zusammenhang. Ab r= besteht ein mittlerer und ab r= 0,5 ein großer Zusammenhang der Variablen [vgl. Meyer 2011, S. 24]. Übertragen auf unser Beispiel bedeutet ein Korrelationskoeffizient von r=-0,77 einen negativen starken Zusammenhang zwischen Erkrankungsdauer in Jahren und der Anzahl der Krankenhausaufenthalte. Aufgrund des Korrelationskoeffizienten würde man zu der Auffassung gelangen, dass bei schizophrenen Störungen (in der Modellregion) lange Krankheitsdauer mit reduzierter Inanspruchnahme von Krankenhausaufenthalten korreliert ist.

1.7 Alternativer Korrelationskoeffizient

In der genannten Konstellation einer fehlenden Normalverteilung oder ungeeigneten Skalenniveaus (keine Intervallskala oder Ordinalskala) bei mindestens einer Variablen kann alternativ der sogenannte Spearman-Korrelationskoeffizient errechnet werden [vgl. Meyer 2011, S. 25].

[...]

Ende der Leseprobe aus 12 Seiten

Details

Titel: Verfahren statistischer Datenanalyse. Eine Fallaufgabe
Hochschule: APOLLON Hochschule der Gesundheitswirtschaft in Bremen
Veranstaltung: Modul Verfahren statistischer Datenanalyse
Note: 1,0
Autor: Manuel Anhold (Autor:in)
Jahr: 2014
Seiten: 12
Katalognummer: V497191
ISBN (eBook): 9783346048301
ISBN (Buch): 9783346048318
Sprache: Deutsch
Schlagworte: verfahren, datenanalyse, eine, fallaufgabe

Arbeit zitieren: Manuel Anhold (Autor:in), 2014, Verfahren statistischer Datenanalyse. Eine Fallaufgabe, München, GRIN Verlag, https://www.grin.com/document/497191

Kommentare

Noch keine Kommentare.

Blick ins Buch

Verfahren statistischer Datenanalyse. Eine Fallaufgabe

Ausarbeitung, 2014

12 Seiten, Note: 1,0

Manuel Anhold (Autor:in)

Inhaltsverzeichnis

Abkürzungsverzeichnis

Formel- und Tabellenverzeichnis

1 Patienten aus dem schizophrenen Formenkreis: Vergleich von Modell- und Kontrollregion

1.1 Erkrankungsdauer der Patienten der Kontrollgruppe: Mittelwert, Varianz und Standardabweichung

1.2 Vergleich der Erkrankungsdauern in der Interventionsgruppe und der Kontrollgruppe

1.3 Testzuordnung und Interpretation der Tabelle

1.4 Berechnung des Standardfehlers der Differenz

1.5 Berechnung von Kovarianz und Pearson-Korrelationskoeffizient für die Patienten in der Modellregion

1.6 Interpretation von Kovarianz und Korrelationskoeffizienten

1.7 Alternativer Korrelationskoeffizient

Ähnliche Arbeiten

Moderne Verfahren der kennzahlengestützten Bilanzanalyse

Abhängigkeit vom Alter zur Sterblichkeit durch COVID-19? Statistische Datenan...

Die Explorative Datenanalyse - Statistik im Matheunterricht einführen

Anwendung verschiedener Methoden der quantitativen Datenanalyse in SPSS

Wie beeinflusst ein Migrationshintergrund die Einkommensunterschiede bei Männ...

Konzeption eines Fragebogens zur Erfassung emotionaler Intelligenz, Basis des...

Quantitative Datenanalyse. Varianzanalyse (ANOVA), Levene-Test und Regression

Preise für Pferde. Eine Datenanalyse

Eine Datenanalyse der Sommerumfrage an der FOM 2017

Statistik über die Titanic-Überlebenden

Preismodellierung BMW Z3. Wissenschaftliche Methoden und quantitative Datenan...

Zur Gegenwart der deutschen Gesundheitspolitik. Fallaufgabe

Gesundheitsverhalten und gesundheitliche Beschwerden von Angestellten. Quanti...

Allgemeine Betriebswirtschaftslehre. Fallaufgabe am Beispiel einer Klinik

Visualisieren, Präsentieren und Moderieren. Eine Fallaufgabe

Deskriptive Statistik. Welches sind die Einflussfaktoren auf das Professoreng...

(Analytische und statistische) Verfahren der Kostenplanung: Gegenüberstellung...

Chancen und Grenzen mathematisch-statistischer Verfahren zur Identifikation v...

Statistische Verfahren für Diffusionsprozesse mit Anwendung auf stochastische...