Anwendung der binären Entscheidungsmodelle: Logit und Probit


Ausarbeitung, 2003

31 Seiten, Note: 1,0


Leseprobe


INHALTSVERZEICHNIS

Tabellenverzeichnis

Abbildungsverzeichnis

1. Einleitung

2. Das binäre Entscheidungsmodell: Probit und Logit
2.1 Spezifikation der Probit-und Logit-Modelle
2.1.1 Das Probit-Modell
2.1.2 Das Logit-Modell
2.1.3 Vergleich zwischen dem Logit- und Probit-Modell
2.2 Schätzung des binären Entscheidungsmodells
2.2.1 Maximum-Likelihood-Schätzung
2.2.2 Bedingung erster und zweiter Ordnung
2.2.3 Gütemaß für binäre Regressionsmodelle
2.2.4 Durchführung von Tests in Logit-und Probit-Modelle

3. Daten
3.1 Datenquelle
3.2 Das Entscheidungsmodell für fixe bzw. anpassungsfähige Hypothekenraten
3.3 Ergebnisse der Auswertung

4. Zusammenfassung

Literaturverzeichnis

Anhang

Tabellenverzeichnis

A. Tabellen im Text

Tab. 1: Ergebnisse des Logit-Modells

Tab.2: Ergebnisse des Tests, [Abbildung in dieser Leseprobe nicht enthalten]

Tab. 3: Ergebnisse des Tests, [Abbildung in dieser Leseprobe nicht enthalten]1

B. Tabellen im Anhang

Tab. 1: Datensatz

Abbildungsverzeichnis

Abb.1: Vorhersage mit dem linearen Wahrscheinlichkeitsmodell

Abb.2: Kumulierte Logit-und Probit-Verteilungsfunktion

1. Einleitung

In gewissen wirtschaftlichen Situationen könnte es dazu kommen, dass die abhängige Variable in der Regressionsgleichung nicht stetig ist, sondern dass sie eine diskrete Wahl repräsentiert, wie beispielsweise:

- Der Arbeitsmarktstatus einer Person: In diesem Fall nimmt die abhängige Variable [Abbildung in dieser Leseprobe nicht enthalten] den Wert null an, wenn die untersuchte Person einer Beschäftigung nachgeht, und Wert eins, wenn diese Person einen arbeitslosen oder einen vergleichbaren Status hat. Die Werte null und eins sind hierbei arbiträr und reine Konvention.
- Das Abstimmungsverhalten einer Person: Die Variable nimmt beispielsweise den Wert null, wenn die Person dagegen ist, den Wert eins, wenn sie keine Meinung hat und den Wert zwei, wenn sie dafür ist. In diesem Beispiel sind die Werte der abhängigen Variable zwar nicht quantitativ zu verstehen, aber sie weisen eine Ordnung auf.

Modelle, die solche abhängigen Variablen einbeziehen, werden „diskrete Wahlmodelle“ („Discrete Choice Models“), „qualitative Antwortmodelle“ („Qualitative Response Models“[1] ), „Kategoriemodelle“ („Categorical Models“) oder „Quantenmodelle“ („Quantal Models“) genannt. Die wirtschaftliche Auslegung solcher Modelle beruht typischerweise auf dem Prinzip der Nutzenmaximierung im Sinne von: Wähle [Abbildung in dieser Leseprobe nicht enthalten] statt [Abbildung in dieser Leseprobe nicht enthalten], wenn der Nutzen von [Abbildung in dieser Leseprobe nicht enthalten] diesen von B übersteigt. Alternativ wird das beobachtete Vorkommen einer gegebenen Wahl als Kennzeichnen für grundlegende, unbeobachtbare stetige Variable angesehen, welche „Neigung zur Wahl einer gegebenen Alternative“ genannt werden kann. Eine solche Variable wird durch das Vorhandensein eines Grenzwertes (oder mehrerer Grenzwerte) gekennzeichnet. Somit bedeutet das Überschreiten dieses Grenzwertes Umschalten von einer zu anderer Alternative. Zum Beispiel die Neigung einer verheirateten Frau, sich den Arbeitskräften anzuschließen, könnte direkt von dem Verdienst abhängig sein, den sie beziehnen könnte. Im Weiteren könnte dieser Verdienst von ihrer Ausbildung und Arbeitserfahrung abhängig sein. Ob sie sich tatsächlich den Arbeitskräften anschließt oder nicht, hängt davon ab, ob der vom Markt angebotene Verdienst ihren Grenzwert übersteigt oder nicht. Dieser Grenzwert bzw. Schwellenlohn, der selbstverständlich für die verschiedenen Frauen mit der gleichen Ausbildung und Arbeitserfahrung nicht der gleiche ist, spielt die Rolle einer stochastischen Störung. Beide Methoden – die Nutzenmaximierung und die Grenzwertmethode- sind eng miteinander verbunden.

Die Kompliziertheit der Bewertung und des Testens der Modelle mit qualitativen abhängigen Variablen wird mit Anstieg der Anzahl der Alternativmöglichkeiten größer. Aufgrund dessen werde ich mich in dieser Arbeit auf die Modelle mit zwei Alternativen und dichotomer abhängiger Variable konzentrieren.

Diese Arbeit verfolgt den Zweck, die theoretischen Aspekte der Probit-und Logit-Modelle unter die Lupe zu nehmen, insbesondere Vorteile und Nachteile dieser Modelle und Anwendungsmöglichkeiten. Das wird im ersten Teil vorgenommen. Im zweiten Teil wird ein Logit-Modell konzipiert, mit dem zu untersuchen sei, wie sich die Individuen entscheiden, wenn sie zwischen fixen und anpassungsfähigen Hypothekenraten zu wählen hätten.

2.Das binäre Entscheidungsmodell: Probit und Logit

Um die Probleme und Verfahren in diesem Kontext besser verstehen zu können, werde ich zuerst eine binäre Entscheidung betrachten. Somit nimmt in diesem Fall die abhängige Variable [Abbildung in dieser Leseprobe nicht enthalten]nur die zwei Werte null und eins. Welchen der beiden Werte die Zufallsvariable annimmt, hängt nicht nur von dem Zufall sondern auch von gewissen erklärenden Faktoren bzw. Variablen, die für das i -te Individuum zu einem Spalten Vektor xi zusammengefasst werden, ab:

Abbildung in dieser Leseprobe nicht enthalten

Die Parameter [Abbildung in dieser Leseprobe nicht enthalten] geben den Einfuß der erklärenden Variablen an. Die einfachste Spezifikation für die Funktion [Abbildung in dieser Leseprobe nicht enthalten] ist eine lineare Funktion, indem das Modell mittels folgender Regression vorgestellt werden kann:

(2-1) [Abbildung in dieser Leseprobe nicht enthalten] [Abbildung in dieser Leseprobe nicht enthalten]

wobei [Abbildung in dieser Leseprobe nicht enthalten] dem Wert des Attributes für das i -te Individuum

Abbildung in dieser Leseprobe nicht enthalten

[Abbildung in dieser Leseprobe nicht enthalten] ist eine unabhängige und gleich verteilte Zufallsvariable mit Mittelwert 0.

Abbildung in dieser Leseprobe nicht enthalten

bezeichnet den Erwartungswert aller Beobachtungen der unabhängigen Variable [Abbildung in dieser Leseprobe nicht enthalten]. Aufgrund dessen, das [Abbildung in dieser Leseprobe nicht enthalten] gemäß Annahme eine binäre ist, gilt für die Wahrscheinlichkeitsverteilung von [Abbildung in dieser Leseprobe nicht enthalten]. Daher folgt für den Erwartungswert:

Abbildung in dieser Leseprobe nicht enthalten

Das Lineare Wahrscheinlichkeitsmodell hat allerdings drei gravierende Nachteile. Erstens, da [Abbildung in dieser Leseprobe nicht enthalten]entweder den Wert eins oder null annimmt, muss [Abbildung in dieser Leseprobe nicht enthalten] entweder gleich [Abbildung in dieser Leseprobe nicht enthalten] mit Wahrscheinlichkeit [Abbildung in dieser Leseprobe nicht enthalten] oder [Abbildung in dieser Leseprobe nicht enthalten] mit Wahrscheinlichkeit [Abbildung in dieser Leseprobe nicht enthalten] sein. Zweitens, für die Varianz des Störterms ei ergibt sich folgendes:

(2-2) Abbildung in dieser Leseprobe nicht enthalten

Die Wahrscheinlichkeiten [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] können durch die Annahme, das der Erwartungswert [Abbildung in dieser Leseprobe nicht enthalten], berechnet werden. Das bedeutet, dass

Abbildung in dieser Leseprobe nicht enthalten,

was nach Auflösung dieser Gleichung für [Abbildung in dieser Leseprobe nicht enthalten] ergibt. Somit ist die Varianz des Störterms [Abbildung in dieser Leseprobe nicht enthalten] wie folgt:

Abbildung in dieser Leseprobe nicht enthalten

was besagt, dass der Störterm Heteroskedastie aufweist – bei Beobachtungen, für welche Pi nah 1 oder 0 liegt, wird die Varianz relativ klein sein; bei solchen, die nah ½ liegen – groß. Das Problem kann leicht gelöst werden, indem der GLS-Schätzer („Weighted Least Squares“) angewendet wird. Die Varianz von [Abbildung in dieser Leseprobe nicht enthalten] kann konsistent geschätzt werden, durch [Abbildung in dieser Leseprobe nicht enthalten]definiert als:

(2-3) Abbildung in dieser Leseprobe nicht enthalten,

wobei [Abbildung in dieser Leseprobe nicht enthalten] der angepasste Kleinstquadratenwert von [Abbildung in dieser Leseprobe nicht enthalten] ist. Somit betrifft das zweite Problem [Abbildung in dieser Leseprobe nicht enthalten], der negativ sein könnte oder den Wert 1 für einige [Abbildung in dieser Leseprobe nicht enthalten] annimmt. Da [Abbildung in dieser Leseprobe nicht enthalten] ein Schätzer für [Abbildung in dieser Leseprobe nicht enthalten] ist, sollten sich die Werte von [Abbildung in dieser Leseprobe nicht enthalten] auf das Intervall [0,1] beschränken. Das dritte Problem und natürlich das seriöseste betrifft den Schnittpunkt und die Steigung. Die Letzten sind nicht für alle Werte von [Abbildung in dieser Leseprobe nicht enthalten] konstant, sondern verändern sich wie folgt:

1. Für [Abbildung in dieser Leseprobe nicht enthalten] sind der Schnittpunkt und die Steigung gleich Null.
2. Für [Abbildung in dieser Leseprobe nicht enthalten] ist der Schnittpunkt gleich [Abbildung in dieser Leseprobe nicht enthalten] und die Steigung gleich [Abbildung in dieser Leseprobe nicht enthalten].
3. Für [Abbildung in dieser Leseprobe nicht enthalten] ist der Schnittpunkt gleich 1 und die Steigung gleich 0.

Die Abbildung 1 veranschaulicht die Schwächen des linearen Wahrscheinlichkeitsmodells.

Die Kleinstquadratschätzer für [Abbildung in dieser Leseprobe nicht enthalten] und und [Abbildung in dieser Leseprobe nicht enthalten], die auf den zu den Punkten [Abbildung in dieser Leseprobe nicht enthalten] [Abbildung in dieser Leseprobe nicht enthalten] Beobachtungen bas [Abbildung in dieser Leseprobe nicht enthalten] oder [Abbildung in dieser Leseprobe nicht enthalten] basieren, korrespondierenden Beobach-tungen basieren, sind verzerrt und

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Vorhersage mit dem linearen WM

inkonsistent. Theoretisch gesehen könnte diese Verzerrung vermieden werden, indem solche Punkte ausgeschlossen werden. Darüber hinaus ist in der Realität unmöglich diese Punkte zu identifizieren, da [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] unbekannt sind. Das Problem kann überwältigt werden, indem die gewichteten Kleinstquadratschätzer der Restriktion [Abbildung in dieser Leseprobe nicht enthalten] unterworfen werden. Diese Lösung des oben dargestellten Problems ist unordentlich und die Stichprobeneigenschaften des daraus resultierenden Schätzers sind unbekannt.[2]

2.1 Spezifikation der Probit-und Logit-Modelle

Dieses Konsistenzproblem kann dadurch gelöst werden, indem das lineare Wahrscheinlichkeitsmodell so modifiziert wird, dass die Vorhersagen für alle [Abbildung in dieser Leseprobe nicht enthalten] im Intervall (0,1) liegen, unter der Voraussetzung, dass anwachsende [Abbildung in dieser Leseprobe nicht enthalten]-Werte mit anwachsenden (absteigenden) Werten der abhängigen Variablen verbunden bleiben. Diese Anforderung erfüllt eine kumulierte Verteilungsfunktion.[3] Die sich daraus ergebende Verteilung ist

(2-4) Abbildung in dieser Leseprobe nicht enthalten

2.1.1 Das Probit-Modell

Eine mögliche [Abbildung in dieser Leseprobe nicht enthalten]-förmige Funktion, welche die Voraussetzungen eines Wahrscheinlichkeitsmodells erfüllt, ist die kumulierte Verteilungsfunktion der Normalverteilung, die dem sogenannten Probit-Modell entspricht. Es wird eine unbeobachtbare Variable [Abbildung in dieser Leseprobe nicht enthalten] definiert als

Abbildung in dieser Leseprobe nicht enthalten,

wobei [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] [Abbildung in dieser Leseprobe nicht enthalten]unabhängig sind. Die beobachtbare binäre Variable [Abbildung in dieser Leseprobe nicht enthalten] ist mit [Abbildung in dieser Leseprobe nicht enthalten] in der folgenden Art und Weise verbunden.

Abbildung in dieser Leseprobe nicht enthalten wenn Abbildung in dieser Leseprobe nicht enthalten

Abbildung in dieser Leseprobe nicht enthalten wenn Abbildung in dieser Leseprobe nicht enthalten

Dann

(2-5) Abbildung in dieser Leseprobe nicht enthalten

wobei [Abbildung in dieser Leseprobe nicht enthalten] die kumulierte Verteilungsfunktion der standardisierten Normalverteilung darstellt. Das bedeutet, dass

Abbildung in dieser Leseprobe nicht enthalten,

wobei [Abbildung in dieser Leseprobe nicht enthalten]für die Dichtefunktion von [Abbildung in dieser Leseprobe nicht enthalten] steht. Da [Abbildung in dieser Leseprobe nicht enthalten], können wir die Notation verwenden, dass

(2-6) Abbildung in dieser Leseprobe nicht enthalten,

wobei [Abbildung in dieser Leseprobe nicht enthalten] die Umkehrfunktion der kumulierten Verteilungsfunktion der standardisierten Normalverteilung darstellt.

[Abbildung in dieser Leseprobe nicht enthalten] ist ein stetiger Index[4], der von der unabhängigen Variable als [Abbildung in dieser Leseprobe nicht enthalten] bestimmt wird. Beobachtungen für [Abbildung in dieser Leseprobe nicht enthalten] stehen nicht zur Verfügung. Das Probit-Modell gibt Antwort auf die Frage, wie die Parameter [Abbildung in dieser Leseprobe nicht enthalten] und [Abbildung in dieser Leseprobe nicht enthalten] zu schätzen sind und wie dadurch der Index [Abbildung in dieser Leseprobe nicht enthalten] zu erhalten ist.

2.1.2 Das Logit-Modell

Die Unzulässigkeiten des linearen Wahrscheinlichkeitsmodells schlagen eine nicht lineare Spezifikation vor. Eine andere Möglichkeit bietet die [Abbildung in dieser Leseprobe nicht enthalten]-förmige Kurve, die sich auf das Intervall (0,1) beschränkt, und darüber hinaus [Abbildung in dieser Leseprobe nicht enthalten] wenn [Abbildung in dieser Leseprobe nicht enthalten], und [Abbildung in dieser Leseprobe nicht enthalten] wenn [Abbildung in dieser Leseprobe nicht enthalten]. Eine solche Kurve ist die logistische Kurve und das dazu korrespondierte Modell ist als Logit-Modell bekannt. Seine Spezifikation ist

(2-7) Abbildung in dieser Leseprobe nicht enthalten, wobei Abbildung in dieser Leseprobe nicht enthalten.

Nachdem wir [Abbildung in dieser Leseprobe nicht enthalten] setzen und die obige Gleichung nach [Abbildung in dieser Leseprobe nicht enthalten] auflösen, erhalten wir folgende Gleichung

(2-8) [Abbildung in dieser Leseprobe nicht enthalten], wo alle Logarithmen Naturallogarithmen sind.

Denn noch gibt [Abbildung in dieser Leseprobe nicht enthalten] den Anteil der Eventualquoten von [Abbildung in dieser Leseprobe nicht enthalten] gegen [Abbildung in dieser Leseprobe nicht enthalten].

Das Logit-Modell besitzt einige spezifische Eigenschaften. Erstens, sollten wir an dem Effekt der Veränderung von [Abbildung in dieser Leseprobe nicht enthalten] auf die Wahrscheinlichkeit, dass [Abbildung in dieser Leseprobe nicht enthalten], interessiert sein, können wir feststellen, dass

(2-9) Abbildung in dieser Leseprobe nicht enthalten.

Zweitens, sollte die logistische Kurve als eine kumulierte Wahrscheinlichkeitsfunktion von [Abbildung in dieser Leseprobe nicht enthalten] betrachtet werden, sodass [Abbildung in dieser Leseprobe nicht enthalten], dann kann die Dichtefunktion von [Abbildung in dieser Leseprobe nicht enthalten] als [Abbildung in dieser Leseprobe nicht enthalten] (logistische Verteilung) dargestellt werden.[5]

2.1.3 Vergleich zwischen dem Logit- und Probit-Modell

Wenn man sich mit binären abhängigen Variablen befasst, ergibt sich selbstverständlich die Frage, welches der beiden nicht linearen Modelle gewählt werden soll. Die beste Antwort auf die oben gestellte Frage sollte auf theoretischer Begründung beruhen, aber eine gut entwickelte Theorie, welche die genaue Funktionsform festlegt, scheint zu fehlen. Viele Autoren neigen dazu, sich auf folgende Punkte zu einigen.[6]

1. Wenn [Abbildung in dieser Leseprobe nicht enthalten] nicht sehr groß bzw. nicht sehr klein ist, dann liefern das Probit-und das Logit-Modell ähnliche Ergebnisse (Abbildung 2, S. 11). Die Wahl des Modells ist in meisten Fällen willkürlich. Darüber hinaus hat die logistische Funktion schwerere Ausläufe als die kumulierte der Normalverteilung. Somit spielt keine so große Rolle welche der beiden Funktionen zur Anwendung kommt, ausgenommen den Fall, in dem die Daten in den Ausläufer stark konzentriert sind.
2. Da die kumulierte logistische Verteilungsfunktion einerseits dieser der Normalverteilung ähnlich ist und anderseits rechnerisch einfacher ist, wird das Logit-Modell öfter in der Praxis im Vergleich zum Probit-Modell angewendet. Die große Ähnlichkeit zwischen den Logit-und Probit-Modellen ist auf die dichotomischen abhängigen Variablen beschränkt. Wenn die abhängige Variable polytomisch ist, dann besteht es einen enormen Unterschied zwischen den zwei Modellen.

[...]


[1] Vgl. Amemiya (1994), S. 315f.

[2] Judge, G.G., Hill, R.C., Griffiths, W.E., Lütkepohl, H. and Lee, T.C. (1988), S. 759-761.

[3] Vgl. Neusser (2000), S. 2.

[4] Vgl. Pindyck et.al.(1998), S.254.

[5] Im Fall, dass das lineare Wahrscheinlichkeitsmodell als eine kumulierte Verteilungsfunktion betrachtet wird, dann ist die entsprechende Dichtefunktion gleichförmig.

[6] Jude et al., op.cit., S. 762 ; G.S. Maddala (1983), S.9; P. Schmidt and A.D. Witte, (1984), S.22.

Ende der Leseprobe aus 31 Seiten

Details

Titel
Anwendung der binären Entscheidungsmodelle: Logit und Probit
Hochschule
Eberhard-Karls-Universität Tübingen  (Lehrstuhl für Mathematik und Statistik)
Veranstaltung
Einführung in die Ökonometrie: Seminar für Doktoranden
Note
1,0
Autor
Jahr
2003
Seiten
31
Katalognummer
V13510
ISBN (eBook)
9783638191562
Dateigröße
815 KB
Sprache
Deutsch
Schlagworte
Anwendung, Entscheidungsmodelle, Logit, Probit, Einführung, Seminar, Doktoranden
Arbeit zitieren
Nikolinka Fertala (Autor:in), 2003, Anwendung der binären Entscheidungsmodelle: Logit und Probit, München, GRIN Verlag, https://www.grin.com/document/13510

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Anwendung der binären Entscheidungsmodelle: Logit und Probit



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden