Lade Inhalt...

Operante Konditionierung und positive Verstärkung im Pferdetraining

Projektarbeit 2017 39 Seiten

Pferdewissenschaft

Leseprobe

Inhaltsverzeichnis

1 Einleitung

2 Klassische Konditionierung
2.1 Einflussfaktoren auf den Konditionierungsprozess
2.2 Praxis

3 Instrumentelle Konditionierung
3.1 Instrumentelle Konditionierung im Pferdetraining

4 Operante Konditionierung
4.1 Verhaltensaufbau und Verhaltensabbau
4.1.1 Positive Verstärkung
4.1.2 Negative Verstärkung
4.1.3 Positive Bestrafung
4.1.4 Negative Bestrafung
4.1.5 Löschen
4.1.6 Andere Möglichkeiten zum Abbau von Verhalten
4.1.7 Positive versus negative Verstärkung in der Praxis
4.1.8 Fazit
4.2 Verstärkungspläne
4.2.1 Kontinuierliche Verstärkung
4.2.2 Variable Quote (= variable ratio; VR)
4.2.3 Prozent-Verstärkungspläne
4.3 Verhaltensmodifikation
4.3.1 Capturing
4.3.2 Shaping
4.3.3 Chaining
4.3.4 Praxis
4.4 Generalisierung und Diskrimination
4.5 Kontingenz

5 Verschiedene Pferde

6 Resümee

7 Literaturverzeichnis

8 Abbildungsverzeichnis

9 Anhang
9.1 Konditionierung auf den Klicker
9.1.1 Gruppe 1
9.1.2 Gruppe 2

Abstract

Nowadays, most horses in Central Europe are "only" leisure horses. But this does not mean that it is unimportant to know how horses learn and if there is a method with which horses can be trained the fastest since every domesticated horse has to learn at least a few things. The following, literature-based, pre-scientific work will indicate the most often used methods to teach horses something and whether those are also the most effective ones or not.

The main attention will be spent on operant conditioning, especially on positive reinforcement, since operant conditioning is most often used and positive reinforcement seems to be the best choice in most situations and because it is best explored. Different ways to modify behaviour will be discussed as well as the most popular methods to get rid of unwanted behaviour or to increase the wanted one. Furthermore different schedules of reinforcement and some influences on the learning process will be shown.

After taking all the different possibilities to alter behaviour into account, it can be said that it depends highly on the individual horse which method will be the most successful. However, in most cases positive reinforcement to increase the frequency with which behaviour is shown and training an incompatible alternative behaviour in order to get rid of behaviour seem to be most effective.

Vorwort

Es dürfte angebracht sein, mein Pferd Nino zu erwähnen, denn erst durch sein schwieriges und gefährliches Verhalten als Reaktion auf Druck habe ich begonnen, mich nach alternativen Trainingsmethoden umzusehen und bin dabei auf das Klicker-Training gestoßen und in weiterer Folge auf die Lernpsychologie. Nino hat viele „Experimente“ und Fehler geduldig ertragen und mir dabei durch sein kluges Verhalten meine Fehler immer aufgezeigt und mich dazu veranlasst, mein Handeln ihm gegenüber zu verbessern. Ihm gebührt mein größter Dank, auch, da er bei sämtlichen Selbstversuchen, die ich im Zuge der vorwissenschaftlichen Arbeit ausprobiert habe, brav mitgemacht hat.

Außerdem möchte ich mich bei allen Pferden und Besitzern bedanken, die zur Entstehung der vorliegenden Arbeit beigetragen haben.

Ich möchte ausdrücklich erwähnen, dass ich in der gesamten Arbeit, sofern keine konkrete Person gemeint ist, männliche oder neutrale Formulierungen verwendet habe, um die Lesbarkeit zu verbessern, allerdings auch alle anderen Geschlechtsidentitäten miteinschließen möchte.

1 Einleitung

Wer schon einmal Pferde bei Showauftritten gesehen hat, wird zustimmen, dass sie oft zu schier unglaublichen Leistungen fähig sind – die Früchte von jahrelangem Training.

Lernen ist mehr als das häufig damit assoziierte „Vokabel lernen“ in der Schule; lernen inkludiert vielmehr auch das Aneignen von Verhaltensweisen, das Einprägen von Konzepten und das Merken von Folgen eines Verhaltens – und ebendies wird im Pferdetraining gelehrt und gelernt.

Es gibt verschiedene Möglichkeiten, einem Pferd ein bestimmtes Verhalten beizubringen, welche in der vorliegenden Arbeit vorgestellt und vor allem unter dem Aspekt des effektivsten Lernens kritisch verglichen werden. Dabei wird besonders auf die operante Konditionierung mit der Hauptgewichtung auf positiver Verstärkung eingegangen. Es soll nicht verschwiegen werden, dass die Schwerpunktsetzung sowohl aufgrund der Tatsache, dass die operante Konditionierung im Pferdetraining am häufigsten verwendet wird, als auch wegen meiner ethischen Einstellung gegen unnötige Schmerzzufügung im Training erfolgte.

Den Beginn der Arbeit stellt die klassische Konditionierung dar, welche im Pferdetraining jedoch sehr selten verwendet wird, weshalb dieses Kapitel kurzgefasst ist und lediglich die wesentlichsten Prinzipien behandelt. Auch der folgende Abschnitt „Instrumentelle Konditionierung“ ist auf jene Grundlagen reduziert, die für das Verständnis der operanten Konditionierung, welche das größte Kapitel darstellt, vonnöten sind. Die operante Konditionierung wiederum ist geteilt in die Grundlagen beziehungsweise relevanten Forschungen, einen Teil über die verschiedenen Optionen zum Verhaltensaufbau bzw. -abbau sowie einen Abschnitt zu den unterschiedlichen Möglichkeiten, ein Verhalten zu modifizieren.

Mittels einiger Studien wird der Unterschied zwischen positiver und negativer Verstärkung erörtert. Auch andere Faktoren, die den Trainingserfolg beeinflussen, werden der Vollständigkeit halber angesprochen; da dies jedoch nicht das Thema der vorliegenden Arbeit ist, können diese nur durch die Anmerkung von Studien angeschnitten werden.

Nicht Teil meiner Arbeit sind angeborene Verhaltensweisen wie Instinkte oder Reflexe, Latentes Lernen, also Lernen ohne Verstärkung bzw. Bestrafung, Sensibilisierung und Desensibilisierung, das bedeutet eine Erhöhung bzw. Verminderung der Reaktion auf Reize, sowie Modelllernen, was das Imitieren eines Verhaltens bezeichnet, da all diese Themen für das Pferdetraining nicht besonders relevant sind und die Ausführung ebendieser den Rahmen der Arbeit sprengen würde.

Die vorliegende Arbeit stützt sich auf die im Literaturverzeichnis angegebenen Bücher, von denen die beiden Bücher „Lernen und Verhalten“ von James E. Mazur, welches eine wissenschaftlich fundierte Übersicht über die Lernpsychologie gibt, und Emma Lethbridges Buch „Knowing Your Horse – A Guide to Equine Learning, Training and Behaviour“, welches einen guten Überblick über das Lernverhalten von Pferden bietet, hervorgehoben werden sollen. Zudem wurde im Zuge der vorwissenschaftlichen Arbeit ein, im Anhang hinzugefügtes, Experiment durchgeführt, welches allerdings nicht den wissenschaftlichen Standards entspricht und nur als Beispiel zu sehen ist. Das Hauptaugenmerk soll jedoch während der gesamten Arbeit auf der wissenschaftlich bestätigten Theorie und nicht auf den Ergebnissen des Experiments oder der Umfrage liegen, auch wenn diese zur Bestätigung von wissenschaftlichen Untersuchungen immer wieder angemerkt werden.

2 Klassische Konditionierung

Die klassische Konditionierung, auch Signallernen oder Reiz-Reaktionslernen genannt, ist eine sehr machtvolle, meist unbewusste und häufig geschehende Konditionierung, bei welcher ein Reiz mit einer Reaktion verknüpft wird.

Der Arzt und Physiologe Iwan Petrowitsch Pawlow (1849–1936) legte mit seinen, eigentlich zufälligen, Experimenten mit Hunden („Pawlow’scher Hund“) den Grundstein der klassischen Konditionierung. Pawlow wollte ursprünglich die Speichelzusammensetzung von Hunden bei Futtergabe untersuchen und entwickelte hierfür eine Apparatur, welche den Speichel des Hundes auffängt. Allerdings bemerkte er, dass die Hunde schon vor der Futtergabe zu speicheln begannen, weshalb Pawlow annahm, dass ein anderer Reiz den Speichelfluss auslösen muss. Um diese Annahme zu überprüfen, ließ er immer fünf Sekunden vor der Futtergabe eine elektrische Glocke läuten, woraufhin die Hunde schon beim Glockenläuten zu speicheln begannen – die Hunde waren konditioniert, das bedeutet, dass sie gelernt hatten, dass auf die Glocke immer Futter folgt.

Damit eine klassische Konditionierung stattfinden kann, muss ein unbedingter Reiz (= US, unconditioned stimulus; z. B. Futter) eine unbedingte Reaktion (= UR, unconditioned response; z. B. Speichelfluss) auslösen, was bedeutet, dass die Reaktion auf den Reiz angeboren sein muss. Durch Konditionierung wird ein ehemals neutraler Reiz (= NS, neutral stimulus; z. B. Glocke) mit dem unbedingten Reiz in Verbindung gebracht, wodurch der neutrale Reiz zu einem bedingten Reiz (= CS, conditioned stimulus; genauer CS+, doch das ist nur für die konditionierte Inhibition, welche hier nicht erläutert wird, relevant) wird und eine bedingte Reaktion (= CR, conditioned response) auslöst, sodass am Ende der bedingte Reiz alleine reicht, um die bedingte Reaktion auszulösen. (vgl. Gerrig 2015, 203‑205)

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Akquisition (klassische Konditionierung)

Dies ist allerdings vereinfacht, denn die bedingte Reaktion ist selten komplett ident mit der unbedingten Reaktion. Hierauf soll jedoch nicht näher eingegangen werden und nur auf Pawlows, mittlerweile als widerlegt geltende, Stimulussubstitutionstheorie und konditionierte kompensatorische Reaktionen, also CR, die das Gegenteil der UR sind, verwiesen werden. (vgl. Mazur 2006, 108‑110) Ebenso ist der neutrale Reiz nie vollkommen neutral, denn jeder Reiz löst eine bestimmte Reaktion, meist Orientierungsreaktion, aus. Soll der Reiz für eine Konditionierung verwendet werden, so darf diese Reaktion jedoch nicht der unbedingten Reaktion ähneln. Beispielsweise löst die Glocke eventuell eine erhöhte Aufmerksamkeit oder eine Orientierungsreaktion aus, dies hat jedoch nichts bzw. nur sehr wenig mit der Reaktion, also Speichelfluss, auf Futter bzw. Futterankündigung zu tun. (vgl. Bodenmann/Perrez u. a. 2016, 49 f) Außerdem darf der Reiz, der konditioniert werden soll, nicht gewöhnlich sein, denn Tiere lernen nur, wenn Ereignisse ihren Erwartungen widersprechen. (vgl. Rescorla/Wagner 1972, 75)

Im Pferdetraining wird nur sehr wenig mit klassischer Konditionierung gelehrt; sie wird fast nur für das Klicker-Training verwendet, bei welchem ein Klicker zu einem konditionierten Reiz wird, welcher Futter ankündigt. Ein Klicker ist ein „Knackfrosch“, bei dem ein Metallplättchen gebogen wird, wodurch ein Geräusch entsteht. Genau genommen ist bei der Konditionierung auf den Klicker die CR irrelevant, da es lediglich wichtig ist, dass das Pferd den Klick als Ankündigung für das folgende Futter erkennt und es nicht von Bedeutung ist, ob das Pferd dadurch mehr Speichel produziert. (vgl. Lethbridge 2009, 75f)

2.1 Einflussfaktoren auf den Konditionierungsprozess

Es gibt verschiedene Einflussfaktoren auf den Konditionierungsprozess, wobei die Konditionierung am effektivsten erfolgt, wenn die Zeit zwischen Einsetzen des NS und des US wenige Sekunden beträgt und der NS vor dem US auftritt. Eine gewisse Kontiguität, also ein räumlich-zeitlicher Zusammenhang zwischen NS und US, ist jedoch für jeden Konditionierungsprozess eine notwendige Voraussetzung. Weitere wichtige Einflussfaktoren sind der aktuelle (emotionale) Zustand des Tieres, die Wichtigkeit und Intensität des NS und US für das zu konditionierende Tier sowie die Diskriminierbarkeit des NS von anderen Reizen. (vgl. Bodenmann/Perrez u. a. 2016, 59) Für die Ausbildung einer Reiz‑Reaktionsverbindung ist zudem Kontingenz erforderlich. Kontingenz bedeutet, dass der NS eine Vorhersagekraft hat. Wenn die Wahrscheinlichkeit, dass nach dem Reiz der US folgt, gleich groß ist, wie ohne Reiz, so wird der NS nicht zu einem CS werden, da er dann bedeutungslos ist. (vgl. Kiesel/Koch 2012, 44‑47)

Aufgrund dieser Faktoren sollte die Konditionierung auf den Klicker bestenfalls in einer ruhigen, reizarmen und dem Pferd gut bekannten Umgebung erfolgen. Der psychische und physische Zustand des Pferdes sollte gut und der Klicker für das Pferd wahrnehmbar sein und immer eine Belohnung zur Folge haben.

2.2 Praxis

Um die Konditionierung auf den Klicker bei verschiedenen Einflussfaktoren zu beobachten wurden 32 Pferde auf den Klicker konditioniert. Bei vierzehn Pferden wurde dabei die Zeit zwischen NS und US variiert, wobei die schnellste Konditionierung (15 Kopplungen) bei einem Pferd erreicht wurde, bei dem die Zeitdifferenz eine bis drei Sekunden betrug; ab einem Zeitunterschied von zehn Sekunden erfolgte keine Konditionierung mehr. Bei weiteren 18 Pferden wurde die Umgebung, in der die Konditionierung erfolgte, variiert. Die beste Konditionierung gelang bei Pferden, die in einer ihnen bekannten, ruhigen und reizarmen Umgebung konditioniert wurden, während bei Pferden, die (aufgrund einer unruhigen Umgebung) gestresst, ängstlich und abgelenkt waren, keine Konditionierung erfolgte.

3 Instrumentelle Konditionierung

Während bei der klassischen Konditionierung vorangehende Reize ein Verhalten hervorrufen, sind es bei der instrumentellen Konditionierung die nachfolgenden Konsequenzen, die das Verhalten ändern. (vgl. Edelmann/Wittmann 2012, 74) Bei der instrumentellen Konditionierung besteht im Gegensatz zur operanten Konditionierung ein Problem, welches das Tier zu lösen versucht. Während bei der klassischen Konditionierung nur unwillkürliche, das bedeutet nicht-steuerbare, angeborene Reaktionen von Seiten des Tieres erfolgen, führt das Tier bei der instrumentellen und auch operanten Konditionierung eine willkürliche, also bewusste und zielgerichtete Handlung aus. Willkürliche Verhaltensweisen setzen voraus, dass das Tier weiß, was es erreichen möchte; der (Miss-)Erfolg ebendieser bestimmt, ob das willkürliche Verhalten beibehalten wird, oder ob es verändert wird. Es wird also nicht nur gelernt, wann welches Verhalten ausgeführt werden kann, sondern auch, welchen Effekt die einzelnen Verhaltensweisen zur Folge haben. (vgl. Hoffmann/Engelkamp 2017, 33 f; 43 f)

Edward Lee Thorndike (1874–1949) hat mit seinen Versuchen, bei denen er Katzen, Hunde und Hühner in einen seiner „Problemkäfige“ sperrte, den Grundstein der instrumentellen und operanten Konditionierung gelegt. Er sperrte das Tier in seine „puzzle box“, die sich durch eine oder mehrere Handlungen öffnen ließ, legte Futter vor den Käfig und maß die Zeit, die benötigt wurde, um den Käfig zu öffnen. Der erste Versuch aus dem Käfig zu entkommen dauerte jedes Mal ziemlich lang, doch mit jedem weiteren Versuch verkürzte sich die Zeit, die das Tier zum Öffnen der Türe brauchte, bis es innerhalb weniger Sekunden entkam. (vgl. Schermer 2014, 53‑55) Thorndike formulierte daraufhin mehrere wichtige „Gesetze“ des Lernens, welche trotz einiger Revisionen in ihren Grundsätzen auch heute noch gelten. Die drei Wichtigsten sind:

Law of Readiness (Gesetz der Bereitschaft)

Dieses Gesetz besagt, dass das Tier ein Motiv haben muss, damit es ein Verhalten ausführt. Wenn das Tier keinen Vorteil aus einer Handlung zieht, wird es diese auch nicht ausführen. (vgl. Winkel/Petermann u. a. 2006, 101) Die Motivation zur Ausführung kann dabei intrinsisch oder extrinsisch sein. Intrinsische Motivation bedeutet, dass die Ausführung des Verhaltens selbst verstärkend wirkt – „Die Tätigkeit wird um ihrer selbst willen ausgeführt.“ Extrinsische Motivation dagegen bezeichnet äußere Motive, welche die Ausführung der Handlung bewirken. (vgl. Brandstätter/Schüler u. a. 2013, 91) Diese Anreize können im Pferdetraining – bei welchem die Ausführung der meisten Verhaltensweisen extrinsisch motiviert ist – beispielsweise Futter oder Schmerzvermeidung sein. (vgl. Lethbridge 2009, 47)

Law of Exercise (Gesetz der Übung)

Das Gesetz der Übung drückt aus, dass ein Verhalten nur dann gefestigt wird, wenn es regelmäßig wiederholt wird. Eine einmalige Ausführung reicht in den meisten Fällen nicht aus, um das gewünschte Verhalten zu verinnerlichen. (vgl. Lefrançois 2006, 66 f)

Law of Effect (Gesetz der Wirkung)

Nur wenn ein Verhalten erfolgreich ist, wird es gespeichert. Ein Verhalten, das nicht zum gewünschten Erfolg führt, wird nicht mehr so häufig bzw. gar nicht mehr gezeigt, da sich der Energieaufwand, den das Verhalten fordert, nicht lohnt. (vgl. Thorndike 2012, 244‑272)

Jedoch muss hier das latente Lernen berücksichtigt werden. Latentes Lernen bedeutet, dass etwas gelernt, allerdings nicht gezeigt wird, solange das Tier keinen Anreiz dazu hat. Aus, von John Seward durchgeführten, Versuchen mit Ratten geht hervor, dass die Tiere sich beispielsweise die Wege eines Labyrinths einprägen, auch wenn sie dafür keine Belohnung bekommen. Die richtigen Wege wählen sie jedoch erst dann zielstrebig, wenn sie Futter erwarten. (vgl. Hoffmann/Engelkamp 2017, 37 f)

3.1 Instrumentelle Konditionierung im Pferdetraining

Im Pferdetraining wird die instrumentelle Konditionierung fast nie genutzt, allerdings lernen Pferde durchaus einige Verhaltensweisen durch diese Konditionierung. Als Beispiel soll das selbstständige Öffnen der Box dienen, wodurch das Pferd, zum Leid der Besitzer, selbst entkommen kann. Durch Versuch und Irrtum gelangt das Tier zufälligerweise zum „richtigen“ Verhalten wie beispielsweise dem Hochheben eines Riegels mit der Unterlippe, welches durch den Erfolg, in diesem Beispiel der Zugang zur Futterkammer oder zum Gras, verstärkt wird. Beim nächsten Mal wird das Pferd schon schneller entkommen – und der Besitzer muss dem Pferd wortwörtlich einen Riegel vorschieben.

4 Operante Konditionierung

Der US-amerikanische Psychologe Burrhus Frederic Skinner (1904­­–1990) entwickelte die instrumentelle Konditionierung Thorndikes weiter, indem er Ratten und Tauben in die sogenannte „Skinner-Box“ sperrte, in welcher diese verschiedene Verhaltensweisen zeigen konnten und eine davon, z. B. Drücken eines Hebels oder Picken auf eine bestimmte Stelle, mit Futter verstärkt wurde. Durch die Belohnung wurde das kritische Verhalten immer häufiger gezeigt; die Tiere hatten also gelernt, dass sie Futter erwarten können, wenn sie ebendieses Verhalten ausführen. Anderes Verhalten wurde nicht verstärkt, weshalb die anderen Verhaltensweisen immer mehr vom verstärkten Verhalten abgelöst wurden und schließlich gar nicht mehr gezeigt wurden. (vgl. Schlüter 2015, 104‑107)

Die operante Konditionierung kann also auch als Verhalten-Affekt-Beziehung verstanden werden, da das Tier hierbei, ähnlich der instrumentellen Konditionierung, aus der Rückmeldung in Form von Belohnung oder Bestrafung lernt. (vgl. Hilgard/Bower 1971, 129‑132) Im Gegensatz zur instrumentellen Konditionierung, bei welcher nur das vollständige, richtig ausgeführte Verhalten zum Erfolg bzw. der Belohnung führt, besteht beim operanten Konditionieren auch die Möglichkeit, Zwischenschritte zu verstärken – und zu bestrafen. Dadurch ist die Gefahr von Frustration geringer, da das Pferd zu jeder Verhaltensänderung eine Rückmeldung erhält. (vgl. Czarnecki 2016, 28‑39)

4.1 Verhaltensaufbau und Verhaltensabbau

Es gibt grundsätzlich fünf verschiedene Konsequenzen auf ein Verhalten:

- positive Verstärkung
- negative Verstärkung
- positive Bestrafung
- negative Bestrafung
- Löschen

Bestrafung und Löschung führen zu einem Verhaltensabbau, also einer Senkung der Häufigkeit, mit der das kritische Verhalten auftritt, während Verstärkung einen Verhaltensaufbau bewirkt. Positiv und negativ bezeichnet dabei die Zugabe (positiv) beziehungsweise Wegnahme (negativ) eines Reizes, ist also mathematisch und nicht wertend im Sinne von „gut“ und „schlecht“ zu verstehen.

Sowohl eine Verstärkung als auch eine Bestrafung sollte motivationsadäquat, also angemessen sein. (vgl. Edelmann/Wittmann 2012, 75 f) Angemessen bezieht sich dabei sowohl auf das zu lernende Verhalten, den aktuellen psychischen, physischen, motivationalen und emotionalen Zustand des Tieres und den Entwicklungsstand des Pferdes, eventuelle konkurrierende Verstärkungen bzw. Bestrafungen (vgl. Campell/Church 1969, 111 f) als auch auf frühere Erfahrungen des Tieres. Ein Beispiel für eine konkurrierende Verstärkung wäre das Grasfressen, welches als Verstärkung wirkt, wenn eigentlich das ruhige Stehen ohne gleichzeitiges Fressen geübt werden sollte. Frühere Erfahrungen beeinflussen beispielsweise die Hochwertigkeit eines Futters in großem Maße, so ist Hafer für ein Pferd, das ihn täglich „einfach so“ zur Fütterung bekommt, meist nicht so erstrebenswert wie für ein Tier, das sich den Hafer nur im Training erarbeiten kann. Es entscheidet jedoch nicht der Mensch, was angemessen ist, sondern das jeweilige Pferd – jedes Pferd hat andere Vorlieben und Abneigungen. Während für das eine Streicheln eine Verstärkung ist, kann es für ein anderes eine Bestrafung sein. Eine Konsequenz, die zu einer Steigerung der Häufigkeit, mit der das kritische Verhalten auftritt, führen soll, muss vom Pferd als angenehm und erstrebenswert empfunden werden während etwas, das als Bestrafung dienen soll, vom Pferd als unangenehm empfunden werden muss. (vgl. Wendt 2014a, 38)

[...]

Details

Seiten
39
Jahr
2017
ISBN (eBook)
9783668542464
ISBN (Buch)
9783668542471
Dateigröße
616 KB
Sprache
Deutsch
Katalognummer
v371850
Note
Schlagworte
operante konditionierung verstärkung pferdetraining

Autor

Teilen

Zurück

Titel: Operante Konditionierung und positive Verstärkung im Pferdetraining