Lade Inhalt...

Simulation der Entstehung von Weltbildern durch neuronale Netze und deren Anwendung auf Marketingprobleme

Diplomarbeit 2008 89 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1. Einleitung

2. Hebb und Lernregeln
2.1 Hebb-Prinzip und etablierte Lernregeln
2.1.1 Hebbsche Lernregel
2.1.2 Delta-Lernregel
2.1.3 Backpropagation-Lernregel
2.2. Neue Erweiterung der Hebb-Regel und Begründung
2.2.1 Relevanz

3. Fragen - Untersuchungen
3.1 Marketing
3.1.1 Nike in Deutschland
3.1.2 Volksbanken und Raiffeisenbanken
3.1.3 Folgerungen

4. Programmtechnische Modellbeschreibung

5. Programm
5.1 Allgemeine Beschreibung
5.2 Graphische Netzstruktur
5.3 Nachrichten
5.4 Interaktionen
5.5 Setzen von Marketing-Trends

6. Experimente
6.1 Variation der Parameter und k
6.2 Variation der Aktivierungswerte
6.3 Variation der Resistenzgrenze
6.4 Indoktrination mehrerer Begriffe
6.5 Imagewerte
6.6 Variation von Bedürfnis, Kapital und Zustandswert
6.7 Interagierende interaktive Netze
6.7.1 Ein favorisierendes Netz
6.7.2 Netze mit verschiedenen Präferenzen
6.7.2.1 Erweiterung um neutrales Netz
6.7.3 Unterschiedliche Subnetze

7. Fazit

Literaturverzeichnis

Internetquellen

Anhang A - Installationsanleitung

Anhang B - Protokoll Experiment 6.3

Abbildungsverzeichnis

Abbildung 1: Schichtenmodell eines neuronalen Netzes

Abbildung 2: Beispiel eines Endzustandes in einem IN

Abbildung 3: Plakat Nike

Abbildung 4: Werbung Adidas Sport und Mode

Abbildung 5: Hauptmenü

Abbildung 6: Fehlermeldung bei unvollständigem Netz

Abbildung 7: Neuerstellung eines Netzes

Abbildung 8: Graphische Darstellung eines Netzes

Abbildung 9: Bedeutung einer Nachricht

Abbildung 10: Protokollabschnitt für Zustandswert

Abbildung 11: Exemplarische Neuanbindung des Begriffes „Frisur“

Abbildung 12: Kommunikationsbeziehungen

Abbildung 13: Setzen von Marketing-Trends

Abbildung 14: Netz Experiment 1

Abbildung 15: Gewichtsmatrix Experiment Kaffee

Abbildung 16: Netzstruktur Experiment Kaffee

Abbildung 17: Bedeutung Netz 3 Experiment Kaffee

Abbildung 18: Netz Waschmittel

Abbildung 19: Bedeutung Netz Waschmittel

Abbildung 20: Gewichtsmatrix Experiment Dauerlutscher

Abbildung 21: Protokoll Experiment Dauerlutscher

Abbildung 22: Imagesteigerung von „tropisch“

Abbildung 23: Bedeutung Experiment Dauerlutscher

Abbildung 24: Gewichtsmatrix Experiment Jeans

Abbildung 25: Protokoll Experiment Jeans vor Marketing-Beeinflussung

Abbildung 26: Protokoll Experiment Jeans nach Marketing-Beeinflussung

Abbildung 27: Indoktriniertes Netz Waschpulver

Abbildung 28: Protokoll dreier indoktrinierter IN

Abbildung 29: letzte Nachricht Experiment Kaffee

Abbildung 30: Bedeutung der Nachricht Netz 3

Abbildung 31: semantisches Netz 1 Paris

Abbildung 32: semantisches Netz 2 Paris

Abbildung 33: Bedeutung Netz 2 Paris

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1. Einleitung

Der Mensch ist im täglichen Leben unzähligen Reizen ausgesetzt, welche in verschiedener Art und Weise wahrgenommen werden. So können Informationen aus der Umwelt über die Sinnesorgane aufgenommen und anschließend verarbeitet werden. Bei der Aufnahme bestimmter Reize entstehen bei jedem Menschen bestimmte Erstassoziationen, gefolgt von weiteren Assoziationen, die das kognitive System beeinflussen und eventuell Reaktionen auslösen.

Bei manchen Menschen allerdings führen auch unterschiedliche Impulse zu immer den gleichen Assoziationen, so dass das kognitive Netzwerk stark reduziert arbeitet. Dies bedeutet, dass verschiedene Ereignisse auf immer die gleiche Ursache zurückgeführt werden. Gefährlich werden diese Aspekte im Hinblick auf fanatische Weltanschauungen, wenn beispielsweise die Verschwörung des Westens gegen den Islam oder auch die patriarchalische Unterdrückung der Frauen propagiert werden (vgl. Klüver, 2006). All diese aufgeführten Beispiele zeigen Weltbilder auf, die aufgrund einseitiger Reduktion entstehen. Umweltimpulse aller Art werden folglich nicht mehr vollständig und differenziert verarbeitet, sondern ziemlich schnell auf immer die gleiche Ursache zurückgeführt.

Basierend auf diesem Gedanken befasst sich diese Arbeit zunächst mit der Entstehung solcher einseitigen Weltbilder. Anhand von sog. interaktiven Netzen (IN), welche das kognitive System eines Menschen modellhaft repräsentieren sollen und mit deren Hilfe Kommunikation simulierbar ist, wird über Experimente versucht dieser Frage auf den Grund zu gehen. Als Umweltimpulse werden hierbei Botschaften in ein IN gesendet, die nach bestimmten Regeln verarbeitet werden. Diese Thematik wird ausführlich im Kapitel 2 erläutert.

Da Menschen aufgrund von Umwelteinflüssen ihre internen Strukturen und Ansichten verändern können bzw. dieses auch notwendigerweise müssen, ist es erforderlich sog. Lernregeln in die Netze zu integrieren. Nur durch Lernregeln ist es möglich, dass Netze neue Inhalte verarbeiten und zudem vorhandene Strukturen aufbrechen und modifizieren können. Das bekannteste Lernverfahren für neuronale Netze (NN) allgemein ist das von Donald Hebb und wird in dieser Arbeit ebenfalls thematisiert. Die Grundzüge dieser Regel, welche die Lernprozesse im Gehirn beschreiben, werden in Kapitel 2 in den Grundsätzen kurz skizziert, um anschließend weitere darauf aufbauende Aspekte darstellen zu können. Beispiele für Anwendungsgebiete der Hebbschen Lernregel sollen den praktischen Einsatz verdeutlichen sowie Schwachstellen dieser Regel aufzeigen. Anschließend wird in dieser Arbeit eine Erweiterung der Hebbschen Lernregel angeführt, welche das Lernen des Menschen realitätsadäquat durch IN darstellt. Diese neue Lernregel bildet den Kern dieser Arbeit, da sie die Regeln der Informationsverarbeitung und deren Veränderung aufzeigt, welche den IN zugrunde liegen.

In Kapitel 3 werden konkret Fragestellungen fokussiert, die im weiteren Verlauf beantwortet werden sollen. Damit Experimente auf Basis der gerade genannten Lernregel durchgeführt werden können, wird in Kapitel 4 ein formales, programmiertechnisches Kommunikationsmodell dargestellt, das aufzeigt, nach welchen Mechanismen die Eingabe als auch Ausgabe der Kommunikation zwischen IN zu erfolgen hat. Darüber hinaus werden in diesem Kapitel alle relevanten Parameter sowohl erläutert als auch spezifiziert. Dieses Modell wiederum ist Ausgangspunkt für die Implementierung eines selbst entwickelten Programms (Kapitel 5), mit dessen Hilfe konkrete Experimente in Kapitel 6 durchgeführt werden können.

Neben Auswirkungen einzelner Parameter werden auch Kommunikationsbeziehungen zwischen verschiedenen IN betrachtet um herauszufinden, wie die verschiedensten Netze auf dieselbe Indoktrination seitens der Umwelt reagieren und inwieweit diese IN interagieren können. Interessant in diesem Kontext wird die gegenseitige Beeinflussung „fanatisierter“ Netze sein, ob diese ihre einseitige Assoziation noch weiter verstärken und somit fanatische Submilieus bilden oder inwieweit Außenseiter entstehen, welche sich durch Umweltimpulse kaum beeinflussen lassen.

Der Kernbereich dieser Arbeit liegt deutlich bei der Entwicklung als auch Anwendung der o.a. neuen Lernregel, inklusive des daraus resultierenden Modells. Somit hat die Arbeit den Fokus im Bereich der Informatik. In diesem Kontext muss jedoch darauf hingewiesen werden, dass es sich um Grundlagenforschung handelt, die auf neuen theoretischen Erkenntnissen basiert (vgl. Klüver, 2007). Diese notwendig allgemeinen Betrachtungen werden im Verlauf dieser Arbeit noch unter wirtschaftlichen Fragestellungen analysiert und es werden Ansätze für das Marketing hieraus entwickelt. Es wird u.a. untersucht, wie Werbebotschaften auf die einzelnen Netze wirken und welche Reaktionen diese auszulösen vermögen. Können Werbetreibende gezielt ihre Marken so bewerben, dass diese so stark in den kognitiven Netzen der Konsumenten verankert werden, dass diese ausschließlich das geworbene Produkt kaufen? Darüber hinaus gilt es zu klären, welche Käufertypen überhaupt modelliert werden können und ob die neue Lernregel auf alle bereits bekannten Typen anwendbar ist.

Zum Schluss wird diese Arbeit die Simulationsergebnisse und die daraus gewonnenen Erkenntnisse evaluieren und die praktische Einsetzbarkeit dieses Modells überprüfen. Außerdem werden analog bereits vorhandene ähnliche Ansätze im Marketing kurz angeschnitten.

2. Hebb und Lernregeln

Um das allgemeine Prinzip von Lernregeln und insbesondere das Prinzip von Donald Hebb verstehen zu können, ist es zunächst notwendig, das Grundprinzip eines neuronalen Netzes kurz darzustellen.

Neuronale Netze dienen dazu, die Struktur des menschlichen Gehirns schematisch darzustellen sowie dessen Funktionsweise zu simulieren. Die Nervenzellen werden in diesen Netzen als Neuronen bezeichnet, zwischen denen mit Hilfe von biochemischen und physikalischen Prozessen Wechselwirkungen entstehen (vgl. Patterson, 1997). Voraussetzung dieser Wechselwirkungen sind Verbindungen zwischen den einzelnen Neuronen, welche Informationsaustausch erst ermöglichen. Da Impulse zwischen den einzelnen Neuronen nicht gleichmäßig im Netz verteilt werden, sind die o.g. Verbindungen zusätzlich mit sog. Gewichten versehen, welche ankommende Impulse verstärken als auch abschwächen können. Alle eingehenden Impulse werden im Neuron selbst mit den jeweiligen Verbindungsgewichten multipliziert und anschließend addiert, so dass sich daraus der sog. Nettoinput oder auch Aktivierungszustand des Neurons ergibt. Überschreitet dieser zuvor ermittelte Wert eine bestimmte Schwelle (den Schwellwert des Neurons), so wird die Aktivierung in Form eines Impulses an die über den Ausgangskanal angeschlossenen Neuronen weitergegeben (vgl. Patterson, 1997).

Häufig werden die Neuronen in drei verschiedene Schichten eingeteilt. Die Eingabeschicht enthält Neuronen, welche direkten Kontakt zur Umwelt haben und somit auf externe Impulse reagieren und entsprechend aktiviert werden. Diese geben ihre Signale nach dem oben genannten Verfahren an die Neuronen der sog. Zwischenschicht (auch verdeckte Schicht genannt) weiter, einer Schicht, in der die Neuronen keinen direkten Kontakt zur Umwelt haben. Zum Schluss existiert die Ausgabeschicht, welche die Neuronen enthält, die die Lösung des Netzes repräsentieren. Dieses Schichtenmodell beschreibt ein allgemeines Modell, das nicht zwangsläufig jedem neuronalen Netz zugrunde liegen muss. So können durchaus Netze existieren, welche mehrere Zwischenschichten besitzen als auch solche, welche zwei- oder sogar einschichtig sind. Bei Letzteren fehlt die Zwischenschicht und bei einschichtigen Netzen gehören alle Neuronen sowohl zur Eingabe- als auch zur Ausgabeschicht.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Schichtenmodell eines neuronalen Netzes Quelle: Stoica et al. 2002 S. 9

Generell können zwei Netztypen klassifiziert werden, welche sich in der Richtung der Informationsausbreitung unterscheiden. Werden Informationen grundsätzlich nur von oben nach unten entsprechend dem oben dargestellten Prinzip gesendet, so handelt es sich um ein feed forward Netz. Wird allerdings nach dem Erreichen der Ausgabeschicht die Informationsrichtung umgedreht, so handelt es sich um ein feed back Netz (vgl. Patterson, 1997).

An dieser Stelle ist das Grundprinzip der Informationsverarbeitung eines neuronalen Netzes hinreichend beschrieben, da von den Umweltimpulsen hin zur Lösung des Netzes alle Vorgehensweisen dargestellt wurden. Allerdings reagiert ein solches Netz, wie bislang skizziert, auf dieselben Impulse seitens der Umwelt stets mit demselben Ergebnis, da die Mechanismen deterministisch immer gleich angewendet werden. Intuitiv wird schnell klar, dass diese beschriebene Informationskette nicht zufrieden stellend sein kann, da ein vom Netz generierter Lösungsvektor, welcher als schlecht eingestuft wird, bei dem gleichen Input nicht erneut generiert werden soll. Um dies realisieren zu können ist es notwendig, die interne Topologie des Netzes (die o.g. Verbindungsgewichte) zu modifizieren, um bei gleicher Anwendung der Regeln andere Ergebnisse erzielen zu können. Dieses Verfahren der Anpassung nennt sich Lernen.

Neben der Grundform der neuronalen Netze existieren zudem so genannte interaktive neuronale Netze (IN). Dabei handelt es sich um rekurrente Netzwerke, welche nicht lernen (vgl. Stoica, 2000). Strukturell existieren keine Unterschiede zu herkömmlichen neuronalen Netzen, jedoch lernen IN nicht, da sie anders als lernende NN keinen Prozess des Lernens beschreiben sollen, sondern von einem aktuellen Lernzustand ausgehen. Anwendungen finden diese Netze meist bei der Modellierung logischer Beziehungen zwischen einzelnen Einheiten eines Systems wie beispielsweise sozialen Klassen, Aussagen über Textabschnitte und dergleichen (vgl. Stoica, 2000).

Mit Hilfe von Lernprozessen ist es neuronalen Netzen möglich sich zu optimieren und bei festgelegtem Input einen bestmöglichen Output zu erzielen. Darüber hinaus ist die Eigenschaft des Lernens essenziell, um sich an veränderte Umweltbedingungen anzupassen. Allgemein ist die Lernfähigkeit eines Netzes abhängig von der sog. Lernrate , welche Auskunft über die individuelle Anpassungsfähigkeit gibt. Die Lernbereitschaft eines Menschen ist von sehr vielen Faktoren abhängig und sehr induviduell (vgl. Mazur, 2006), so dass die Lernrate bei neuronalen Netzen je nach Simulation sehr unterschiedlich eingestellt werden kann. Bislang existieren bereits einige Lernregeln, welche Vorschriften aufzeigen, wie die interne Topologie zu modifizieren ist. Die Wichtigsten werden im Folgenden kurz dargestellt.

2.1 Hebb-Prinzip und etablierte Lernregeln

Die in der Literatur wohl bekannteste als auch am häufigsten zitierte Lernregel ist die von Donald Hebb. Der kanadische Psychologe und Physiologe hat aufbauend auf den Arbeiten von William James die Erkenntnis der Lernfähigkeit Ende der 40er Jahre entwickelt. Unter Berücksichtigung der biochemischen Prozesse, welche eine Änderung der Aktivierungszustände hervorrufen, stellte Hebb das folgende Grundprinzip dar: Ist ein Axon der Zelle A nahe genug, um eine Zelle B immer wieder zu erregen, dann findet eine metabolische Veränderung in einer der beiden Zellen (oder in beiden) statt, so dass die Effektivität der Zelle A gesteigert wird, um die Zelle B zu erregen (vgl. Hebb, 1949).

Bei einem genaueren Hinschauen wird die Veränderung zwischen den Zellen A und B in Abhängigkeit der Häufigkeit der Erregung ersichtlich; eine Erkenntnis, welche für diese Arbeit noch sehr bedeutsam sein wird.

Neben dem Ansatz für eine Verstärkung der Verbindungen, stellte Hebb zudem Überlegungen zum Vergessensprozess in einem System an. Hierzu stellte er die folgenden beiden Thesen auf:

Das Vergessen ereignet sich als Beigabe zu neuem Lernen. Dies bedeutet, dass permanente Verbindungen, also solche, welche aufgrund der oben dargestellten Verstärkungen entstehen, zwar bestehen bleiben würden, jedoch durch Schaffung weiterer Verbindungen ihr ursprüngliches Verhalten zugunsten eines anderen ersetzt würde. (vgl. Hebb, 1949).

Die zweite These beruht darauf, dass Knoten bei Nichtnutzung verschwinden. Dieser Fall würde das Vergessen direkt erklären. (vgl. Hebb, 1949).

Hebb schlussfolgert schließlich, dass alte, tief verfestigte Erinnerungen im Gehirn bestehen bleiben und diese nur durch sich zentrierende Prozesse eliminiert werden können. Weniger stark gefestigte Erinnerungen hingegen gehen schrittweise verloren, wenn diese nicht mehr verstärkt werden (vgl. Hebb, 1949).

2.1.1 Hebbsche Lernregel

Diese Lernregel kann sowohl auf einschichtige als auch zweischichtige Netze angewendet werden und wird formal wie folgt dargestellt:

Abbildung in dieser Leseprobe nicht enthalten

Die Veränderung der Gewichtswerte von Neuron i zu Neuron j wird ermittelt via der Lernrate , dem Aktivierungswert des empfangenen Neurons aj, sowie dem Wert des sendenden Neurons oi. Die Lernrate ist ein reeller Wert (meistens < 1), der einen Faktor darstellt, welcher als individuelle Lernfähigkeit bzw. Lernbereitschaft aufgefasst werden kann (vgl. Hoffmann, 1993).

2.1.2 Delta-Lernregel

Die Delta-Lernregel, welche auch aufgrund ihrer Erfinder Widrow und Hoff die Widrow-Hoff-Regel genannt wird, findet ihren Einsatz im Bereich des überwachten Lernens1. Formal kann diese Regel wie folgt dargestellt werden:

Abbildung in dieser Leseprobe nicht enthalten

wobei erneut die Lernrate ist, ti der gewünschte Wert des aktuell betrachteten Neurons, aj der Aktivierungswert des empfangenden Neurons und oi der Ausgang des sendenden Neurons. (vgl. Hoffmann, 1993). Ersichtlich wird, dass bei geringerer Differenz proportional die Veränderung der Gewichte verringert wird und somit das Netz sich dadurch einer guten Lösung annähern kann.

2.1.3 Backpropagation-Lernregel

Die Backpropagation-Lernregel (BPL) kann auf mehrschichtige Netze angewandt werden und findet sowohl bei feed forward Netzen als auch bei feed back Netzen ihren Einsatz. Dieser Algorithmus ist besonders dazu geeignet, das Problem der Aktivierungspotentiale für Neuronen der Zwischenschicht(en) im Bereich des überwachten Lernens zu lösen. Vom Ansatz her entspricht die BPL der Verallgemeinerung der eben dargestellten Delta-Regel und es existieren zudem einige verschiedene Varianten sowie Erweiterungen, wie beispielsweise die BP mit variabler Lernrate oder BP Trägheitsterm. (vgl. Bodendorf, 2005). Da die konkreten Ausführungen dieser Regeln für diese Arbeit nicht weiter von Relevanz sind, wird auf eine detaillierte Betrachtung an dieser Stelle verzichtet.

2.2. Neue Erweiterung der Hebb-Regel und Begründung

Die bisher dargestellten Lernregeln werden häufig in der Literatur auf das Hebb-Prinzip zurückgeführt, welches leider nicht ganz der Wahrheit entspricht. Blicken wir kurz darauf zurück, dass die hier dargestellten Lernregeln zwar die Verbindungen zwischen den Neuronen verstärken als auch abschwächen, aber gerade nicht in Abhängigkeit der Häufigkeit ihrer Aktivierungen. Die Änderung der internen Topologie erfolgt, wie beispielsweise bei Anwendung der Delta-Regel, insofern mathematisch, als dass Modifikationen der Verbindungsgewichte ausschließlich auf Basis eines Lösungsvektors vorgenommen werden, also in Abhängigkeit von der Größe der Differenz zwischen Soll- und Istwert. Die Häufigkeiten der Aktivierungen, welche durch Umwelteinflüsse gegeben werden, sind somit für die zuvor betrachteten Lernregeln nicht weiter relevant für die Anpassungen der Strukturen des Netzes.

Um dem wirklichen Prinzip von Hebb gerecht zu werden, nämlich dass ein kognitives System auf wiederholte gleichartige Inputs der Umwelt mit entsprechenden Änderungen aufgrund der Häufigkeit reagiert, wird im Rahmen dieser Arbeit eine neue Regel eingeführt, welche Basis für die weiteren Ausführen ist; sie heißt Hebb2-Regel.

Um diese Regel darstellen zu können, wird zunächst das Grundmodell der Nachrichtenverarbeitung im Folgenden dargestellt, da dieses den Ausgangspunkt für die Hebb2-Regel bildet.

Die Grundidee hierbei ist, dass die bislang sehr allgemein gehaltenen externen Impulse im Sinne der Nachrichtenverarbeitung als Nachrichten mit bestimmten Begriffen als Inhalt verstanden werden können. Ein IN dient dazu, ein kognitives System eines empfangenden Kommunikationspartners zu repräsentieren (vgl. Klüver, 2007). Die dem IN übermittelten Nachrichten bestehen aus dreidimensionalen Vektoren, welchen genau drei Begriffe entsprechen. Die Begriffe in diesem kognitiven Netz sind aufgrund semantischer Beziehungen untereinander verbunden und mit entsprechenden Verbindungsgewichten ausgestattet (vgl. Klüver, 2007). Nachdem eine Nachricht an das IN gesendet wurde, generiert dieses nach den in Kap. 2 dargestellten Verfahren daraufhin bestimmte Punktattraktoren2 oder Attraktoren3 mit Perioden größer als 1. Der Attraktor ist das Ergebnis der Nachrichten bzw. Informationsverarbeitung in einem empfangenden kognitiven System. In diesem Sinn stellt er die Bedeutung dar, die die Nachricht für den Empfänger hat. Diese Bedeutung besteht in diesem Fall nur aus den drei am st ä rksten endaktivierten Einheiten. Dieser Aspekt zeigt, dass dieses Modell versucht, einen Ansatz dafür zu liefern, Bedeutung mathematisch zu erfassen. Aufgrund einer solchen Bedeutung, welche als Interpretation der Input-Nachrichten verstanden werden kann, darf in diesem Kontext auch von einem semantischen Netz (SN) gesprochen werden.

Gegeben sei nun ein IN, bestehend aus den Begriffen A, B, C, D, E, F, G und H. Diese Begriffe bilden den sog. Wortschatz des IN, also die Begriffe, die das IN „kennt“. Das Netz erhält als Input Botschaften, die aus Begriffstripeln (z.B. A, B, C) bestehen. Diese Begriffe sind Teil des kognitiven Netzwerkes, welches das IN repräsentiert. Die entsprechenden Neuronen, die den Begriff im Inputvektor repräsentieren, werden aktiviert und die Information wird nach dem bereits dargestellten Verfahren (vgl. Kap. 2) im Netz verbreitet. Bei Erreichen eines Attraktors wird die Bedeutung der Nachricht gemäß dem oben dargestellten Prinzip ermittelt. Da die Begriffe der Nachricht selbst zu Beginn aktiviert werden, bilden sie nicht selten in einem funktionierenden Netzwerk zugleich die Bedeutung (vgl. Klüver, 2006).

Dieses Grundmodell soll nun Anhand eines Beispiels verdeutlicht werden, welchem das folgende semantische Netzwerk zugrunde liegt (vgl. Klüver, 2007).

Abbildung in dieser Leseprobe nicht enthalten

Als Nachricht werden nun die Begriffe “Java“, “applet“ und “language“ gesendet. Die entsprechenden Neuronen im Netz, die diese Begriffe repräsentieren, werden mit 0,05 aktiviert. Gemäß der Informationsausbreitung in neuronalen Netzen allgemein, generiert das Netz den folgenden Endzustand:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Beispiel eines Endzustandes in einem IN Quelle: Klüver, 2007 S. 52

Die Länge der Balken stellt hierbei den Aktivierungswert eines jeden Neurons im Endzustand des IN dar, welches einen Begriff repräsentiert. Als Bedeutung der zuvor an das Netz gesendeten Nachricht erhalten wir somit „Java“, „applet“ und „language“ (vgl. Klüver, 2007).

Nach dieser Erläuterung des Grundmodells der Nachrichtenverarbeitung kann darauf aufbauend jetzt die Hebb2-Regel erläutert werden.

Nach dem allgemein dargestellten Prinzip sei nun weiter A ein Begriff, der häufig in den Botschaften enthalten ist und sei H der Begriff, der praktisch nie in einer Botschaft vorkommt. Das IN ist charakterisiert durch eine "Lern- bzw. Veränderungsrate" η mit 0 ≤ η ≤ 1, die das individuelle Veränderungsmaß dieses IN ausdrückt. Dieses Maß variiert entsprechend der Bereitschaft eines Individuums, seine Topologie an die empfangenen Nachrichten anzupassen und kann als Lernbereitschaft oder Änderungsbereitschaft aufgefasst werden. Sei weiter k das Maß für die Häufigkeit von empfangenen Nachrichten, in denen ein bestimmter Begriff, also hier A, enthalten ist, also eine natürliche Zahl mit k > 1. Dann gilt folgende Regel:

Nach der k-ten Nachricht (A, X, Y) gilt

Abbildung in dieser Leseprobe nicht enthalten

für alle Begriffe X, die in den k Nachrichten enthalten waren und

Abbildung in dieser Leseprobe nicht enthalten

für alle Begriffe Y und einen Begriff Z, welcher in den k Nachrichten nicht verwendet wurde (vgl. Klüver, 2006).

Hiermit wäre der erste Schritt getan, dass Hebb-Prinzip adäquat auf neuronale Netze bzw. IN umzusetzen, da nun ein kognitives System auf wiederholte gleichartige Impulse der Umwelt auf die oben genannte Weise reagiert. Bei entsprechender Indoktrination des Systems wird dieses seine Struktur nun so anpassen, dass ein Begriff A (im obigen Beispiel der Zentralbegriff4 des Netzes), welcher in einem bestimmten Zeitraum mit Abstand am häufigsten in Nachrichten vorkommt, fokussiert wird. D.h. die Verbindungen aller Begriffe, welche zusammen mit A vorkamen, werden zu A hin verstärkt. Begriffe wie beispielsweise H, die nur sehr selten vorkommen, werden auf diese Weise „vergessen“. Da das Vergessen nicht einem deterministischen Verfahren unterliegt, werden diesem Mechanismus noch Wahrscheinlichkeiten und Zufallsprinzipien hinzugefügt, was an späterer Stelle noch einmal genauer erläutert wird. Hinzuzufügen sei noch eine Abbruchbedingung. Die Verbindungsgewichte können nicht beliebig erhöht als auch abgeschwächt werden, da eine Verbindung höchstens maximal und im Gegenzug nicht weniger als nicht mehr existent sein kann. Aus diesem Grunde sind nur Werte zwischen 0 und 1 zulässig. Ist ein Verbindungsgewicht 1 bedeutet es, dass eine maximale Beziehung von einem Begriff zu einem anderen herrscht und es somit nicht weiter erhöht werden darf. Analog wird ein Verbindungsgewicht von 0 nicht weiter abgeschwächt, weil es schon aufzeigt, dass keine Beziehung mehr vorhanden ist.

Nachdem nun das Grundprinzip der neuen Hebb2-Regel erläutert wurde, gilt es, die Voraussetzung für ein fanatisiertes oder reduziert einseitiges Netz einmal genau zu untersuchen. Eine permanente Indoktrination des Netzes seitens der Umwelt setzt eine bereits fanatisierte Umwelt voraus. Bei der Frage allerdings, wie eine solche Umwelt entstehen kann ohne sie vorauszusetzen, wird deutlich, dass es noch einen zweiten Mechanismus geben muss, der zur Radikalisierung des kognitiven Systems führt. Es handelt sich hierbei um eine Selbstverstärkung des kognitiven Systems. Man kann vermuten, dass außergewöhnlich abnorme Fälle wie beispielsweise Sexbesessenheit primär durch Selbstverstärkung entstehen, da eine entsprechende Indoktrination durch eine Umwelt kaum vorzustellen ist (vgl. Klüver, 2006).

Sei (X, Y, Z) eine Botschaft und A sei wieder der Begriff in einem IN, der die Reduktion sozusagen zentral steuert. Wenn ein derartiges IN auch dann A als Bedeutung generiert, ohne dass notwendig A ein Bestandteil der Nachricht ist, dann findet ebenfalls eine Verstärkung und Abschwächung nach der obigen Regel statt. Es genügt folglich, dass das empfangende System A als (Teil)Bedeutung generiert, um die Veränderungsmechanismen in Gang zu setzen. Dazu muss das IN natürlich bereits entsprechend disponiert sein. Dies lässt sich z.B. durch ein relativ hohes η und ein niedriges k vorstellen: Bereits wenige Nachrichten mit A als Bestandteil würden dann genügen, um A bereits eine bestimmte Zentralstelle zu geben. Der Mechanismus der Selbstverstärkung führt dann dazu, dass das IN im obigen Sinne zentralisiert wird. Dies entspricht dem bekannten Prinzip der kleinen Ursache und großen Wirkungen bzw. der Sensitivität gegenüber bestimmten Anfangszuständen. Die anfängliche Größe von η wirkt also hier als ein Parameter für eine entsprechende Dynamik. Wenn man zusätzlich η zu Beginn eines solchen Prozesses proportional zur "Zentralisierung" des IN wachsen lässt - gemessen z.B. an der Stärke der Verbindungen w(X, A) in Relation zu den übrigen Werten w(X, Y) -, dann erhalten wir eine komplexere Dynamik. Das Wachstum von η findet dann seine Grenze entweder über die obigen Abbruchbedingungen oder, im Fall einer asymptotischen Funktion, bei hinreichender Annäherung an die Grenzwerte 1 und 0. (vgl. Klüver, 2006).

Ein Zentralbegriff, welcher nach dem k-ten Vorkommen einer Nachricht gebildet wird, kann durch einen anderen Begriff abgelöst werden, sobald dieser die Häufigkeit des Zentralbegriffes überschreitet. Ab diesem Zeitpunkt werden die Verbindungen hin zum neuen Begriff verstärkt. Da das menschliche Gehirn sich allerdings mit der Zeit stark verändert und die Lernbereitschaft mit dem Alter sehr häufig abnimmt, wird schnell klar, dass ein Wechsel des fokussierten Wortes kein immer wieder anzuwendender Mechanismus sein kann. Ab einem bestimmten Zeitpunkt ändert das menschliche Gehirn seine Strukturen nur noch minimal oder gar nicht mehr. Um dieses Phänomen in der Hebb2-Regel zu integrieren, wird eine so genannte Resistenzgrenze r eingeführt.

Die Resistenzgrenze r ist eine natürliche Zahl für die Folgendes gilt:

Wird ein Zentralbegriff A solange hintereinander verstärkt, dass die Resistenzgrenze r überschritten wird, so wird das Netz selbst resistent, d.h. es wird kein neuer Begriff mehr als Zentralbegriff akzeptiert, selbst wenn dessen Vorkommen das des Zentralbegriffes überschreitet.

2.2.1 Relevanz

Die dargestellte Hebb2-Regel bildet den Schwerpunkt dieser Arbeit, auf deren Basis auch die Experimente durchgeführt werden. Bei der Darstellung eines kognitiven Netzwerkes sind allerdings die bisher aufgeführten Komponenten, wie sie in der Hebb2- Regel etabliert sind, nicht vollständig beschrieben. Die Indoktrination seitens der Umwelt und die daraus resultierenden Bedeutung sagen noch nichts über die Relevanz der Nachricht für ein empfangendes System aus.

Unter Relevanz wird verstanden, inwieweit eine Nachricht praktische Konsequenzen für einen Empfänger hat und falls dem so ist, in welchem Ausmaß (vgl. Klüver, 2007). An einem simplen Beispiel kann diese recht theoretische Definition einmal verdeutlicht werden:

Nachrichten aus dem Bereich des Fußballs wie beispielsweise „Spieler X ist heute verletzt“, „Spieler Y wechselt den Verein“ oder „Mannschaft A schlägt Mannschaft B im Elfmeterschießen“ rufen sicherlich unterschiedliche Reaktionen in kognitiven Netzen hervor, wenn ein Netz einen absoluten Fußballsfan repräsentiert, ein anderes Netz jemanden, mit höchstem Desinteresse an Fußball allgemein. Neben den Verbindungsgewichten der einzelnen Neuronen und dessen Aktivierungszuständen ist somit eine weitere, evaluierende Komponente von großer Bedeutung. Eine hohe Endaktivierung eines bestimmten Begriffes sagt noch nichts über den Wert und somit den Nutzen für das zugrunde liegende IN aus. Dieser Aspekt wird später noch einmal unter dem Gesichtspunkt Marketing aufgegriffen.

3. Fragen - Untersuchungen

Nachdem nun dargestellt wurde, durch welche Mechanismen Netze fanatisch oder abnorm werden, liegt primär die Frage nach der Entstehung solcher Netze nahe. Was sind Voraussetzungen dafür, dass ein interaktives Netz nach externer Indoktrination in (fast) immer demselben Attraktor endet und was könnte getan werden um genau das zu verhindern?

Interessant wird zudem die Fragestellung des Kommunikationsprozesses interagierender interaktiver Netze sein, d.h. wie beispielsweise eine Unterhaltung solcher Netze untereinander aussieht. Findet eine mögliche Beeinflussung eines normal funktionierenden Netzes durch ein sich abnorm verhaltenes Netz statt? Weiterhin wird zu untersuchen sein, welche Bedeutung die individuelle Lernbereitschaft / Änderungsbereitschaft bei einer fanatisierten Umwelt hat und inwieweit sich durch Kommunikation Submilieus, Außenseiter und andere Gruppen bilden können. Da, wie bereits weiter oben erwähnt, mit zunehmendem Alter die Lernbereitschaft bei fast allen Menschen abnimmt und sich somit die internen Strukturen immer seltener bis gar nicht mehr verändern, gilt es herauszufinden, welche Mechanismen diesen Prozess aufhalten oder beschleunigen können.

Diesen sehr theoretischen Aspekten folgen im Anschluss konkrete Überlegungen im Bereich des Marketings. Interessant wird hier die Fragestellung sein, wie Hersteller als auch Händler diese Informationen über die Netzstrukturen gezielt im Bereich der Werbung einsetzen können, um Kunden zu akquirieren, an sich zu binden und für neue Produkte zu begeistern. Kann dies konkrete Auswirkungen auf Werbespots haben und wird vielleicht schneller erkannt, wann ein Imagewandel für ein neues Produkt nötig ist?

3.1 Marketing

Die bislang dargestellten Konzepte als auch Überlegungen basieren auf einem sehr abstrakten und theoretischen Prinzip. Um dem gesamten Thema dieser Arbeit Praxisnähe zu verleihen, werden spezielle Aspekte des Marketings herausgegriffen und Wirkungen von Werbung anhand des Programms analysiert.

An dieser Stelle sei noch einmal kurz an das Thema Relevanz erinnert. Im Kapitel 2.2.1 wurde bereits skizziert, dass Begriffe in einem kognitiven System einer Wertung unterliegen, die Auskunft darüber gibt, wie wichtig oder unwichtig verschiedene Aspekte für Individuen sind. Aus betriebswirtschaftlicher Sichtweise ist nun eine Erweiterung dieser Erkenntnis notwendig, da nicht nur die kognitiven Strukturen selbst, sondern auch die daraus resultierenden Handlungen von Interesse sind. Gerade im Bereich des Marketings ist es essentiell, die Untersuchungen mithilfe der Hebb2-Regel als auch deren Erweiterungen immer im Gesamtkonzept des S-O-R Modells zu betrachten, welches im folgenden kurz skizziert wird.

Das S-O-R-Modell, oder auch S-O-R-Paradigma bzw. S-O-R-Schemata genannt, basiert auf dem neobehavioristischen Konzept der Verknüpfung von

- S: Stimulus (Reiz)
- O: Organismus
- R: Reaktion

Dieses Modell basiert auf der Annahme, dass neben den messbaren und beobachtbaren Variablen wie dem Stimulus und der Reaktion, auch solche Konstrukte zugelassen werden, welche nicht beobachtbar und nur indirekt über Indikatoren empirisch erfasst werden können (vgl. Kroeber-Riel et al., 2003).

Das S-O-R-Paradigma versucht somit, die im Organismus des Menschen ablaufenden Vorgänge, welche nicht beobachtbar sind, zu erklären und diese bei seinem Verhalten zu berücksichtigen. (vgl. Kroeber-Riel et al., 2003). Im Bereich des Marketings werden die Erklärungsversuche als Operationalisierung von Konstrukten verstanden, wobei Konstrukte beispielsweise „Einstellung“ oder „wahrgenommenes Kaufrisiko“ sein können (vgl. Trommsdorff, 2004).

Halten wir uns diesen Aspekt einmal vor Augen, so wird offensichtlich, dass das beschriebene Hebb2- Prinzip dieser Arbeit genau dem Organismus des S-O-R-Modells entspricht. Die Hebb2-Regel erklärt die Prozesse im Organismus, die dann zu einem bestimmten Verhalten (Reaktion) führen. Exemplarisch für das Marketing könnte eine Form von Stimulus, Organismus und Reaktion wie folgt dargestellt werden:

Eine bestimmte Werbebotschaft, welche den externen Umwelteinflüssen und somit dem Stimuli entspricht, könnte als Input in ein kognitives System aufgenommen werden. Dort werden aufgrund der ankommenden Impulse nach dem dargestellten Verfahren der Hebb2-Regel Verbindungen verstärkt und es wird bei Bildung eines Attraktorzustandes die Bedeutung der Werbebotschaft generiert. Diese könnte anschließend zu einem Kauf, somit der Reaktion, des umworbenen Produktes führen.

Die Erkenntnis einer Reaktion aufgrund von bestimmten Attraktorzuständen führt dazu, dass die Hebb2 - Regel um die Komponente der Handlung zu erweitern ist. Demzufolge existiert neben dem kognitiven Netzwerk, also dem Bereich, der aus den eingehenden Nachrichten eine Bedeutung generiert, noch ein sog. Aktionsnetzwerk, welches bei bestimmten Systemzuständen eine Handlung ausführt. Die Verbindung zwischen den beiden Netzwerken führt dazu, dass manche Attraktorzustände eine gewisse Handlung auslösen, andere wiederum nicht (vgl. Klüver, 2007).

Unter dem betriebswirtschaftlichen Aspekt kann nun der Begriff Wert als das Bedürfnis in Bezug auf ein gewisses Produkt verstanden werden. Menschen reagieren höchst unterschiedlich auf Werbebotschaften, welches neben anderen Faktoren u.a. auch mit einem Bedürfnis nach dem umworbenen Produkt zusammenhängt. Beispielweise schenkt eine Mutter einem Werbespot über Babywindeln deutlich mehr Aufmerksamkeit als eine kinderlose Frau (vgl. Esch, 2004).

Die starke Abhängigkeit zwischen der Bedeutung einer Nachricht und dem Bedürfnis eines Produktes kann an einem einfachen Beispiel verdeutlicht werden. Der Kauf von Schokolade ist beispielsweise abhängig davon, inwieweit der Kauf geplant ist (hoher Bedürfniswert), oder ob er vielmehr durch spontane externe Reize ausgelöst wurde (hohe externe Aktivierung). Diese These kann zudem über die im Marketing hinlänglich bekannten Arten von Kaufentscheidungen, in denen der Anteil der kognitiven Komponente dargestellt wird, abgesichert werden (vgl. Kroeber-Riel et al., 2003).

Nachdem dargestellt wurde, welche Faktoren unter anderem den Kauf eines Produktes beeinflussen, gilt es nun aufzuzeigen, bei welchen Systemzuständen ein Kauf auch tatsächlich stattfindet. Neben dem Aktivierungswert und der Bedeutung ist nun noch ein weiterer, sehr entscheidender Faktor im Bereich der Betriebswirtschaft und Volkswirtschaft einzuführen, nämlich das Kapital. D.h. ein Produkt wird nur dann gekauft, wenn das Bedürfnis nach diesem hoch genug ist und zugleich die monetären Möglichkeiten ausreichend sind. Ist nur eines der beiden Kriterien erfüllt, wird das Produkt nicht gekauft, wenn wir einmal von Krediten etc. absehen. Diese vereinfachte Annahme muss für das später folgende Modell getroffen werden, auch wenn gleich eine nähere volkswirtschaftliche Betrachtung eine Überschuldung von derzeit rund 7,3 Millionen Bewohner Deutschlands aufzeigt (vgl. creditreform.de, 2007). Auch bei objektiv fehlendem Kapital kann also der Kaufreiz durch ein entsprechendes Bedürfnis stark genug sein, um den Kauf zu tätigen. Insofern ist das obige Modell eine Idealisierung. Dieser Aspekt kann formal wie folgt dargestellt werden:

Zunächst wird ein sog. Zustandswert Z definiert, welcher sich aus dem Produkt des Bedürfnisses eines Gutes, dem Aktivierungswert des Gutes und dem verfügbaren Kapital zusammensetzt. Die Bildung eines solchen Zustandswertes ist sinnvoll, da die Faktoren in der jeweiligen Kombination ihrer Werte den Gesamtzustandswert ergeben. Ist das Konsumbedürfnis eines Produktes A sehr hoch, das verfügbare Kapital hingegen niedrig, nimmt der Zustandswert einen sehr niedrigen Wert an, so dass das Produkt höchstwahrscheinlich nicht gekauft werden kann. Ist andersherum das Konsumbedürfnis eines Produktes B sehr niedrig, jedoch ausreichend Kapital vorhanden, wird das Produkt ebenfalls nicht gekauft, weil der Bedarfswert nicht ausreicht. Allerdings steigt ungeachtet davon der Zustandswert (nicht proportional) zusammen mit dem Kapital, so dass Produkte bei besser verdienenden Menschen tendenziell eher gekauft werden bei gleichem Verlangen.

[...]


1 Das ist ein Lernprozess, bei dem das gewünschte Optimum bekannt ist, so dass die Bewertung der Lösung auf der Differenz zwischen erreichtem und gewünschten Ergebnis basiert

2 Zustand in einem System, welcher nicht mehr verlassen wird

3 Zustand in einem System, der periodisch wiederkehrt

4 Der Begriff in einem interaktiven Netz, auf den die meisten Botschaften zurückgeführt werden

Details

Seiten
89
Jahr
2008
ISBN (eBook)
9783656162612
ISBN (Buch)
9783656164135
Dateigröße
1.2 MB
Sprache
Deutsch
Katalognummer
v191494
Institution / Hochschule
Universität Duisburg-Essen
Note
1,0
Schlagworte
Marketing neuronale Netze interaktive Netze Donald Hebb

Autor

Zurück

Titel: Simulation der Entstehung von Weltbildern durch neuronale Netze und deren Anwendung auf Marketingprobleme