Lade Inhalt...

Grundlagen und Anwendungsgebiete der Mustererkennung

Diplomarbeit 2014 43 Seiten

Informatik - Software

Leseprobe

Inhaltsverzeichnis

1.Einleitung
1.1 Fragestellung
1.2 Motivation
1.3 Zielsetzung
1.4 Verlauf der Arbeit

2. Hauptteil
2.1 Grundinformationen zur Mustererkennung
2.1.1 Was ist Mustererkennung?
2.1.2 Die drei grundlegenden Ansätze der Mustererkennung
2.1.2.1 Syntaktische Mustererkennung
2.1.2.2 Statistische Mustererkennung
2.1.2.3 Strukturelle Mustererkennung
2.1.3 Die Arbeitsphase
2.1.3.1 Aufnahme
2.1.3.2 Vorverarbeitung
2.1.3.3 Merkmalsextraktion
2.1.3.4 Merkmalsreduktion
2.1.3.5 Klassifikation
2.1.4 Die Lernphase
2.1.4.1 Überwachtes Lernen
2.1.4.2 Unüberwachtes Lernen
2.2 Anwendungsgebiete
2.2.1 Bilderkennung
2.2.2 Schrifterkennung
2.2.3 Spracherkennung

3.Fazit
3.1 Zusammenfassung
3.2 Ausblick

I. Literaturverzeichnis

II. Abbildungsverzeichnis

1.Einleitung

In dieser Diplomarbeit wird das Thema: Grundlagen und Anwendungsgebiete der Mustererkennung behandelt. Die Mustererkennung ist ein weitgefächertes Gebiet, das zum größten Teil in der Informatik vorkommt. Sie findet in vielen Gebieten Anwendung, wie zum Beispiel in der Biometrie, Industrie und Medizin. Man begegnet ihr aber auch im Alltag z. B. beim Lesen oder wenn man eine Person auf der Straße erkennt. Das menschliche Gehirn ist der Grundbaustein zur Mustererkennung. Es ist der ultimative Computer, da es Daten ohne merkbare Fehler verarbeiten kann. Es ist eine einfache Übung für das Gehirn, unvollständige Objekte oder ein Geräusch trotz eines Störsignals zu erkennen, wobei viele Computersysteme Probleme haben und sogar abstürzen. Natürlich gibt es Möglichkeiten, das Gehirn zu täuschen, aber das gehört nicht zu diesem Thema. Die Mustererkennung ist in vielen elektronischen Geräten vorhanden. In Mobiltelefonen oder Smartphones ist die Spracherkennung ein fester Bestandteil. Durch diese ist es möglich, sich mit seinem Handy auf gewisse Art und Weise zu unterhalten. Dabei fragt man das Handy z.B., wie das Wetter wird oder wo die nächste Tankstelle ist, und dieses antwortet dann. In vielen Smartphones ist auch eine Fingerabdruckerkennung, mit der man das Handy entsperren kann. Über die Jahre hinweg hat sich die Mustererkennung auch in der Games-Industrie etabliert. Sie ist zu finden bei Computer- und Konsolenspielen. Es ist nicht übertrieben zu sagen, dass die Mustererkennung den Menschen ein Leben lang und in nahezu allen Bereichen bergleitet.

1.1 Fragestellung

Um die Thematik dieser Diplomarbeit richtig verstehen zu können, werden in ihrem Verlauf folgende Fragen beantwortet:

1. Was ist Mustererkennung, und wo kommt sie her?
2. Wie funktioniert sie, und wofür wird sie eingesetzt?
3. Ist die Mustererkennung aus der heutigen Zeit noch wegzudenken?

1.2 Motivation

Die Motivation zu dieser Arbeit beruht auf dem allgemeinen Interesse an diesem Thema. Dieses bezieht sich sowohl auf den biologischen Teil als auch auf den der Informatik. Es wird in dieser Arbeit erklärt, in welchem Ausmaß der Mensch von der Mustererkennung umgeben wird und wie facettenreich diese ist. Die Wissenschaft hat die Erforschung des Gehirns genutzt und hat nach diesem Abbild eine künstliche Intelligenz erschaffen.

1.3 Zielsetzung

Das Ziel dieser Arbeit ist es, die Grundlagen und drei der Anwendungsgebiete der Mustererkennung so zu erläutern, dass auch jemand, der sich noch nie mit Mustererkennung befasst hat, die Thematik verstehen kann. Dazu werden die Fragestellungen nacheinander abgearbeitet.

1.4 Verlauf der Arbeit

Im ersten Abschnitt des Hauptteils wird der Begriff Mustererkennung definiert. Dabei wird auch geklärt, von wo diese abgeleitet und welches Ziel damit verfolgt wurde. Dazu werden die einzelnen Anwendungsgebiete angeschnitten, von denen später drei anhand von Beispielen näher erklärt werden. Am Ende des ersten Abschnitts wird auf die Funktion des menschlichen Gehirns eingegangen, dabei wird auch geklärt, was künstliche neuronale Netze sind.

Im zweiten Abschnitt werden die drei grundlegenden Ansätze der Mustererkennung im Einzelnen durchgearbeitet. Dabei wird bei jedem mit Hilfe von Abbildungen die Funktionalität erklärt. Es wird auf die einzelnen Schritte oder Phasen der Arbeitsphase eingegangen. Zum Schluss wird geklärt, welche Aufgabe die Lernphase hat und was der Unterschied zwischen überwachtem und nicht überwachtem Lernen ist.

Der dritte und letzte Abschnitt des Hauptteils befasst dich mit drei Anwendungsgebieten der Mustererkennung. Das sind zum einen die Bild-, Schrift- und Spracherkennung. Dabei wird die Funktion der Bilderkennung zum einem anhand des Videospiels Ōkami und zum anderen an einem Beispiel der Gesichtserkennung definiert. Darauf folgt die Schrifterkennung, die mit Hilfe eines Verfahrens zur handschriftlichen Ziffernerkennung im Detail erläutert wird. Zu guter Letzt wird die Spracherkennung mit verschiedenen Beispielen aus dem Alltag erklärt.

Auf den Hauptteil folgt das Fazit des Autors. Dieser wird die Arbeit noch einmal zusammenfassen und dabei auf die Fragenstellungen eingehen. Abschließend wird dieser auf den Ausblick der Mustererkennung eingehen.

2. Hauptteil

2.1 Grundinformationen zur Mustererkennung

2.1.1 Was ist Mustererkennung?

Bevor man in die Thematik der Mustererkennung eintaucht, sollte zunächst geklärt werden, was Mustererkennung genau ist.

Für das Wort Mustererkennung gibt es viele verschiedene Definitionen, die sich in manchen Bereichen gleichen und in manchen weit auseinander gehen. Eine allgemeine Definition lautet: „Pattern recognition is the search for structure in data.” (Pal & Bezdek 1992).

Für das Wort Mustererkennung gibt es viele verschiedene Definitionen, die sich in manchen Bereichen gleichen und in manchen weit auseinander gehen. Eine allgemeine Definition lautet: „Pattern recognition is the search for structure in data.” (Pal & Bezdek 1992).

Eine andere besagt: „Die Mustererkennung beschäftigt sich mit den mathematisch–technischen Aspekten der automatischen Verarbeitung und Auswertung von Mustern“ (Niemann, H. 2003: 13). Zusammenfassend könnte man sagen, dass die Mustererkennung ein Verfahren bezeichnet, in dem gemessene Signale automatisch in Kategorien eingeordnet werden, um sie automatisch zu klassifizieren (vgl. Franz, Prof. Dr. Matthias 2008: 6).

Die Mustererkennung ist ein Teilgebiet der Informatik. Sie wird benutzt, um mit der Umwelt zu interagieren sowie einfache Tätigkeiten auszuführen, und ist ein Bestandteil von Intelligenten Systemen (vgl. Maier, Orlando & Weck, Tobias 2007: 11) Ihre Einsatzgebiete beziehen sich auf die Bild-/Objekterkennung, Biometrie (z.B. Sprech-, Fingerabdruck- oder Iriserkennung), Schrifterkennung und in der Spracherkennung (vgl. Maier, Orlando & Weck, Tobias 2007: 18). So wie die Menschen mittlerweile viele Dinge aus der Natur ableiten, so wird auch die Mustererkennung vom menschlichen Gehirn abgeleitet.

„Da der Mensch über eine begrenzte Informationsverarbeitungskapazität verfügt, liegt die Überlegung nahe, mit elektronischen Datenverarbeitungsanlagen (Computer) Mustererkennung nach menschlichen Vorbild durchzuführen“ (Vockerodt, Vera 2001: 4).

Das Hauptziel dabei ist es, die Wahrnehmungsleistungen des Menschen bestmöglich nachzubilden (vgl. Fink, Gernot A. 2007: 2; vgl. Maier, Orlando & Weck, Tobias 2007: 11; vgl. Niemann, H. 2003: 10). Für das menschliche Gehirn ist es ein Leichtes, Gegenstände oder Geräusche zu erkennen und zuzuordnen. Im Bereich der Informatik ist diese Umsetzung komplizierter.

Beispiel 1: Die Sprachbeherrschung

Die Sprachbeherrschung wird von dem Menschen scheinbar mühelos erbracht, was man an den spontansprachlichen Kommunikationen, die über den Alltag verteilt sind, bemerkt.

Bei den Maschinen hingegen ist dies nicht so einfach. Dort funktioniert es nur durch kontrollierte Aufnahmebedingungen, was bedeute, dass das Mikrofon direkt am Sprecher angebracht werden muss.

(vgl. Fink, Gernot A. 2007: 1)

Beispiel 2 : Die visuelle Wahrnehmung

Mit der visuellen Wahrnehmung verhält es sich bei den Menschen wie mit der Sprachbeherrschung. Ohne jede Anstrengung ist es für ihn selbstverständlich, wenn man auf einer Veranstaltung oder im normalen Alltag eine Person sieht und erkennt. Dabei ist es egal, ob sich die Person in einer Menschenmenge oder alleine auf einer Straße befindet.

Für die Maschinen muss zuerst eine kontrollierte Umgebung geschaffen werden. Dabei spielt die Beleuchtung eine wichtige Rolle, weil das zu erkennende Objekt erkennbar gemacht werden muss. Erschwerend kommt noch dazu, dass die Maschinen nur eine eingeschränkte Dynamik zur Verfügung haben.

(vgl. Fink, Gernot A. 2007: 1)

Der Mensch kann Gegenstände und Geräusche erkennen und zuordnen, ohne sie jemals gehört oder gesehen zu haben. Das funktioniert, weil er diese nach bestimmten Mustern erkennt, die er während seines Heranwachsens gelernt und im Gehirn gespeichert hat.

„Während der Leser diese Zeilen liest, erkennt er in Sekundenbruchteilen die Buchstaben und Wörter, auch wenn diese in verschiedenen (unbekannten) Schriftarten oder ‑größen dargestellt sind. Das menschliche Gehirn ist zur Mustererkennung fähig“ (Vockerodt, Vera 2001: 4).

Durch eine Reihe von Sinnesorganen, die der Mensch besitzt, werden Außenwelt sowie innerliche Vorgänge wahrgenommen. Diese Vorgänge können bewusst geschehen, sind aber meistens unbewusst. Das Gehirn bekommt ununterbrochen die Informationen der Sinneswahrnehmung geliefert. Diese müssen zeitnah analysiert werden, weil dem Gehirn mit ungefilterten Informationen keine sinnvolle Verarbeitung möglich ist. Ein sehr gutes Beispiel liefert das Zusammenspiel zwischen Auge und Gehirn. Sobald Lichtsignale auf die Netzhaut einfallen, werden diese in bioelektrische Impulse umgewandelt. Im Sehnerv werden diese dann vorverarbeitet und im Gehirn an das Sehzentrum weitergeleitet. Die bioelektrischen Impulse werden dort mit Informationen, die im Gedächtnis verfügbar sind, verknüpft und abgeglichen. Diese erhält nun eine Bedeutung.

Wenn ein Mensch also ein Foto von einer Person betrachtet, dann geht das Gehirn davon aus, dass es sich dabei nicht um eine wirkliche Person handelt. Es handelt sich offensichtlich um das gleiche Muster, das auf der Netzhaut erzeugt wird, es wird aber anders interpretiert. Neuronale Netze erkennen das Muster eines Fotos, weil diese oftmals einen eckigen Rahmen haben oder die abgebildete Person verhältnismäßig viel kleiner ist als das Original. Dadurch kann die kognitive[1] Verarbeitung auf das Foto gerichtet werden und nicht auf die dargestellte Person. Wenn es diese Klassifikation[2] nicht gäbe, dann müssten von allen Sensorzellen der Netzhaut die Eingaben in die Verarbeitung mit einbezogen werden. Das Gehirn würde diese Situation vollständig überlasten und für mehrere Stunden handlungsunfähig machen (vgl. Schäfer, Johann 2012: 43).

„Die Bedeutung der Mustererkennung wird aus evolutionärer Sicht durch ein einfaches Beispiel deutlich. Ein auf dem Waldboden liegender Ast und eine giftige Schlange hinterlassen auf der Netzhaut ein sehr ähnliches Muster, dennoch sind die Folgen für einen den Ast oder die Schlange berührenden Menschen deutlich unterschiedlich. Es verwundert also nicht, dass heutige technische Systeme bei Weitem nicht an das herankommen, was die Natur in Millionen von Jahren der Auslese hervorbringen konnte“ (Schäfer, Johann 2012: 43).

Wie oben bereits erwähnt wurde, sorgen neuronale Netze dafür, dass das Gehirn nicht überlastet wird. Neuronale Netze bestehen aus einzelnen Nervenzellen, die auch Neuronen genannt werden. „Das menschliche Gehirn besteht aus ca. 1011 Nervenzellen, von denen jede mit etwa hundert bis zehntausend anderen verbunden ist“ (Vockerodt, Vera 2001: 5). In Abbildung 1 ist eine Nervenzelle mit ihren einzelnen Bestandteilen abgebildet.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Nervenzelle (Neuron)

(Quelle: Zielke, Prof. Dr. -Ing. Thomas o. J: 4)

Eine Nervenzelle setzt sich aus einem Zellkörper, Zellkern, Axon, den Dendriten und den Synapsen zusammen.

Der Zellkörper umfasst den Bereich um den Zellkern. Zellfortsätze wie den Dendriten und dem Axon werden dabei nicht umfasst.

Der Zellkern (Nucleus) verarbeitet die Eingangssignale und stößt diese unter gewissen Randbedingungen zur Weiterleitung der Ausgangssignale an.

Die Dendriten sind dünne, röhrenförmige Fortsätze der Zelle. Diese sind meistens stark verästelt, wie es auf Abbildung 1 im oberen und unteren Bereich zu sehen ist. Durch diese Verästelungen nehmen die Dendriten Eingangssignale auf und leiten sie zum Zellkern weiter.

Das Axon (Nervenfaser) leitet die Ausgangssignale der Nervenzelle weiter. An den Enden verdichtet sich das Axon und bildet die Synapsen. In Abbildung 1 sieht man im unteren Bereich, in welche Richtung sich die Ausgangssignale bewegen und wie sie sich zu den Synapsen verdichten.

Die Synapsen verbinden das Ende des Axons einer Nervenzelle mit dem Dendriten einer anderen Nervenzelle. Deswegen könnte man sie als eine Art Kontaktstelle zweier Nervenzellen beschreiben.

(vgl. Zielke, Prof. Dr. -Ing. Thomas o. J.: 4)

Die Synapsen haben dabei noch eine weitere Aufgabe: Sie summieren die elektrischen Eingangsimpulse der Neuronen und leiten diese Impulse entweder gehemmt oder verstärkt weiter. Beim Weiterleiten können die Synapsen die Wirkung ihrer hemmenden oder verstärkten Impulse ändern, wodurch ihnen beim Lernvorgang eine entscheidende Rolle zugewiesen wird. Sobald ein gewisser Schwellenwert von den summierten Eingangssignalen überschritten wird, sendet die Nervenzelle einen elektrischen Impuls durch das Axon an die nachfolgenden Nervenzellen, weil sie aktiviert wurde (vgl. Vockerodt, Vera 2001: 5).

Eine leistungsfähige Informationsverarbeitung kann erst dann erfolgen, wenn viele Nervenzellen in einem Nervensystem zusammenwirken. Wenn das der Fall ist, finden im Gehirn ca. 1012 Schaltvorgänge in der Sekunde statt. Eine Nervenzelle allein hat dabei eine Schaltzeit von ca. 10-3 pro Sekunde. Dabei kann eine Nervenzelle bis zu 1 m lang sein (vgl. Zielke, Prof. Dr. -Ing. Thomas o. J.: 5).

So viel zu dem menschlichen Gehirn, aber was hat das neuronale Netz eigentlich mit der Mustererkennung zu tun? Das menschliche Gehirn kann unvollständige Bilder vervollständigen oder ein Rauschen von dem eigentlichen Signal trennen. Bei einem Computer aber steigen in diesen Fällen die Fehlerraten in die Höhe. Um diesen Fehlern entgegenzuwirken, hat man das künstliche neuronale Netz (KNN) von seinem biologischen Vorbild, dem neuronalen Netz, abgeleitet (vgl. Vockerodt, Vera 2001: 4).

„KNN sind Netzsysteme für Computer, die Daten massiv parallel verarbeiten und zudem lernfähig sind. Das bedeutet, dass sie mit jeder Mustererkennung ihr Wissen erweitern und für zukünftige Einsätze verwenden. Die Fehlerraten bei der Mustererkennung unter Einsatz künstlicher neuronaler Netze sinken erheblich“ (Vockerodt, Vera 2001: 4).

Ein künstliches neuronales Netzwerk besteht aus stark idealisierten Neuronen. Dadurch, dass das KNN in Anlehnung an dem neuronalen Netz entstanden ist, gleichen sich ein paar der Komponenten.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: künstliche neuronale Netz

(Quelle: Zielke, Prof. Dr. -Ing. Thomas o. J: 6)

Auf Abbildung 2 sind die sich teilweise wiederholenden Komponenten abgebildet. Hier gibt es zwei Zellkörper, dabei handelt es sich um die abstrakten Rechenelemente ai und aj. In Abbildung 2 sind die Dendriten einmal als neti und netj gekennzeichnet. Ihre Aufgabe ist es, aus einem empfangenen Signal einen effektiven Eingangswert zu berechnen.

Das Axon transportiert in diesem Beispiel den Ausgabewert oi den es von ai erhält. Die Synapsen sind auch hier die Kontaktstellen zweier Neuronen, denn sie treten auch hier wieder mit den Dendriten anderer Neurone in Kontakt. Auch hier bilden sie Gewichtungen, über die sie ihre gehemmten oder verstärkten Signale an andere Neurone weitergeben. Die Synapsen werden hier durch numerische Werte (Verbindungsgewichte) wij dargestellt.

[...]


[1] Das Wahrnehmen, Denken, Erkennen betreffend

[2] Klassifikation nennt man das Zusammenfügen von Objekten zu Klassen

Details

Seiten
43
Jahr
2014
ISBN (eBook)
9783668015043
ISBN (Buch)
9783668015050
Dateigröße
1.1 MB
Sprache
Deutsch
Katalognummer
v303118
Institution / Hochschule
SAE Berlin
Note
1,2
Schlagworte
grundlagen anwendungsgebiete mustererkennung

Autor

Teilen

Zurück

Titel: Grundlagen und Anwendungsgebiete der Mustererkennung