Das „Denken“ von kognitiven Systemen

Die Beantwortung von Fragen mittels Deep Learning Algorithmen und neuronalen Netzwerken am Beispiel von IBM Watson


Ausarbeitung, 2016

21 Seiten, Note: 1,0


Leseprobe


Inhaltsverzeichnis

Abkürzungsverzeichnis

Abbildungsverzeichnis

1 Einleitung ¡ท die Thematik

2 Begriffserläuterung Cognitive Computing
2.1 Definition Cognitive Computing
2.2 Die Entwicklung von kognitiven Systemen

3 Das Verstehen von Fragen durch kognitive Systeme
3.1 Die Beantwortung von Fragestellungen durch IT-Systeme
3.2 Herausforderung bei dem Verständnis von Fragen
3.3 Die Methodik des kognitiven Systems Watson

4 Anwendungsbereiche kognitiver Systeme

5 Schlussbetrachtung

Literaturverzeichnis

Anhang

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Abbildungsverzeichnis

Abb. 1: Unterschied zwischen Watson und Web-Suchmaschinen

Abb. 2: Beweisbasierte Architektur nach Watson DeepQA

Abb. 3: Beziehungsermittlung zwischen Wörtern

Abb. 4: Beweis durch Keywords (links) und tiefes Beweisen (rechts)

Abb. 5: Evidenzbestimmung der Hypothesen

Abb. 6: Screenshot der beantworteten Frage von Wolfram|alpha am 29.05.2016

Abb. 7: Screenshot der beantworteten Frage (A) von Wolfram|alpha am 29.05.2016

Abb. 8: Stichwortsuche über unstrukturierte Datenbestände (exemplarisch: Wikipedia)

1 Einleitung เท die Thematik

Bereits ¡ทา März 1960 schrieb der Informatiker J. c. R. Licklider ¡ท einer seiner Abhandlung: „Man-computer symbiosis ¡ร an expected development ¡ท cooperative interaction between men and electronic computers“ (Licklider 1960: 4). Rund 56 Jahre später und konfrontiert mit einem 800 prozentigen Anstieg der Datenmenge bis 2017, wovon 80 Prozent unstrukturierte Daten sind (Gartner Inc. 2012), ist die Unterstützung des Menschen durch Maschinen mit künstlicher Intelligenz (Kl) eine ubiquitäre Thematik. So überführt Apples Siri automatisch Termine aus Emails ¡ท den Kalender und zeigt ortspezifisch Kontakte an, die zuvor häufiger an diesem Ort angerufen wurden (vgl. Volker 2015: 130 f.). Das Assistenz-Tool Cortaría der Microsoft Cor- peration lernt Präferenzen und schlägt u.a. ortabhängige, auf den Nutzer passende Veranstal­tungen vor (vgl. Microsoft Corporation 2016). Auch Google präsentiert kognitive Ansätze ¡ท Google Now, bei dem durch die Kombination von Google-Diensten dem Nutzer bestimmte Informationen wie der Status der Paketsendung, die Fahrzeit zur Arbeit mit aktueller Verkehrs­lage oder die Boardkarte zur Eincheckzeit angezeigt werden (vgl. Volker 2015: 128 f.). Ende 2015 kündigte das Marktforschungsunternehmen Gartner Inc. (2015: 6 f.) die intelligenten Ma­schinen als strategischen Technologie-Trend für 2016 an. Als zentrale Voraussetzung wurde dabei die Interaktion von Mensch und Maschine und das damit verbundene Verstehen natür­licher Sprache dargestellt. Ein bedeutender Meilenstein ¡ท dem Zusammenhang war der Sieg von IBM’s Watson ¡ท Jeopardy! und dessen eingesetzte Technologie zum Verstehen natürli­cher Sprache (vgl. New York Times 2016; May 2013). In Assoziation mit der technologischen Nachahmung kognitiver Fähigkeiten des Menschen resultiert die folgende Forschungsfrage: Inwiefern kann ein IT-System eine Fragestellung verstehen und beantworten?

Grundlage der vorliegenden Arbeit ist die Auseinandersetzung von Walter Hehl mit der The­matik ¡ท seinem Buchkapitel „Wissen, Verstehen und Intelligenz mit Software“, ¡ท dem er auf die verschiedenen Fähigkeiten zur Beantwortung von Fragen durch IT-Systeme eingeht und vor allem die Methodik von Watson anhand der Quizshow Jeopardy! genauer erläutert.

Um einen geeigneten Rahmen dafür zu bilden, wird zunächst erläutert, wie kognitive Systeme definiert werden können und prägnant deren historische Entwicklung betrachtet. Im Hauptteil wird auf die Beantwortung von Fragestellungen durch IT-Systeme und dabei aufkommende Problemstellungen sowie im Speziellen auf die Methoden des Watson-Systems am Jeopardy!- Beispiel eingegangen und mögliche Anwendungsbereiche von kognitiven Systemen aufge­zeigt. Abschließend werden die wichtigsten Ergebnisse der Arbeit zusammengefasst, die Ar­beit und Vorgehensweise kritisch reflektiert und ein Ausblick ¡ท die Zukunft gegeben.

Aufgrund des Rahmens der vorliegenden Arbeit und der Thematisierung von IBM Watson ¡ท dem zugrundeliegenden Artikel bezieht sich der Oberbegriff von kognitiven Systemen bzw. Cognitive Computing insbesondere auf die Watson-Technologie des Unternehmens IBM.

2 Begriffserläuterung Cognitive Computing

2.1 Definition Cognitive Computing

„เทา Allgemeinen soll unter [Cognitive Computing] die Orchestrierung von Erkenntnissen aus den unterschiedlichen Disziplinen, wie beispielsweise Philosophie, Psychologie, Infor­matik, Linguistik, Mathematik und Kognitionswissenschaften verstanden werden. Im Be­sonderen umfasst Cognitive Computing die Kombination unterschiedlicher wissenschaftli­cher Modelle aus den Kognitionswissenschaften und Technologien aus dem Bereich der Künstlichen Intelligenz (Artificial Intelligence) und des Künstlichen Lebens (Artificial Life).“ (Haun 2014: 122)

Diese Definition beschreibt ¡ท umfassender Form, was unter dem Begriff Cognitive Computing (CC) zu verstehen ist und ordnet diesen als ein Teilgebiet von Artificial Intelligence (AI) ein, wie auch Seth Earley (2015: 1). Mit einem derartigen kognitiven System soll die Funktions­weise des menschlichen Gehirns simuliert oder gar nachstellt werden mit dem Ziel, ein univer­selles, kohärentes und einheitliches System zu entwickeln (vgl. Modha et al. 2011: 62; IBM Corporation 0. J. (a)). Dies wird mit Hilfe selbstlernender Algorithmen realisiert, welche Tech­niken wie data mining, pattern recognition und natural language processing anwenden. Wäh­rend Computer seit Jahren schneller kalkulieren und strukturierte Daten verarbeiten, soll CC eine Möglichkeit bieten, Aufgaben zu übernehmen, was mit den Systemen zuvor unmöglich war wie bspw. das Erkennen von Objekten ¡ท einem Bild oder das Verstehen natürlicher Spra­che. Die Ausgaben sind dabei nicht nur Antworten auf numerische Probleme, sondern Hypo­thesen, begründete Argumente und Empfehlungen (vgl. Kelly 2015: 2). Kognitive Systeme, wie Watson von der International Business Machines Corperation (IBM), nutzen dabei soge­nannte Deep Learning Algorithmen[1] und neuronale Netzwerke[2], um die zu verarbeitenden In­formationen mit bereits erlernten Daten-Sets zu vergleichen. Daraus lässt sich schlussfolgern, dass mit zunehmender Größe der Daten-Sets des kognitiven Systems der Lernprozess besser wird und Daten akkurater verarbeitet werden können (vgl. Marr 2016).

Neben dem Lernen mit vergrößernden Daten-Sets und über die Interaktion mit Mensch und Umfeld zeichnen sich kognitive Systeme dadurch aus, dass sie begründete Entscheidungen anhand der „gelernten“ Daten treffen, also kein menschliches, emotional geleitetes „Bauchge­fühl“ besitzen (vgl. Kelly 2015: 2). über die Zielsetzung von kognitiven System besteht derzeit kein Konsens. Einerseits wird postuliert, dass kognitive Systeme Probleme ohne jegliche menschliche Hilfe lösen sollen, andererseits wird die Ansicht vertreten, der Mensch soll mit seiner Intelligenz nicht ersetzt, sondern unterstützt werden (vgl. Rouse 2016; IBM Corporation 0. J. (a)). Von führenden IT-Unternehmen, so Weber (vgl. 2015: 14 f.), wurden vier definie­rende Kriterien von kognitiven Systemen festgelegt: Adaptivität als Anpassung an die Umwelt, Interaktivität als Einbezug von Nutzerfeedback, Iterativität als Präzisierung eines Problems über Interaktionsstufen und Kontextualität als inhaltliche Einordnung ¡ท Syntax- und Semantik.

2.2 Die Entwicklung von kognitiven Systemen

Zur genauen Betrachtung der Historie von kognitiven Systemen eignet sich deren historische Einordnung ¡ท die drei möglichen Ären der Rechensysteme. เท der ersten, tabellarisierenden Ära von ca. 1900 bis 1940 wurden mit mechanischen Maschinen die funktionalen Grundzüge von Computern ergründet. Lochkarten dienten u.a. der ersten Umsetzung des EDV-Prinzips. Die folgende programmierende Ära, welche von 1950 bis heute anhält, beschreibt den Wandel von den mechanischen zu den elektronischen Systemen und umfasst somit alle programmier­baren Systeme, welche noch heutzutage unseren Alltag bestimmen wie Laptops, Tablets und Smartphones. Die letzte Ära, welche 2011 begann, ist die kognitive Ära und beschreibt den Entwicklungsverlauf von programmierbaren Systemen mit Funktionen, die sich an menschli­che Fähigkeiten anlehnen wie die Erkenntnisgewinnung durch „Lernen“ und welche den Men­schen damit ¡ท komplexen Situationen unterstützen können (vgl. Kelly 2015: 3 f.; Cognitive Computing Consortium 2014). Die erste Begriffsformulierung zu AI wurde bereits im Jahr 1955 durch John McCarthy angestellt als „the science and engineering of making intelligent machi­nes“ (McCarthy 2007: 2, Erstauflage 1955). Urn 1980 stieg die Forschung um die künstliche Intelligenz erheblich an, bis diese im Kl-Wmter wieder zurückging (vgl. Weber 2015: 14).

Um die Jahrtausendwende waren erste Erfolge ¡ท diesem Bereich zu verzeichnen, als IBM‘s Computer Deep Blue den amtierenden Schachweltmeister Garrí Kasparow schlug (vgl. Hehl 2016: 164 f.). 2005 gewann nach gescheiterten Versuchen im Jahr zuvor das autonome Ro­boterauto Stanley die 142 Milen lange DARPRA Grand Challenge (vgl. Buehler et al. 2007: 2 f.). Ein einschneidender Meilenstein zur Einläutung der derzeitigen Computing-Ära war jedoch der Sieg des kognitiven Systems Watson der IBM über die amtierenden Weltmeister (Ken Jennings und Brad Rutter) bei der amerikanischen Quizshow Jeopardy! im Februar 2011. เท Jeopardy! geht es um das Finden einer exakten Fragestellung zu einer vorgegebenen Antwort aus dem erweiterten Allgemeinwissen, was nicht nur Wissen, sondern auch die Fähigkeit zur logischen Kombination erfordert (vgl. Hehl 2016: 165). Neben der IBM zeichnen auch andere große Technologie-Unternehmen Erfolge ab. So schlug kürzlich Googles Deepmind mit der Software AlphaGo den bisherigen Weltmeister Lee Sedol im Spiel Go, welches ein komplexes chinesisches Brettspiel mit mehr als 10 hoch 170 möglichen Spielpositionen darstellt (vgl. Has- sabis 2016).

3 Das Verstehen von Fragen durch kognitive Systeme

3.1 Die Beantwortung von Fragestellungen durch IT-Systeme

„Ein gebildeter Mensch kennt wohl einige Zehntausend Wörter [...], aber dazu kommen Milli­onen von intellektuellen Konstrukten wie ,der Rubikon ist überschritten1 [...] die ein Gebildeter verstehen und verwenden kann und ihren Ursprung kennt“. (Hehl 2016: 162) Demnach legt Hehl (2016: 162 f.) als beispielhaften Wissenstest von Mensch und Computersystem Frage­stellungen zugrunde und zeigt so den Unterschied zu kognitiven Systemen.

Tab. 1: เท Anlehnung an die Fragestellungen nach Hehl (2016: 163).

Abbildung in dieser Leseprobe nicht enthalten

Die Fragestellung Typ в ist eine Abfrage anhand von Pattern, die vom Nutzer selbst gegeben werden und von Web-Suchmaschinen wie Google oder Bing ausgeführt werden können. Die Abfrage erfolgt dabei über Assoziationen des Suchbegriffs ¡ท der jeweiligen Datenbank der Suchmaschine; so gesehen stellt die Abfrage schon ein Teil der Antwort dar. Sogenannte „Crawler“ sammeln Informationen zu dem Text inklusive Links und Text-Speicherort der Web­seiten und fügen diese der Suchmaschinen-Datenbank hinzu, wo eine Indizierung der Daten erfolgt (vgl. Microsoft Corporation 0. J.). Einzig die Scaling-Problematik[3] [4] der Information stellt bei deren Ranking eine Herausforderung dar, welche jedoch mit einem guten Mechanismus gelöst werden kann, was am Beispiel von Google zu sehen ist (vgl. Hehl 2016: 164).

Die Websoftware Wolfram|alpha stellt eine Weiterentwicklung ¡ท die kognitive Richtung dar. Die Software findet nicht nur Dokumente auf, sondern beantwortet konkret Fragen. Zum Beispiel beantwortet Wolfram|alpha What was the distance between Pluto and Saturn on 07/16/1992? (Typ C) mit 4.521x109 km, weiteren Entfernungseinheiten und Details zu Plane­ten und dem abgefragten Datum (Abb. 6, siehe Anhang). Die „Suchmaschine“ erkennt dem­nach Semantik, bspw., dass es sich nicht um Götter handelt, da diese nicht über Distanz ¡ท Beziehung stehen können (Ontologie). Hinzu kommt die Erkenntnis zur Planetenposition und der Distanzberechnung an dem bestimmten Datum. Das Wissen von Wolfram|alpha stammt von Mitarbeitern und sogenannten Kuratoren (vgl. Tacke 2007: 21 f.; Hehl 2016: 169 f.).

Bei einer Kenntnisfrage wie nach der Hauptstadt der Schweiz (Typ A) handelt es sich um keine reine Suchabfrage, daher wird es bei einigen Suchmaschinen-Ergebnissen schwierig, die rich­tige Antwort im Kontext der Frage zu finden. Teilweise resultiert, wie bei Wolfram|alpha, das inkorrekte Ergebnis Bern (Abb. 7, ร. Anhang). Daraus schlussfolgert Hehl, dass „der intelli­gente Umgang mit unsicherer Information [...] zu einer zentralen Aufgabe“ (Hehl 2016: 164) wird. Im Gegenteil dazu analysiert das kognitive System Watson die Frage, sucht mögliche Antworten ¡ท strukturierten und unstrukturierten Daten und erzeugt Evidenzen zu den Antwor­ten, um dem Nutzer die treffendste Antwort zu präsentieren, wie ¡ท der Abbildung 1 verdeutlicht wird (vgl. IBM Research 2012: 2).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1 : Unterschied zwischen Watson und Web-Suchmaschinen (i. A. a. IBM Research 2012: 2).

3.2 Herausforderung bei dem Verständnis von Fragen

เท Bezug auf die Beantwortung von Fragestellungen am Beispiel von Watson erläutert Hehl (2016: 164-169) einige Herausforderungen. Zum einen stellt das Scaling ein Problem dar, da mit der heutigen Zeit von Big Data[5] eine enorm hohe Datenmenge und -Vielfalt und teilweise auch widersprüchliche Daten vorzufinden sind, was das Finden der Lösungsdaten innerhalb des vorhandenen Datenpools erschwert. Somit wird die Einschätzung der Verazität[6] einer In­formation für Mensch sowie Maschine stets schwieriger.

Zum anderen ist die natürliche Sprache, welche voller Zweideutigkeiten, Anspielungen, Idio­synkrasien und idiomatischen Ausdrücke ist, eine Herausforderung. Das Verständnis von Aus­drücken im Kontext stellt vor allem für eine Software eine Schwierigkeit aufgrund des Umfangs und der Vielfältigkeit von Wissensobjekten und deren Beziehungen untereinander dar. Selbst der Mensch weißt nur ein assoziatives Netzwerk von Wissen mit Lücken auf, jedoch reicht dies, um für das Gefühl zu sorgen, dass „wir verstehen“ (vgl. Anderson 2012: 223 f.).

Eine weitere Herausforderung sieht Hehl (2016: 167 f.) ¡ท dem Symbol Grounding Problem, also der Problematik, wie die Maschine die Bedeutung eines bestimmten Objektes und dessen Zusammenhang mit anderen Objekten verstehen kann. Letztlich bezieht sich dies auf die grundlegenden Fragen von stevan Harnad, wie einem Objekt eine Bedeutung zugeschrieben wird und wie die Bedeutung selbst deklariert ist (vgl. Lercher 2009: 11 f.).

Schlussendlich nennt Hehl (2016: 168 f.) logische Herausforderungen ¡ท Verbindung mit der indexikalischen Semantik, also dem Verständnis deiktischer Ausdrücke als Bezugnahme. Dies betrifft Fälle, bei denen die Aussage Z.B. einer Textpassage ¡ท Raum, Zeit oder im Zusam­menhang mit dem jeweiligen Umfeld bestimmt werden muss, um diese sinnvoll interpretieren zu können, wie beispielweise die Ausdrücke „¡ท unserer Zeit“ oder „dort“.

3.3 Die Methodik des kognitiven Systems Watson

Die Funktionsweise zum Verstehen und anschließendem Beantworten einer Frage durch das kognitive System IBM Watson ist wesentlich komplexer, als ¡ท der Abbildung 1 dargestellt und wird folgend an dem gewählten Beispiel von Hehl, Jeopardy!, erläutert. Watson arbeitete bei der Show Jeopardy! mit 15 Terabyte RAM, 2880 Prozessorkernen und einer Größe mehrerer Kühlschränke. Heute hat das System circa eine Größe von drei Pizzaschachteln, ist 2.400% leistungsstärker und ist 24 Mal so schnell (vgl. Deedrick 2011 ; IBM Corporation 2014).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: Beweisbasierte Architektur nach Watson DeepQA (i. A. an IBM Corporation 2011a).

Der mit der Abbildung 2 beschriebene Algorithmus wurde über einhundertmal ¡ท Watson inte­griert, sodass jede Komponente des Systems eine Bedeutung zu der Frage und eine hypothe­tische Antwort hinzufügen kann. Die im Folgenden zur Erklärung verwendete Jeopardy! - Frage lautet: Im Jahre 1897 hat der schweizer Kletterer Matthias Zurbriggen als erster diesen argentinischen Gipfel bestiegen.

Der sogenannte Clue wird ¡ทา ersten Schritt durch Watson ¡ท Teilstücke (Tokens) zerlegt, um die Bedeutung der Frage zu identifizieren. Bei der Zerlegung werden gleichzeitig Beziehungen zwischen Wörtern ermittelt, um den Fokus des Clues zu bestimmen wie beispielsweise „diesen argentinischen Gipfel“ (vgl. Nimführ2011: 15). เท Bezug auf das Symbol Grounding Problem hat Watson mit Hilfe des Menschenfeedbacks grundsätzlich die Bedeutung einiger Worte der natürlichen Sprache mit der von dem Menschen verwendeten Bedeutungszuschreibung „ver­standen“ und kann dies ทนท auf weitere Fälle anwenden. Watson imitiert so gesehen das as­soziative Netzwerk des Menschen, indem Watson „ausgehend von einem Wissensknoten die Umgebung ausbau[t] mit Fakten, Fähigkeiten und Verbindungen zu anderen Knoten“ (Hehl 2016: 167). Die Abbildung 3 zeigt hierzu die kontextbezogene Zerlegung der Frage durch das Watson-System.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 3: Beziehungsermittlung zwischen Wörtern (i. A. a. Nimführ 2011: 15).

Im zweiten Schritt durchsucht das System seine Datenbanken, den sogenannten Korpus, mit hunderten Quellen nach den signifikanten Tokens bzw. Token-Kombinationen, um relevante Passagen zum Clue zu finden. Die mehrere Millionen Dokumente umfassende Suche der Passagen beinhaltet dabei sowohl strukturierte als auch unstrukturierte Daten (Abb. 8, siehe Anhang). Neben der Datenbank von Watson kann dessen Suche auch das World Wide Web mit aktuellen Nachrichten, Social Media Posts sowie Sensor- und Unternehmensdaten inklu­dieren. Bei Jeopardy! wurden jedoch nur zuvor integrierte Daten ohne WWW-Anschluss ver­wendet (vgl. IBM Corporation 0. J. (b); Hehl 2016: 166).

Durch Analyse der gefundenen Dokumente, Daten bzw. Textpassagen werden mögliche En­titäten (Hypothesen) im dritten Schritt generiert und vorstellbar ¡ท einer Liste extrahiert. Dabei gilt es, eine größtmögliche Abdeckung zur erhalten, d.h. alle möglichen Hypothesen aufzuneh­men. เท dem Kontext wären das u.a. Berge, Personen und Orte (vgl. Nimführ2011; 17).

เท hochparallelisierter Arbeitsweise wendet Watson im vierten Schritt über 100 Deep Evidence Scoring Algorithmen an, um diese Hypothesen hinsichtlich ihrer Wahrscheinlichkeit als pas­sende Antwort zu identifizieren. Diese Algorithmen gehören zu der eingesetzten Watson-Tech- nologie DeepQA, die entwickelt wurde, um Fragen ¡ท entsprechender Qualität und Zeit liefern zu können und die nach dem probabilistischen Nachweisprinzip arbeitet (vgl. IBM Corporation 2011b: 3 f.). Der Hauptansatz von DeepQA ist die Ansicht und Nachverfolgung mehrerer In­terpretationsmöglichkeiten einer Frage und somit verschiedenen zutreffenden Antworten, was das Problem der Mehrdeutigkeit und kontextsensitiven Bedeutung natürlicher Sprache adres­siert. Bei einem einfachen Ansatz zum Hypothesenbeweis besteht die Gefahr, dass Eigen­schaften nicht berücksichtigt werden und die Interpretation zum falschen Ergebnis gelangt.

Exemplarisch wird ¡ท der Abbildung 4 der Unterschied eines einfachen Schlüsselwortver­gleichs und eines beispielhaften Vergleichs durch die Methode von DeepQA präsentiert. เท beiden Varianten ist die Frage ¡ท blauer und die mögliche Information aus Watsons Datenbasis ¡ท grüner Farbe dargestellt (vgl. Nimführ2011: 12).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 4: Beweis durch Keywords (links) und tiefes Beweisen (rechts) (i. A. a. Nimführ 2011: 12 f.).

Gesuchte Schlüsselwörter werden folglich nicht direkt verglichen, sondern zumeist ¡ท einer zusätzlich (tieferen) Schicht betrachtet mit beispielsweise dem Einbezug von Synonymen oder der Betrachtung der indexikalischen Semantik von Ort und Zeit (vgl. Nimführ 2011: 13). Nur so kann Watson ein tiefergehendes „Verständnis“ für Fragen wie „Auch solch ein kaputtes Ding an der Wand hat zweimal am Tag recht“ entwickeln (vgl. Hehl 2016: 169 f.). เท Bezug auf die Evidence Scoring Algorithmen von DeepQA nennt Nimführ (2011: 18) drei als besonders entscheidende Methoden.

- Type coercion: Es erfolgt eine Prüfung, mit welcher Wahrscheinlichkeit die Hypothese vom richtigen Typ ist. Demnach ist die Wahrscheinlichkeit, dass es sich bei dem Aus­druck Everest um den gesuchten Typ „Gipfel“ handelt höher als bei Stuart Vines.

- Temporal match: Diese Evidenz-Prüfung ist eine der wichtigsten Faktoren und stellt die Prüfung dar, ob die Frage eine zeitliche oder datierte Referenz besitzt. Dabei wer­den Ausdrücke wie „Im Jahr 1897“ oder „der 400. Jahrestag“ ¡ท konkrete, vom System verarbeitbare Größen umgewandelt, um einen zeitliches „Denken“ zu ermöglichen.

- Passage Scorer: Die Abschnittsbewertungsmethode ist eine der wichtigsten und vali­diert mit komplexen Bewertungsalgorithmen die Evidenz einer Passage.

Im letzten Schritt werden die Ergebnisse ¡ท bedeutungsgleichen Gruppen (evidence dimensi­ons) zusammengefasst und es entsteht ein Evidenz-Profil. Dies wird letztlich durch Watson statistisch konsolidiert, um eine Konfidenz der Antworten zu erhalten. เท Jeopardy! hat Watson die Konfidenz zusätzlich u.a. mit der Wahrscheinlichkeit abgeglichen, dass dessen Konkurren­ten das Spiel gewinnen mit den Punkten, die diese bekommen würden, wenn Watson nicht antwortet (vgl. Hehl 2016: 169; Nimführ 2011: 19).

Abbildung in dieser Leseprobe nicht enthalten

Abb. 5: Evidenzbestimmung der Hypothesen (i. A. a. Nimführ 2011: 19).

4 Anwendungsbereiche kognitiver Systeme

Das „tiefe Verständnis“, das beispielhaft Watson น. a. mit der vorgestellten DeepQA-Techno- logie erreichen kann, sieht Hehl (2016: 170) als eine „Weiterentwicklung des Verstehens na­türlicher Sprache hin zur Interaktion und schliesslich zur Problemlösung und zum Handeln“. IBM’s Senior Vice President des Cognitive Solutions Teams John Kelly (2015: 7 f.) beschreibt dahingehend die Anwendungsvielfalt kognitiver Systemen ¡ท folgenden Kernkompetenzen:

1.) Erhöhung der Personalisierung: Durch die Auswertung von bspw. Webinteraktionen,

Kaufhistorien und Wearable-Daten und die Kombination mit den Stimmungen/Bezie­hungen einer Person kann ein personalisiertes Profil einer Person erstellt und eine bessere Kommunikation zu dem Kunden geschaffen werden, z. B. im Einzelhandel.

2.) Skalieren und Erhöhung von Expertise: Mittels Bündelung und Analyse wichtiger

Informationen kann Fachkräften Expertenwissen zur Verfügung gestellt werden, was sonst aufgrund von Umfang/Komplexität unmöglich wäre Z.B. im Gesundheitsbereich.

3.) Erweiterung um kognitive Komponenten: Durch die Erweiterung um kognitive Kom­

ponenten kann mit Dienstleistungen/Produkten auf Nutzerverhalten und -feedback ¡ท Echtzeit reagiert und Verbesserungsprozesse verwirklicht werden Z.B. Auto-Industrie.

4.) Verbesserung von Betriebsprozessen: Durch präzise Analysen interner und exter­ ner Betriebsprozesse und weiterer Daten wie des Wetters können Z.B. Personenstun­den zur Fehlersuche eingespart oder Entscheidungsempfehlungen gegeben werden.

5.) Erhöhung des Explorationspotenzials: Das Erkennen von Verhaltensmustern und Trends verhilft zu absehbaren Zukunftserkenntnissen, wodurch bspw. Unternehmen Entscheidungshilfen bei Investitionen oder Neuausrichtung erlangen können durch re­gelbasierte und Datenquellen und abteilungsübergreifende kognitive Fähigkeiten.

Mit der ersichtlich großen Anwendungsvielfalt lassen sich auch die vielseitigen Anwendungs­bereiche erklären mit möglichen Einsätzen ¡ท: Rat- und Auskunftgebern, autonomen Fahr- und Flugzeugen, Produktions- und Dienstrobotern, Diagnostik, Senioren- und Krankenpflege und Sicherheits- und Finanzwesen (vgl. Weber: 9). Das Potenzial von Watson als medizinischer kognitiver Assistent, das Hehl (2016:170 f.) sah, u.a. durch Kausalkettenbildung mit Hilfe eines enormen Expertenwissens und darauf basierende Diagnose, ist bereits umgesetzt (vgl. Mo- negain 2016). Der kognitive Assistent Amelia von IPsoft versteht mehrere Sprachen und Emo­tionen und antwortet bezugnehmend. Im Mai 2015 gab es ¡ท diversen Unternehmen Pilotpro­jekte wie bei Accenture zur Unterstützung von Remote-Arbeitern (vgl. Ankeny 2015). Ein Jahr später führten Accenture und IPsoft einen Accelerator ein, um Kunden ins Al-Business zu be­gleiten (vgl. Accenture Plc 2016).

5 Schlussbetrachtung

Angesichts des durch Gartner Inc. 2015 prognostizierten Anstiegs von v.a. unstrukturierten Daten, welche mit den vorhandenen analytischen Techniken nicht zu bewältigen sind und des Fortschrittes von intelligenten Maschinen, der unmittelbar nach dem Sieg von IBM’s Watson ¡ท der Quizshow Jeopardy! angestoßen wurde, sind kognitive Systeme heutzutage ein omni- präsentes Thema und als ein strategischer IT-Trend seit 2016 zu sehen. Eine zentrale Voraus­setzung bei diesen Systemen ist die Kommunikation mit dem Menschen und damit das Ver­stehen und Verarbeiten natürlicher Sprache. Ziel dieser Arbeit bildete daher folgende For­schungsfrage, welche anhand des kognitiven Systems Watson beantwortet wurde: Inwiefern kann ein IT-System eine Fragestellung verstehen und beantworten?

Bei der Beantwortung von Fragestellungen durch verschiedene IT-Systeme wurden unter­schiedliche Arbeitsweisen identifiziert. Dabei gibt es sowohl Pattern-basierte Suchalgorithmen, welche Fragen mit gerankten Antwortmöglichkeiten ausgeben wie Google, Suchalgorithmen, die Semantik erkennen und so Verknüpfungen zwischen den Suchbegriffen herstellen können, um auf konkrete Fragen zu antworten wie Wolfram|alpha sowie IT-Systeme, welche die Fra­gen bis ins Detail „verstehen“ und ihre Antwort nach einem probabilistischen Nachweisprinzip ähnlich dem menschlichen Denkmuster auswählen wie bspw. Watson. Diese Systeme können dadurch u.a. mit der Symbol Grounding Problematik und unsicheren Informationen umgehen.

Schlussfolgernd werden durch komplexe Synthese fortschrittlicher Technologien und Algorith­men, wie es an Watson aufgezeigt wurde, einem neuronalen Netzwerk des Menschen ähnli­che, technische Strukturen aufbaut. Bei Watson erfolgt das Verstehen einer Frage und das „Lernen“ demnach wie bei den Menschen ausgehend von einem Wissensknoten durch das Schaffen von Verbindung zu anderen Wissensknoten. Basis dafür ist eine dem System beige­brachte grundsätzliche Bedeutungszuschreibung. Die Beantwortung einer Frage geschieht folglich über einen Abwägungsprozess der möglichen Antworten der Wissensbasis des Sys­tems, wobei jede Antwort auf ihre Evidenz überprüft wird und die Geeignetste ausgewählt wird.

Reflektierend ist anzumerken, dass Cognitive Computing einen stetig wachsenden Bereich darstellt und im Rahmen dieser Arbeit lediglich ein Teilaspekt ¡ท eingeschränkter Tiefe betrach­tet werden konnte. Weiterhin wurde festgestellt, dass das Buchkapitel trotz dessen datierbarer Aktualität den aktuellen Fortschritt nicht wiederspiegeln kann, wodurch viele Quellen hinzuge­zogen wurden, um dem heutigen Stand gerecht zu werden. เท zukünftiger Forschung könnten bereits umgesetzte Anwendungsszenarien kognitiver Systeme mit wirtschaftlichen Kenngrö­ßen betrachtet werden, wie eingesparte monetäre Aufwände von Firmen durch verminderte Personenstunden oder gezieltes Agieren auf Empfehlungen basierend auf kognitiven Progno­sen. Des Weiteren sind Untersuchungen bzgl. der Grenzen kognitiver Systeme bzw. der mo­ralischen Frage nach dem Ende der Maschinenautonomie möglich.

Literaturverzeichnis

Accenture Plc (2016): Accenture Amelia Practice to Help Organizations Accelerate Adoption of Artificial Intelligence, [online] https://newsroom.accenture.com/news/accenture-and- ipsoft-launch-accenture-amelia-practice-to-help-organizations-accelerate-adoption-of- artificial-intelligence.htm [28.05.2016].

Anderson, John R. (2012): Kognitive Psychologie, Berlin: Springer Berlin Heidelberg.

Ankeny, Jason (2015): Meet Amelia, the Al Platform That Could Change the Future of IT, [online] https://www.entrepreneur.com/article/245827 [28.05.2016].

Buehler, Martin, Karl lagnemma und Sanjiv Singh (2007): The 2005 DARPA Grand Chal­lenge.The Great Robot Race, Berlin: Springer Berlin Heidelberg.

Cognitive Computing Consortium (2014): Cognitive Computing Definition, [online] https://cog- nitivecomputingconsortium.com/definition-of-cognitive-computing [24.05.2016].

Deedrick, Tami (2011): It’s Technical, Dear Watson, [online] http://www.ibmsystems- mag.com/ibmi/trends/whatsnew/lt%E2%80%99s-Technical,-Dear-Watson/ [30.05.2016].

Deng, Li und Dong Yu (2013): Deep Learning. Methods and Applications, ¡ท: Eldar Yonina (Hrsg.), Foundations and Trends® เท Signal Processing, Voi. 7, Nos 3-4, ร. 197-387.

Earley, Seth (2015): Executive Roundtable Series. Machine Learning and Cognitive Compu­ting”, ¡ท: IEEE IT Professional, Voi. 17, No. 4, ร. 56-60.

Gartner Inc. (2012): Predicts 2013: Business Intelligence and Analytics Need to Scale Up to Support Explosive Growth ¡ท Data Sources, [online] https://www.gart- ner.com/doc/2269516/predicts—business-intelligence-analytics [28.05.2016].

Gartner Inc. (2015): Top 10 strategic Technology Trends for 2016: At a Glance, [online] https://www.t-systems.de/news-media/gartner-top-10-strategic-technology-trends-for- 2016-at-a-glance/1406184_1/blobBinary/gartner_top10.pdf [01.06.2016].

Hassabi, Demis (2016): AlphaGo: using machine learning to master the ancient game of Go, [online] httpsd4.05.2016] .

Haun, Matthias (2014): Cognitive Computing, Berlin: Springer Berlin Heidelberg.

Hehl, Walter (2016): Wechselwirkung. Wie Prinzipien der Software die Philosophie verän­dern, Berlin: Springer Berlin Heidelberg.

IBM Corporation (2011a): The DeepQA Research Team, [online] http://researcher.wat- son.ibm.com/researcher/view_group_subpage.php?id=2159 [30.05.2016].

IBM Corporation (2011 b): Watson - Antworten mit System. Die Zukunft des workloadopti- mierten Systemdesigns, о. о.: IBM Corporation.

IBM Research (2012): Building Watson: A Brief Overview of the DeepQA, New York: IBM Corporation.

IBM Corporation (2014): Neue Watson Services aus der Cloud, [online] http://www- 03.ibm.com/press/de/de/pressrelease/42900.wss [30.05.2016].

IBM Corporation (o. J.(a)): What ¡ร Watson?, [Intranet] http://www.ibm.com/smarter- planet/us/en/ibmwatson/what-is-watson.html [26.05.2016].

IBM Corporation (o. J. (b)): Is Watson artificial intelligence?, [online] https://w3-work- place.ibm.com/ibm/thinkacademy/?cache=4-23-17#/one-question/is-watson-artificial-in- telligence [23.05.2016].

Kelly, John E. 2015: Computing, cognition and the future of knowing. How humans and ma­chines are forging a new age of understanding, [online] http://www.research.ibm.com/software/IBMResearch/multimedia/Computing_Cognition_ WhitePaper.pdf [23.05.2016].

Klein, Dominik, Phuoc Tran-Gia und Matthias Hartmann (2013): Big Data, [online] https://www.gi.de/service/informatiklexikon/detailansicht/article/big-data.html [25.05.2016] .

Lercher, Silvia und Alexandra Heinisch (2009): The Symbol Grounding Problem, [online] https://www.uibk.ac.at/psychologie/mitarbeiter/leidlmair/the_symbol_grounding_prob- lem_seminararbeit.pdf [25.05.2016].

Licklider, J. c. R. (1960): Man-Computer Symbiosis, ¡ท: IRE Transactions on Human Factors in Electronics, Voi. HFE-1, ร. 4-11.

Marr, Bernard (2016): What Everyone Should Know About Cognitive Computing, [online] http://www.forbes.com/sites/berriardmarr/2016/03/23/what-everyone-should-know-about- cognitive-computing/#2837de165d6e [23.05.2016].

May, Kate T. (2016): How did supercomputer Watson beat Jeopardy champion Ken Jen­nings?.Experts discuss., [online] http://blog.ted.com/how-did-supercomputer-watson- beat-jeopardy-champion-ken-jennings-experts-discuss/ [28.05.2016].

McCarthy, John (2007): What ¡ร artificial intelligence?, Standford, CA: Standford University.

Microsoft Corporation (o. J.): Grundlegendes zur Funktionsweise von Suchmaschinen, [on­line] https://msdn.microsoft.com/de-de/library/ff724041 %28v=expression.40%29.aspx [24.05.2016] .

Microsoft Corporation (2016): Grundlegendes zur Funktionsweise von Suchmaschinen, [on­line] https://support.microsoft.eom/en-us/help/11694/windows-phone-cortana-on-your- windows-phone [27.05.2016].

Modha, Dharmendra ร., Rajagopal Ananthanarayanan, Steven K. Esser, Anthony Ndirango, Anthony J. Sherbondy und Raghavendra Singh (2011): Cognitive Computing, ¡ท: Com­munications of the ACM, Vol. 54, Nr. 8, ร. 62-71.

Moriegairi, Berme (2016): IBM Watson teams up with American Cancer Society to pit cogni­tive computing against cancer, [online] http://www.healthcareitnews.com/news/ibm-wat- son-teams-american-cancer-society-pit-cognitive-computing-against-cancer [02.06.2016] .

New York Times (2016): The Promise of Artificial Intelligence Unfolds ¡ท Small Steps, [online] http://www. nytimes. com/2016/02/29/technology/the-promise-of-artificial-intelligence-un- folds-in-small-steps.html?_r=0 [28.05.2016].

Nimführ, Wolfgang (2011): Watson - Ein lernendes Computersystem, Zürich: IBM Corpora­tion.

Rouse, Margaret (2016): Cognitive Computing, [online] http://whatis.techtarget.com/defini- tion/cognitive-computing [23.05.2016].

Tacke, Oliver (2007): Wissensmaschine zweckentfremndet: Business Intelligence mit Wolf- ram|alpha, ¡ท: Wirtschaft und Management, Voi. 1, Nr. 4, ร. 20-23.

Volker, Zota (2015): Digitale Assistenten, ¡ท: c’t magazine für computer technik, Nr. 16/2015, ร. 122-142.

Weber, Mathias (2015): Kognitive Maschinen - Meilenstein in der Wissenschaft. Leitfaden, Berlin: Bundesverband Informationswirtschaft, Telekommunikation und neue Medien e.v.

Anhang

Abbildung in dieser Leseprobe nicht enthalten

Abb. 6: Screenshot der beantworteten Frage von Wolfram|alpha am 29.05.2016.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 7: Screenshot der beantworteten Frage (A) von Wolfram|alpha am 29.05.2016.

Abbildung in dieser Leseprobe nicht enthalten

Abb. 8: Stichwortsuche über unstrukturierte Datenbestände (exemplarisch: Wikipedia).


[1] Deep Learning ist eine Klasse von Machine Learning Techniken, die auf multiplen Ebenen von nicht­linearen Information arbeiten und eine Methode zum bewachten oder unbewachten Lernen von abs­trakteren Schichten darstellen (vgl. Deng 2014).

[2] Das neuronale Netzwerk beschreibt dabei einen komplexen Daten-Entscheidungsbaum, den das Computer-System durchläuft, um letztlich die passende Antwort zu verifizieren (vgl. Marr 2016).

[3] Die Scaling-Problematik bei der Begriffssuche zielt heute auf die Masse an Informationen ab, aus denen die passendsten Ergebnisse der Suchbegriffe auswählt werden sollen (vgl. Hehl 2016: 164).

[5] Big Data ist ein abstrakter Begriff für die bestehende Menge und Art von Daten und deren Anstieg, der mit traditioneller Datenanalyseverfahren nicht mehr zu bewältigen ist (vgl. Klein et al. 2013).

[6] Verazität ist im Kontext der Grad an Qualität, Wahrhaftigkeit einer Information (vgl. Hehl 2016: 166).

Ende der Leseprobe aus 21 Seiten

Details

Titel
Das „Denken“ von kognitiven Systemen
Untertitel
Die Beantwortung von Fragen mittels Deep Learning Algorithmen und neuronalen Netzwerken am Beispiel von IBM Watson
Note
1,0
Autor
Jahr
2016
Seiten
21
Katalognummer
V373383
ISBN (eBook)
9783668499096
ISBN (Buch)
9783668499102
Dateigröße
1177 KB
Sprache
Deutsch
Schlagworte
KI, AI, Künstliche Intelligenz, artificial intelligence, deep learning algorithmen, Watson, neuronale Netzwerke, kognitive Systme
Arbeit zitieren
Hannes Ueberschär (Autor:in), 2016, Das „Denken“ von kognitiven Systemen, München, GRIN Verlag, https://www.grin.com/document/373383

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Das „Denken“ von kognitiven Systemen



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden