Lade Inhalt...

Social Network Analysis und Graphdatenbanken

Seminararbeit 2019 20 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

Inhaltsverzeichnis

Abkürzungsverzeichnis

1. Einleitung

2. Analyse sozialer Netzwerke

3. Grundlagen zu Graphdatenbanken

4. Graphdatenbanken in der SNA

5. Anwendungsfelder
5.1 Das Unternehmen als soziales Netzwerk
5.2 Auswirkungen auf die Marktforschung

6. Fazit

Literaturverzeichnis

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1. Einleitung

In den vergangenen Jahren ist dem Netzwerkbegriff nicht nur in seiner sprachlichen Verwendung eine wachsende Bedeutung zugekommen. Vernetzung ist in allen Bereichen der Gesellschaft gegenwärtig – sei es am Arbeitsplatz, im Privatleben oder der Öffentlichkeit. Mit dem Aufkommen und ständiger Verfügbarkeit sozialer Medien entwickelte sich ein Bewusstsein für diese vielfältigen Beziehungen, die der Mensch als soziales Wesen seit jeher pflegt. Der eigene Alltag beschäftigt sich durch Plattformen wie Instagram oder LinkedIn zusehends mit dem Gegenstand „Netzwerk“ an sich, was sich nicht zuletzt in Modewörtern wie „socializing“ oder „networken“ niederschlägt.

Dieses neue Bewusstsein über die Bedeutung sozialer Strukturen, kombiniert mit einer nie dagewesenen Transparenz früher unzugänglicher Wirkungsgeflechte befeuert einen Paradigmenwechsel von der Informationsgesellschaft hinein in eine Netzperspektive. Es stellt sich die Frage: Wie können die Daten unserer interkonnektiven Umwelt bestmöglich für Analyseprozesse genutzt werden, um Erkenntnisse über soziale, wirtschaftliche und kommunikative Zusammenhänge zu erhalten und das gewonnene Meta-Wissen über (informelle) Netzwerke zielgerichtet, z.B. in Form von Optimierung oder Manipulation, einzusetzen?

Im Zuge der digitalen Transformation setzen sich viele Unternehmen daher mit den Themen Big Data und sozialer Netzwerkanalyse (SNA) auseinander mit dem Ziel, darin enthaltene Informationen offenzulegen und als Wissen nutzbar zu machen. Da solche Datenbestände nach den Dimensionen der 3 V‘s in großer Menge, in unstrukturierter oder auch unterschiedlich strukturierter Form vorliegen und sich in der benötigten Verarbeitungszeit unterscheiden, kommt der Auswahl geeigneter Werkzeuge eine große Bedeutung zu, um einen effektiven und effizienten Datenbearbeitungs- und Analyseprozess zu gewährleisten. Hier haben sich im Bereich der Datenbanksysteme Graphen als nützliche Form erwiesen, Daten übersichtlich und nachvollziehbar zu visualisieren.

Ziel dieser Arbeit ist es, einen grundlegenden Überblick über die methodische Arbeit und den State-of-the-Art der sozialen Netzwerkanalyse zu bieten.

Insbesondere sollen sowohl der Umgang, wie auch Relevanz und Potenziale von Daten als Wissensrohstoff und Wertgegenstand thematisiert werden. Auf technischer Ebene wird nach einer Einordnung auf die Eignung von Graphdatenbanken für Analytics eingegangen. Anschließend werden ausgewählte Anwendungsfelder in einer Netzwerksicht betrachtet und es soll ausgelotet werden, inwieweit Einsatzmöglichkeiten sowie Erkenntnisgewinne durch SNA bestehen.

2. Analyse sozialer Netzwerke

Bei der analytischen Betrachtung eines Realitätsausschnitts ist es essentiell, zu Beginn eine eindeutige Definition des Untersuchungsgegenstands vorzunehmen. So stammt der Terminus des Social Networks aus der Netzwerktheorie der Sozialwissenschaften. Christakis und Fowler beschreiben das soziale Netzwerk als eine Gruppe, die nicht nur eine bestimmte Anzahl von Menschen darstellt, sondern sich vielmehr durch die Beziehungen zwischen ihren Teilnehmern auszeichnet. Sie sehen Personen, Beziehungen und die darüber getätigten Übertragungen als dessen elementare Bestandteile.1 Weiterhin lassen sich soziale Netzwerke bezüglich ihres Umfangs und dem Grad der Verflechtung charakterisieren, der Position ihrer Teilnehmer und der Qualität ihrer Beziehungen. Somit können bspw. städtischer Straßenverkehr, eine Schule oder ein Unternehmen als eigene soziale Netzwerke angesehen werden. Abzugrenzen ist diese allgemeinere Betrachtungsweise einerseits von sozialen Online-Netzwerken. Diese umgangssprachlich als „soziale Netzwerke“ bezeichneten Plattformen sind lediglich als ein Teilbereich von unterschiedlichen Ausprägungen anzusehen. Andererseits besetzt der Begriff „soziale Medien“ das weiter gefasste Feld der wechselseitigen, interaktiven Kommunikation über das Internet. Typischerweise zu Social Media gezählte Plattformen beinhalten neben sozialen Netzwerken unter anderem Blogs, Wikis sowie Foto- und Video-Sharing Plattformen.2

Als theoretisches Fundament für die Beschreibung von sozialen Netzwerken kann die Akteur-Netzwerk-Theorie herangezogen werden.

Sie unterstellt Aktanten, Netzwerkbeziehungen und Objekte als Elemente, woraus sich unterschiedliche Betrachtungsschwerpunkte ergeben.3 So beschäftigt sich bspw. die psychometrische Analyse mit Akteursverhalten, die Soziologie mit der Eigendynamik des Netzwerks und die ausgetauschten Inhalte sind für Diskursanalysen von Interesse. Die Social Network Analysis beschäftigt sich nun dahingehend mit dem Aufdecken von Mustern in der Interaktion zwischen den Netzwerk-Teilnehmern. Sie geht von der Annahme aus, dass die abgebildeten sozialen Strukturen von entsprechender Wichtigkeit im Leben derjenigen darstellen, die sie erzeugen. Netzwerkforscher nehmen weiterhin an, dass die Art der Einbindung einer Person in das sie umgebende Netz in erheblichem Maße Einfluss auf ihr eigenes Leben und Verhalten nehme und dass überdies ebenso der Erfolg einer Gesellschaft oder Organisation vom Muster der internen Struktur abhänge.4

Netzwerke lassen sich nach mehreren Ansätzen klassifizieren. Die SNA unterscheidet im Allgemeinen zwischen ego-zentrierter und Gesamtnetzwerk- Betrachtung, wobei erstere die Sicht eines bestimmten Akteurs einnimmt und in Bezug zu seiner Umwelt setzt, letztere sich nicht auf ein Individuum beschränkt und das Gesamtbild wahrnimmt.5 Die ego-zentrierte Analyse betrachtet einen beschränkten Teilausschnitt der Netzwerk-Realität zur Ermittlung spezifischer Metriken. So bezeichnet die Netzwerkgröße die Anzahl an Personen, mit denen ein Akteur verbunden ist, der Anteil von vorhandenen an potentiellen Verbindungen in diesem Subnetz wird als Dichte gemessen. Die Multiplexität gibt Auskunft, ob Akteure über mehrere Arten von Beziehungen interagieren. Netzwerke in ihrer Gesamtheit lassen sich nach Göllner et al. in Closure Networks und Brokerage Networks aufgliedern.6 In Anlehnung an die Systemtheorie entspricht dies einer Aufteilung in abgeschlossene und offene Systeme. Ein Closure Network kann als unabhängig von externen Einflüssen und zentralisiert charakterisiert werden, wobei sich Abhängigkeiten von Akteuren in zentraler Position ausbilden. In offenen Netzwerken nehmen sogenannte Broker eine Brückenrolle zwischen (sonst isolierten) Subsystemen ein und ermöglichen übergreifende Kommunikation. Wie auch Netzwerkzentren sind Broker strukturkritische Einheiten, da ohne sie Teile des Gesamtnetzes von der Kommunikation abgeschnitten werden.

Daneben existieren weitere Ebenen unterschiedlichen Fokus. Dyaden formalisieren den Beziehungszustand zwischen zwei Akteuren. Da es sich bei Verbindungen um gerichtete Kanten handelt, kann zwischen Zuständen a) einer wechselseitigen Beziehung, b) einer von zwei möglichen asymmetrischen Beziehungen, oder c) einer nicht ausgebildeten Beziehung differenziert werden.7 Triaden nehmen in ihrer Betrachtung einen dritten Knotenpunkt hinzu, womit sie als Verbund von drei Dyaden verstanden werden kann. Der dritte Akteur lässt sich als Broker nutzen, welcher für die anderen eine Funktion erfüllt. So kann er den Verbund von innen oder außen heraus koordinieren oder als Gatekeeper den ein- und ausgehenden Informationsfluss steuern.8

Die Social Network Analysis verfolgt je nach Einsatz verschiedene Messziele, wie die Identifikation verborgener Gruppen und Beziehungen, Informationsflüssen („Information Propagation“) oder Prozessen. Sie arbeitet dabei oft qualitativ und verwendet zur Datengewinnung Tools wie Interviews, Fragebögen, Textanalysen und Data Mining.9 Nach Cross und Parker kann eine Online-SNA in sieben Teilschritten durchgeführt werden. Zu Beginn werden in der Zielsetzung Strukturen, Prozesse und Themen identifiziert, in denen substanzielle Unklarheiten über die reale Netzwerksituation vermutet werden. Daraufhin wird eine Zielgruppe definiert, um den Netzwerkausschnitt abzustecken, Akteursrollen zu vergeben und die Art der zu erhebenden Beziehungen festzulegen. Nach Auswahl geeigneter Tools und Erstellung eines Ablaufplans erfolgt die Phase der Datenerhebung. Aufgrund der Besonderheit von Netzwerkdaten können diese visualisiert werden, sodass bereits bei optischer Datenbetrachtung erste Strukturmerkmale ersichtlich werden. Um präzise Aussagen zu erhalten, schließt sich die Berechnung von Kenngrößen und Indikatoren an. Erwähnenswert sind hier Zentralitätsmaße wie „Degrees of Separation“ als Abstandsmaß, Closeness-Zentralität der Erreichbarkeit oder Authority Weight als Maß der einflussreichen Freunde. Die in sozialen Netzwerken gerichteten Beziehungen erlauben weiterhin Prestigemaße, um den Rang eines Akteurs zu bestimmen.10 Den Abschluss einer SNA bildet die Verbreitung der Ergebnisse sowie Umsetzung darauf ausgerichteter Maßnahmen.11

Wichtige Voraussetzung für eine effektive und realitätsgetreue Analyse sozialer Netzwerke ist die Datenqualität als Faktor in der Erhebungsphase. Wang und Strong definieren hierfür mit der intrinsischen, kontextuellen und repräsentierbaren Datenqualität sowie der Zugänglichkeit mehrere Qualitätsdimensionen. Vollständigkeit, Aktualität und Interpretierbarkeit der Daten sind relevante Kriterien, die die Auswertungskomplexität und den Ergebnisnutzen einer SNA beeinflussen.12

3. Grundlagen zu Graphdatenbanken

Bei Graphdatenbanken handelt es sich um ein Speichersystem, welches aus der Graphentheorie entstammt. Dieses setzt sich aus einem Datenbank-Management- System (DBMS), sowie der dadurch verwalteten Datenbasis zusammen und verwendet Knoten, Kanten und Attribute, um Daten in einer Graphstruktur zu repräsentieren und zu speichern.

Grundlegend wird zwischen zwei Modellierungsansätzen von Graphdatenbanken unterschieden: dem Resource Description Framework (RDF) und Labeled Property Graphs (LPG). Historisch bedingt dient RDF dem Zweck eines vereinheitlichten Datenaustauschs. Daten werden nach dem Schema Subjekt-Prädikat-Objekt in Beziehung gesetzt, wobei das Prädikat, als gerichtete Kante, Start- und Endknoten verbindet. Alle Knoten und Kanten sind durch einen Unique Resource Identifier (URI) ansprechbar. Sämtliche Attribute einer Entität werden im RDF-Graphen ebenfalls als Knoten abgebildet. LPG verfolgt dagegen das primäre Ziel der effizienten Datenspeicherung, um unter anderem schnellere Anfragen entlang von Beziehungsgraphen durchführen zu können. Hier erhält jeder Knoten eine ID, welchem die Attribute, auch Properties genannt, als Schlüsselwert-Paare zugeordnet sind. Ebenso verfügen Kanten, die Beziehungen, über eindeutige IDs und ein zugeordnetes Set von Attributen. Damit befinden sich die Attribute sowohl von Knoten als auch Kanten in einer internen Struktur, was den Hauptunterschied zu RDF darstellt und die Darstellung mehrerer Instanzen desselben Beziehungstyps zwischen zwei Knoten ermöglicht.13

Graphdatenbanken sind den NoSQL Datenbanken zuzuordnen und unterscheiden sich somit vom tabellarischen Aufbau relationaler Datenbanken. In diesen werden Datensätze implizit miteinander verknüpft (Schlüsselsystem), wohingegen in Graphdatenbanken Abhängigkeiten explizit modelliert werden. Ein Vorteil, dass Daten in dieser Repräsentationsstruktur direkt miteinander verlinkt werden, ist, dass durch die kurzen Verbindungswege bei hohem Vernetzungsgrad einzelne Datensätze schnell erreicht werden. Auch die Zugriffsoperationen gehen mit geringerem Zeitaufwand einher, da das Design einer Graphdatenbank auf Beziehungen ausgerichtet ist und diese Verbindungen bereits abgespeichert vorliegen.14

Das Datenbankschema muss außerdem nicht vordefiniert werden, „Knoten, Eigenschaften, Verbindungen und neue Beziehungsarten können jederzeit dynamisch ergänzt oder entfernt werden.“15 Solche Transaktionen auf Graphdatenbanken erfüllen auch das ACID-Paradigma (Atomarität, Konsistenz, Isolation, Dauerhaftigkeit), wodurch vollständige und konsistente Zugriffe auch bei Analytics und Reporting in Echtzeit gewährleistet werden.16

Während im relationalen System mit JDBC und SQL gängige Standards etabliert sind, wird für Graphdatenbanken eine eigene Anfragesprache benötigt. Für den Graphzugriff existiert eine Vielzahl an (teils anbieterspezifischen) Sprachen wie SPARQL und Gremlin für RDF oder openCypher für LPG.17 Wie auch bei anderen DBS übernimmt die Verwaltung der Graphdatenbanken ein DBMS. Als meistverwendetes System kommt in diesem Bereich Neo4j zum Einsatz, weitere Alternativen sind bspw. Azure Cosmos DB von Microsoft oder ArangoDB.18 In Bezug auf den Speichermechanismus kann zwischen nativen und nicht-nativen Graphdatenbanken differenziert werden. Bei nativen Lösungen ist das Dateisystem auf das Graphmodell ausgerichtet, sodass das Entlanggehen an einer Beziehung in einem Schritt geschieht. Suchoperationen werden daher in O(n) ausgeführt, wobei sich die Kosten nach der Menge der zu suchenden Daten richtet und unabhängig von der Gesamtgröße des Graphen ist. Dagegen kann auch ein nicht-graphbasiertes, bestehendes Modell in eine Graphdatenbank umgewandelt werden.

[...]


1 Vgl. Christakis und Fowler (Die Macht sozialer Netzwerke).

2 Bendel (Soziale Medien), URL siehe Literaturverzeichnis.

3 Vgl. Latour (Soziologie für eine neue Gesellschaft).

4 INSNA (What is Social Network Analysis?), https://www.insna.org.

5 Jansen (Einführung in die Netzwerkanalyse), S. 79.

6 Göllner u.a. (Einführung in die soziale Netzwerkanalyse), S. 13ff.

7 Trappmann u.a. (Strukturanalyse sozialer Netzwerke), S. 182f.

8 Nooy u.a. (Exploratory social network analysis), S. 151.

9 Zenk und Behrend (Soziale Netzwerkanalyse in Organisationen), S. 211ff.

10 Mutschke (Zentralitäts- und Prestigemaße), S. 366.

11 Vgl. Cross und Parker (The hidden power of social networks).

12 Wang und Strong (What data quality means), S. 5-33.

13 Barrasa (RDF Triple Stores vs. Labeled Property Graphs), URL siehe Literaturverzeichnis.

14 Yoon u.a. (Use of Graph Database), S. 19-27.

15 WI-Wiki.de (Graphdatenbanken), URL siehe Literaturverzeichnis.

16 PAT Research (Top 27 Graph Databases), URL siehe Literaturverzeichnis.

17 Francis u.a. (Cypher), S.1433ff.

18 DB-Engines (Ranking of Graph DBMS), URL siehe Literaturverzeichnis

Details

Seiten
20
Jahr
2019
ISBN (eBook)
9783668919709
ISBN (Buch)
9783668919716
Sprache
Deutsch
Katalognummer
v462520
Institution / Hochschule
Universität Stuttgart
Note
2,0
Schlagworte
social network analysis graphdatenbanken

Autor

Teilen

Zurück

Titel: Social Network Analysis und Graphdatenbanken