Lade Inhalt...

Das Simple Knowledge Organization System (SKOS)

Hausarbeit 2008 17 Seiten

Informatik - Angewandte Informatik

Leseprobe

Inhaltsverzeichnis

1. Einleitung

2. Das Semantic Web
2.1 RDF
2.2 RDFS
2.3 OWL

3. SKOS
3.1 Geschichte
3.2 Aufbau
3.2.1 Klassen
3.2.1 Properties

4. Beispiel

5. Fazit

Literaturverzeichnis

1. Einleitung

Die exponentielle Zunahme (siehe Abb. 1) an Informationen im World Wide Web hat zum Information Overflow geführt. Es existieren ca. 2,5 Milliarden frei zugängliche Dokumente. Berücksichtigt man vernetzte Datenbanken, Intranets und dynamische Seiten ist sogar von etwa 550 Milliarden Inhalten auszu-gehen.[1]

Abbildung in dieser Leseprobe nicht enthalten

Abb. 1: Exponentielles Wachstum des Internets[2]

Eine vollständige Recherche zu einem relevanten Thema ist nahezu un-möglich geworden. Aktuelle textbasierte Suchmaschinen haben eine Reihe von Einschränkungen:

- Webdokumente bestehen aus Bildern, Audiodateien oder Videos.
- Unvollständigkeit bzw. zu geringe Trefferzahl aufgrund von Synonymen.
- Ungenauigkeit bzw. zu große Trefferzahl aufgrund von Homonymen.

Das Kernproblem ist demnach die Schnittstelle zwischen Mensch und Maschine. Natürliche Sprachen sind zu vielschichtig und unpräzise, so dass sie vom Computer nicht exakt verstanden und umgesetzt werden können.

Um die immer größer werdende Anzahl an Informationen im Internet auch zukünftig nutzen zu können, ist eine formale Sprache vonnöten.

Diese Sprache sollte Webinhalte aufgrund eines einheitlichen Vokabulars erschließbar machen, zudem keine hohen Kosten verursachen und einfach zu erlernen sein. Das Simple Knowledge Organization System (im Folgenden: SKOS) des W3C soll diesen Anforderungen gerecht werden. Diese Hausarbeit beschäftigt sich mit dem Thema SKOS. Nach der Beschreibung der Basis-technologien und der Entwicklung dieses Systems wird die Funktionsweise anhand von Beispielen erläutert und ein Ausblick auf zukünftige Anforder-ungen gegeben.

2. Das Semantic Web

Das Semantic Web basiert auf einer Idee von WWW-Erfinder Tim Berners-Lee und ist eine Weiterentwicklung des aktuellen Internets. Auf der Website des W3C wird das Semantic Web wie folgt definiert:

„The Semantic Web provides a common framework that allows data to be shared and reused across application, enterprise, and community boundaries. It is a
collaborative effort led by W3C with participation from a large number of researchers and industrial partners. It is based on the Resource Description Framework (RDF).”[3]

Das Semantic Web erweitert die Dokumente des World Wide Web um Daten, die applikations- und plattformunabhängig von Maschinen interpretierbar sind. Eine der ersten Technologien auf diesem Gebiet ist die eXtensible Markup Language (im Folgenden: XML). Mit der Hilfe von XML können Metadaten in Webdokumente eingefügt werden, die z. B. Verfasserangaben und Such-maschinen-Schlüsselwörter enthalten. Problematisch ist die freie Wahl von Elementnamen in XML, so ist eine domainübergreifende Maschinenlesbarkeit nicht gewährleistet. Computer benötigen einen einheitlichen Standard, um korrekt auf bereitgestellten Daten zu operieren. Ebenso führt die große Menge an heutigen Daten die Methode der Datendefinition an ihre Grenzen.
Um das Ziel des Semantic Web zu erreichen, müssen Daten aus unterschied-lichen Domains auf der Basis ihrer Eigenschaften und Relationen klassifiziert werden. Dafür werden Technologien, wie das Resource Description

Framework (im Folgenden: RDF), das Resource Description Framework Schema (im Folgenden: RDFS) und die Web Ontology Language (im Folgenden: OWL) genutzt.[4]

2.1 RDF

Bei RDF handelt es sich um eine offiziellen Standard des W3C. Die aktuellste Version ist vom 10. Februar 2004.[5] RDF beschreibt Ressourcen im World Wide Web auf der Basis von XML und Uniform Resource Identifiers (im Folgenden: URI). RDF Anweisungen beschreiben eine Ressource durch Eigenschaften und Werte. Ein URI wird zur eindeutigen Identifikation einer Quelle eingesetzt. Aussagen über Ressourcen werden in der RDF-Terminologie als Triple bezeichnet und setzen sich aus Subjekt, Prädikat und Objekt zusammen.

Das Subjekt ist die zu beschreibende Ressource. Das Prädikat ist Merkmal dieser Ressource und beschreibt Beziehungen zwischen dem Subjekt und dem Objekt. Das Objekt ist der Wert der erstellten Beziehung. (siehe Abb. 2)

Abbildung in dieser Leseprobe nicht enthalten

Abb. 2: RDF-Statement[6]

Maschinen sind in der Lage, logische Annahmen aufgrund der Beziehungen zwischen Subjekt und Objekt zu machen. RDF bietet demnach eine Syntax, um Webinhalte zu beschreiben, ist aber nicht ausreichend, um semantische er Beziehungen für Computer darzustellen. Semantik lässt sich mit RDFS und
OWL definieren.[7]

2.2 RDFS

In RDFS lassen sich Vokabulare erstellen, um verwandte RDF-Ressourcen und deren Beziehungen zueinander auszudrücken. Analog zum Triples-Modell von RDF setzen sich RDFS-Triples aus Klassen, Klasseneigenschaften und Werten zusammen. Ressourcen werden als Instanzen von Klassen definiert. Das Klassenkonzept ermöglicht die formale Beschreibung semantischer Beziehungen zwischen den verwendeten RDF-Elementen.[9] Klassen sind ebenfalls Ressourcen; des Weiteren besteht die Möglichkeit, dass eine Klasse die Unterklasse einer anderen sein kann. Aufgrund dieser Informations-hierarchie können Agenten die Bedeutung der einzelnen Ressourcen erkennen.[10][8]

2.3 OWL

OWL baut auf RDF und XML auf und ermöglicht die Definition von Web Ontologien durch eine hierarchische Beschreibung von Klassen sowie von Attributen und Assoziationen dieser Klassen. Im Gegensatz zu RDFS sind in OWL auch die Beziehungen zwischen Klassen darstellbar. OWL setzt sich aus drei Sprachebenen zusammen:

- OWL Lite soll den Zweck einer einfach zu implementierenden Untermenge der Sprache erfüllen und damit ungeübte Benutzer – ohne große Einarbeitung – in die Lage versetzen, einfache Taxonomien zu erstellen.
- OWL DL umfasst den kompletten OWL Wortschatz, wird aber durch Einschränkungen für den Einsatz von RDFS-Konstrukten begrenzt.
- OWL Full beinhaltet ebenfalls den vollständigen OWL Wortschatz, besitzt aber keine weiteren Beschränkungen.[12][11]

3. SKOS

RDF eignet sich gut, um Angaben über Webseiten zu machen und Metadaten zu verfassen, aber es bietet nicht genügend Ausdrucksstärke, um komplexe semantische Beziehungen zu beschreiben. Mit Ontologiesprachen wie z.B. OWL lässt sich eine ausdrucksstärkere Ebene auf RDF aufsetzen. [13]

Es ermöglicht den Einsatz von Werkzeugen, um komplexe Strukturen zu definieren und dadurch reichhaltige Metadaten zu generieren. Der Aufbau einer Ontologie ist kompliziert und kostenaufwändig und daher für viele Webressourcen ungeeignet. Der Betreiber einer Homepage wird beispiels-weise kaum in der Lage sein, die private Site mit OWL semantisch erschließbar zu machen.

Demnach wird also eine Sprache benötigt, die zum einen mächtig genug ist, um semantisch gestützte Suchen im Internet zu ermöglichen, und zum anderen dennoch so einfach gehalten ist, dass keine hohen Kosten oder großes Fachwissen beim Einsatz vonnöten sind.[14]

3.1 Geschichte

Im Bibliothekswesen werden Klassifikationen und Thesauri seit vielen Jahren erfolgreich eingesetzt. Seit Mitte der 1980er Jahre werden diese formal durch die zwei ISO Normen ISO2788 und ISO5964 beschrieben. Im Zusammenhang mit dem WWW gab es verschiedene Ansätze, um bestehende Thesauri durch XML und RDF auf das Internet zu übertragen. Wie bereits oben erwähnt basiert SKOS auf diesen Technologien. Das Semantic Web Advanced Development for Europe (SWAD-Europe) begann im Jahr 2002 damit einen
Klassifikationsstandard für das WWW zu erarbeiten und veröffentlichte 2003 den ersten RDF-basierten SKOS Core Entwurf. 2004 wurde SKOS Core durch das W3C in die semantic web best practice and deployment working group aufgenommen, um im März 2005 erstmalig als W3C working draft publiziert zu werden. Seit dem Jahr 2006 pflegt die Semantic Web Deployment Working Group SKOS Core und beabsichtigt, bis Ende des Jahres 2007 eine Candidate Recommendation und Anfang 2008 eine Proposed Recommendation zu veröffentlichen.[15]

[...]


[1] http://wissensnavigator.ch/interface2/knowledge/contents/information_overflow/index.htm (05.04.2008)

[2] Abbildung vgl. Handley (2006), S 121

[3] http://www.w3.org/2001/sw/ (06.04.2008)

[4] http://www.altova.com/de/semantic_web.html (07.04.2008)

[5] http://www.w3.org/TR/rdf-primer/ (07.04.2008)

[6] Eigene Abbildung

[7] Hitzler, P. (2007), S.36-49

[8] http://www.w3.org/TR/rdf-schema/ (09.04.2008)

[9] http://de.wikipedia.org/wiki/RDFS (09.04.2008)

[10] Hitzler, P; (2007), S.66-88

[11] http://www.w3.org/TR/owl-features/ (11.04.2008)

[12] http://de.wikipedia.org/wiki/Web_Ontology_Language (11.04.2008)

[13] http://www.w3.org/TR/2008/WD-skos-reference-20080125/ (11.04.2008)

[14] Miles, A (2005)

[15] http://en.wikipedia.org/wiki/SKOS (13.04.2008)

Details

Seiten
17
Jahr
2008
ISBN (eBook)
9783656200628
ISBN (Buch)
9783656204244
Dateigröße
845 KB
Sprache
Deutsch
Katalognummer
v194711
Institution / Hochschule
Hochschule Hannover
Note
2,3
Schlagworte
Computerunterstützte Inhaltserschließung Simple Knowledge Organization System SKOS Informationsmanagement

Autor

Teilen

Zurück

Titel: Das Simple Knowledge Organization System (SKOS)