Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web)


Doktorarbeit / Dissertation, 2002

257 Seiten, Note: 2


Leseprobe


Kompaktes Inhaltsverzeichnis

Prolog: Eine Bestandsaufnahme

1 Ausgangslage
1.1 Textlinguistische Motivation
1.2 Problemstellung
1.3 Vorgehensweise
1.4 Einschränkungen
1.5 Zielgruppe

2 Angaben zum Corpus
2.1 WWW als technische Plattform
2.2 Informationstexte als primäre Textsorte
2.3 Die Texte des Corpus’

3 Angaben zur Literaturlage
3.1 Literatur zu Hypertext
3.2 Literatur zur Textlinguistik
3.3 Literatur zu Textlinguistik und Hypertext

Teil A: Hypertext als Untersuchungsgegenstand

4 Hypertext: Ein historischer Abriß
4.1 Die Pioniere: Bush, Nelson und Engelbart
4.2 Der Durchbruch: Berners-Lee und das WWW

5 Text, E-Text, Hypertext und Hypertext-Netz
5.1 Abgrenzung Text vs. Teiltext, Hypertext vs. Knoten
5.2 Abgrenzung E-Text, Hypertext und Hypertext-Netz

6 Komponenten eines Hypertextes
6.1 Allgemein
6.2 Komponente I: Knoten
6.2.1 Struktur
6.2.2 Inhalt und Größe
6.2.3 Darstellungsform
6.2.4 Knoten-Typen
6.3 Komponente II: Links
6.3.1 Allgemeine Eigenschaften
6.3.2 Formale Unterscheidungsmöglichkeiten
6.3.3 Inhaltliche Unterscheidungsmöglichkeiten
6.3.4 Unterscheidung nach dem Travesierungsverhalten
6.3.5 Kritik der Link-Typologie
6.4 Navigations- und Orientierungskomponenten
6.4.1 Textsequenzierung, Navigation und Browsing
6.4.2 Orientierungsprobleme und kognitive Mehrbelastung
6.4.3 Traditionelle Orientierungshilfen
6.4.4 Verzeichnisse
6.4.5 Metainformationen
6.4.6 Typographische Auszeichnungen
6.4.7 Hypertext-spezifische Orientierungs- und Navigationshilfen
6.4.8 Browser-Software
6.4.9 Backtracking, Historie, Bookmarks
6.4.10 Graphische Übersichten
6.4.11 Anfrage- bzw. Suchmechanismen: Information Retrieval
6.4.12 Guided Tours

7 Zusammenfassung: Hypertexte im WWW

Teil B: Ein Textlinguistisches Analysemodell für Hypertexte (TAH)

8 Textde finitionen
8.1 Text als vorwissenschaftliche Größe
8.2 Text: Produkt und Produktion
8.3 Die Entwicklung des Terminus’ Text
8.4 Exkurs: Einheiten zwischen Text und Satz

9 Textualitätskriterien
9.1 Kohäsion
9.2 Kohärenz
9.2.1 Kohärenz im Hypertext
9.2.2 Exkurs: Kohärenzerzeugung durch Schemata
9.3 Intentionalität
9.4 Akzeptabilität
9.5 Informativität
9.6 Situationalität
9.7 Intertextualität
9.8 Zusammenfassung

10 Dimensionen einer textlinguistischen Analyse
10.1 Allgemein
10.2 Kontextuelle Bedingungen
10.2.1 Kommunikationsform
10.2.2 Handlungsbereich
10.3 Textfunktion
10.4 Textstruktur
10.5 Textsorte

11 Paratextuelle Elemente
11.1 Traditionelle paratextuelle Elemente von Texten
11.2 Paratextuelle Elemente von Hypertexten

12 Makrostruktur und Makrostrukturanalyse
12.1 Allgemeines: Textthema und Makrostruktur
12.2 Exemplarische Makrostrukturanalyse eines Hypertextes

13 Referenzstruktur und referentielle Bewegung
13.1 Referenzbeziehungen in Texten
13.2 Modell der referentiellen Bewegung
13.3 Referentielle Bewegung in Hypertexten
13.4 Die Rolle der Quaestio

14 Zusammenfassung: Das Analysemodell TAH
14.1 Ausrichtung und Vorteile des Analysemodells
14.2 Einschränkungen
14.3 Überblicksdarstellung von TAH
14.4 Anmerkungen zu den Untersuchungsebenen
14.4.1 Anmerkungen zur Ebene Hypertext
14.4.2 Anmerkungen zu den Ebenen Knoten, Absatz und Satz
14.4.3 Anmerkungen zur Ebene Link

Teil C: Fallbeispiel - Typisierte Links

15 Technische Voraussetzungen: Links im WWW
15.1 Datenhaltung, Zwischenschicht und Oberflächenstruktur
15.1.1 Von HTML zum Semantic Web
15.1.2 Die Ebenen einer Link-Typisierung
15.1.3 Die Oberflächenstruktur als Problembereich der Untersuchung
15.2 Linking in HTML und XML
15.2.1 HTML als SGML-Anwendung
15.2.2 HTML als XML-Anwendung
15.2.3 Das Hyperlink-Modell von XML: Xlink
15.2.4 Implementierung typisierter Links im Corpus’
15.2.5 Mögliche zukünftige Implementierungen

16 Vokabularien typisierter Links
16.1 Problemstellung
16.2 Linguistische Ansätze
16.2.1 Relation Element Theory
16.2.2 Rhetorical Structure Theory
16.3 Hypertext-spezifische Ansätze
16.3.1 Allgemeine Anmerkungen und kleine Pilotstudie
16.3.2 Typisierte Links in älteren Hypertext-Systemen
16.3.3 Typisierte Links in HTML
16.4 Zusammenfassung: Geeignete Vokabularien

17 Analyse des Corpus' mit Hilfe von TAH
17.1 Vorbemerkung zur Analyse
17.2 Allgemeine, exemplarische Analyse des Corpus’
17.2.1 Kontextuelle Aspekte
17.2.2 Kommunikativ-funktionale Aspekte
17.2.3 Konventionelle Aspekte
17.2.4 Strukturelle und paratextuelle Aspekte
17.2.5 Intertextuelle Aspekte
17.3 Analyse der Typisierten Links
17.3.1 Analyse der proprietären Codierung von SELF
17.3.2 Analyse der proprietären Codierung von SELF
17.3.3 Analyse der proprietären Codierung von GRAMMIS
17.3.4 Analyse der proprietären Codie rung von SPORT
17.3.5 Versuch einer RST-Codierung des Corpus’
17.3.6 Versuch einer Codierung des Corpus’ mit Hilfe des Dublin Core
17.3.7 Versuch einer Codierung des Corpus’ mit Hilfe des rel -Attributs
17.4 Zusammenfassung: Auswertung der Ergebnisse
17.4.1 Aussagen zur Methode
17.4.2 Aussagen zu inhaltlichen Fragestellungen bzgl. der Ebene Link

Epilog: Einsatzmöglichkeiten des TAH

Anhang: Literatur und Verzeichnisse

A Glossar

B Fragebogen der Pilotstudie

C Corpusverzeichnis

D Literaturverzeichnis

Abbildungsverzeichnis

1 Knotenstruktur

2 Intra-, inter- und extra-hypertextuelle Links

3 Link-Klassifizierung nach Lokalität vs. Globalität

4 Oberfläche einer Browser-Software

5 Link-Struktur eines einfachen Hypertextes

6 MODELL DER REFERENTIELLEN BEWEGUNG

7 Ebenen der Typisierung

8 Typisierung durch ‚Mißbrauch‘ des title-Attributs

9 Link-Typisierung durch Piktogramme

10 TOPIC MAPS - TOPICS UND OCCURRENCES

11 TOPIC MAPS - TOPIC ASSOCIATIONS

12 Einfach Textanalyse mit RST

13 SELF [tcab.htm] Abschnitt SGML-gerechten Dokumenttyp angeben

14 Windows-Ordnerstruktur als Metapher für die Knoten-Hierarchie in SELF8

15 Pull-Down-Menü Quickbar als hypertext-interne Navigationshilfe von SELF8

16 Pull-Down-Menü Ü bersicht als hypertext-interne Navigationshilfe von GRAMMIS

17 Navigationsleisten und Suchfunktion in W3C

18 Untypisierte Links in W3C [/Math/] Abschnitt Highlights

19 Extra-hypertextueller Link in SELF [tgba.htm] Abschnitt WWW-Server f ü r MS

20 SELF8 [cgiperl/intro/webserverpc.htm] Abschnitt Geeignete Produkte

21 Platzhalter-Knoten in Sport1 [dynamisch erzeugter Knoten]

22 SELF [tdbc.htm] Abschnitt Schnellformatierung im Text

23 SELF [tdca.htm] Abschnitt Textschatten (text-shadow)

24 SELF8 [editorial\hinweise.htm] Abschnitt Neu in Version 8.0

25 SELF8 [css\formate\direkt.htm] Abschnitt Formatdefinitionen

26 SELF8 [css\formate\anzeige\styleattr.htm] Abschnitt Die Seite

27 GRAMMIS [grammis_sys.ansicht] Abschnitt Konnektoren ( Auswahl Konnektoren)

28 Piktogramme in SPORT1 [dynamisch erzeugter Knoten]

29 Mouse-Over-Text in Sport1 [dynamisch erzeugter Knoten]

30 RST-typisierter Knoten SELF [tdca.htm] Abschnitt Textschatten (text-shadow)

31 Style-Sheets der Link-Typenklassen

Tabellenverzeichnis

1 Hypertexte des Corpus’

2 Makrostrukturanalyse von Knoten Buchvorstellung

3 Makrostrukturanalyse von Knoten Seebold

4 Referentielle Bewegung in einem Hypertext

5 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Hypertext

6 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Knoten

7 Das TEXTLINGUISTISCHE ANALYSEMODELL FÜR HYPERTEXTE (TAH) - Ebene Link

8 RET-Familie 1: ELEMENTS OF INTENSIONAL FORCE

9 RET- Familie 2: DIMENSIONAL ELEMENTS

10 RET-Familie 3: ELEMENTS OF AGREEMENT

11 RET-Familie 4: PROPOSITIONAL ELEMENTS

12 RET-Familie 5: ELEMENTS OF PART -WHOLE INCLUSION

13 Komplexe RET-Familie 1: CONTRAST

14 Komplexe RET-Familie 2: SIMILARS

15 Komplexe RET-Familie 3: CLASS INCLUSION

16 Komplexe RET-Familie 3: CASE RELATION

17 Komplexe RET-Familie 5: PART-WHOLE

18 Presentational Relations der RST

19 Subject Matter Relations der RST

20 Multinuclear Relations der RST

21 Relation Evidence als Beispiel einer PRESENTATIONAL RELATION der RST

22 Relation Condition als Beispiel einer SUBJECT MATTER RELATION der RST

23 Relation Contrast als Beispiel einer MULTINUCLEAR RELATION der RST

24 Ergebnis der Pilotstudie

25 Heuristische Typensammlung der Pilotstudie

26 Link-Typen nach Duncan

27 Link-Typen des AUTHOR’S ARGUMENTATION ASSISTANT (AAA)

28 Relationen der rel - und ref -Attribute

29 Relationen des DUBLIN CORE

30 Piktogramme zur Link-Typisierung in SELF

31 Zusätzliche Piktogramme zur Link-Typisierung in SELF8

32 QBullets - Navigationssymbole

33 QBullets - Multimediale Symbole

34 QBullets - Semantische Symbole

35 QBullets - Netzwerkspezifische Symbole

36 QBullets - Vermischte Symbole

37 Funktion der Piktogramme in SPORT1

38 Vorschlag einer Link-Typologie

39 Mediale Modifizierer

40 Modifizierer des Browser-Verhaltens

41 Glossar

Prolog: Eine Bestandsaufnahme

1 Ausgangslage

Die technische Entwicklung der Informationstechnologien schreitet mit großer Geschwindigkeit voran. Während Begriffe wie INTERNET, HTML und WWW vor fünf Jahren höchstens einigen Interessierten bekannt waren, wird heute damit geworben, daß vom Enkel bis zur Oma die gesamte Familie ‚drin‘ ist - im welt- weiten Datennetz. Während gesellschaftliche und wissenschaftliche Auswirkungen dieser Änderungen noch nicht mal im Ansatz aufgearbeitet worden sind, hat auf technischer Seite bereits die zweite ‚Internet-Revolution‘ begonnen: die der Um- wandlung des heutigen darstellungsorientierten WWW in ein Netzwerk von Bedeutungen, in ein SEMANTIC WEB. Eines bleibt jedoch unverändert: Das WWW wird nach wie vor aus verknüpften elektronischen Texten bestehen - aus soge- nannten HYPERTEXTEN.

Den sich immer schneller entwickelnden Technologien muß fachwissenschaftliche Grundlagenforschung entgegen bzw. zur Seite gestellt werden. Die vorliegende Arbeit ist ein technisch orientierter Beitrag zur textlinguistischen Grundlagenforschung. Ihr Ziel ist zu zeigen, daß mit aktuellen textlinguistischen Möglichkeiten durchaus fruchtbare Untersuchungen von Hypertexten möglich sind.

1.1 Textlinguistische Motivation

Eine Frage drängt sich freilich gleich zu Beginn auf: Ist die Textlinguistik denn überhaupt für Hypertexte zuständig? Hierauf sei mit einem Bonmot aus der textlinguistischen Hypertext-Forschung geantwortet:

„Wenn sich nicht herausstellen sollte, daß HT [= Hypertext] im selben Umfang Texte sind wie Walfische Fische, dann gilt: Die Linguistik beschäftigt sich unter anderem mit Texten. HT sind Texte. Also beschäftigt sich die Linguistik mit HT.“

(Freisler 1994 S. 5)

Ob nun wirklich dort ‚Text drin ist, wo Text drauf steht‘, wird erst die genauere Betrachtung des Untersuchungsgegenstandes zeigen. Nichts scheint jedoch auf den ersten Blick näher zu liegen, als daß sich die für Texte zuständige linguistische Teildisziplin der TEXTLINGUSTIK dieser elektronischen Gebilde annimmt. Problematisch ist hierbei nur, daß die Textlinguistik noch immer um die Definition der Größe TEXT ringt. Zugegebenermaßen liegen hier die Verhältnisse deutlich unklarer als etwa bei der linguistischen Größe SATZ. Allerdings arbeiten auch Syntaktiker nicht mit einer allgemein anerkannten Festlegung letzterer Größe, sondern mit unterschiedlichen, der jeweiligen Fragestellung angepaßten, theoretisch determinierten Satzdefinitionen - und dies mit beachtlichen Erfolgen. In der vorliegenden Arbeit wird ein KOMMUNIKATIV-FUNKTIONALER TEXTBEGRIFF vor- gestellt, der sich für praktische Untersuchungen von Hypertexten eignet. Auf (durchaus existierende) theoretische Unzulänglichkeiten bzw. Gegenentwürfe wird hierbei stets hingewiesen.

Bis jetzt wurden hauptsächlich Untersuchungen zu einzelnen Aspekten der TEXTUALITÄT von Hypertexten (meist kontrastiv zu herkömmlichen Texten) durchgeführt. Im Vordergrund standen primär Probleme von KOHÄSION und KOHÄRENZ. Die vorliegende Arbeit möchte hingegen einen textlinguistischen Orientierungsrahmen für sich anschließende, breiter angelegte praktische textwissenschaftliche (siehe unten) Untersuchungen von Hypertexten liefern. Hypertexte werden hierfür in mehrere Ebenen unterteilt und auf verschiedene Aspekte hin untersucht. Ein solcher Beschreibungsapparat wird in dieser Arbeit als TAH - als TEXTLINGUISTISCHES ANALYSEMODELL FÜR HYPERTEXTE - eingeführt und exemplarisch auf dessen Anwendbarkeit hin geprüft.

1.2 Problemstellung

Als Untersuchungsgegenstand werden, wie gesagt, keine gedruckten Texte oder Diskurse der gesprochenen Sprache verwendet, sondern Hypertexte. Die Besonderheit dieser Texte ist neben ihrer elektronischen Realisierung eine tendenziell ‚nicht-lineare‘ Anordnung der Information in Teiltexte, sogenannte KNOTEN, die miteinander über Verweise, sogenannte LINKS, verbunden sind. Bei der Lektüre entscheidet der Leser in der Regel relativ frei über die Reihenfolge der zu rezipierenden Knoten. Relativ deshalb, weil der Autor mit dem Setzen von Links natürlich die Zahl der NAVIGATIONSMÖGLICHKEITEN1 während der Lektüre begrenzt: Je mehr Links innerhalb eines Knotens existieren, um so mehr mögliche LESEPFADE kann der Leser bei der Lektüre einschlagen.

Eine allgemein akzeptierte Definition des Phänomens HYPERTEXT steht noch aus, was wiederum nur verständlich ist, da Hypertexte ja selbst (jedenfalls zum größten Teil) aus der noch nicht exakt festgelegten linguistischen Größe TEXT bestehen. Ebenso wie bei der Diskussion des Textbegriffes werden für den Terminus HYPERTEXT unterschiedliche Ansätze der Sekundärliteratur kritisch vorgestellt. An dieser Stelle sollte jedoch klar sein, daß nicht auf alle offenen Fragen der HYPERTEXT -THEORIE eingegangen werden kann. Es wird sich jedoch zeigen, daß für die Struktur von Hypertexten eine relativ gut verwendbare und technisch sau- bere Arbeitsdefinition zu finden ist.1 Auch die für Teil C dieser Arbeit relevanteste Komponente des Hypertextes, der LINK, ist zwar intuitiv gut faßbar, theoretisch jedoch nicht ganz einfach festzulegen. Aber auch hier läßt sich eine Definition erarbeiten, die ausreichend für die vorliegende Untersuchung ist.

1.3 Vorgehensweise

Der Untersuchungsgegenstand HYPERTEXT wird im Hauptteil A ausführlich einge- führt, das textlinguistische Instrumentarium in Teil B erarbeitet. Als Kernstück der Arbeit wird am Ende des Hauptteils B ein TEXTLINGUISTISCHES ANALYSEMODELL FÜR HYPERTEXTE (TAH) vorgeschlagen, das im folgenden Fallbeispiel des Hauptteils C zur Untersuchung der folgenden Problematik exemplarisch verwendet wird: Jeder Link stellt den Leser eines Hypertextes vor die Entscheidung, ob er im aktuellen Knoten weiterlesen oder aber dem Link folgend zu dessen ZIEL-KNOTEN2 wechseln will. Dies kann unter Umständen zu einer kognitiven Mehrbelastung des Lesers führen und ihm die Orientierung in komplexeren Hypertexten erschweren.3 Eine Verbesserung der Situation wäre eventuell dadurch zu erreichen, daß man dem Leser, bevor dieser einen Link tatsächlich verfolgt, signalisiert, um was für eine Art von Knoten es sich beim Ziel des Links handelt; also etwa, ob dort ein Beispiel für den beschriebenen Sachverhalt des Ausgangs-Knotens zu finden ist, eine Gegen- position zu vorher Gesagtem o.ä. Auch Aussagen zum Medium des Ziel-Knotens sind denkbar, etwa ob es sich um einen textuellen Knoten oder ein Film- bzw. Tondokument handelt. Der Fachausdruck für solche Links mit Signalfunktion ist TYPISIERTER LINK. Typisierte Links werden im Rahmen des Fallbeispieles mit Hilfe von TAH untersucht: Dort wird gefragt, welche Verknüpfungsmöglichkeiten rhetorischer, semantischer und/oder logischer Natur prinzipiell zwischen Textteilen existieren und ob, bzw. wie, diese zu klassifizieren sind. Herangezogen werden hierfür linguistische und informationswissenschaftliche Typologien sowie die proprietären Typisierungsansätze der Corpus-Hypertexte.

1.4 Einschränkungen

Vorliegende Untersuchung ist, wie gesagt, eine genuin textlinguistische. Dies scheint auf den ersten Blick insofern problematisch, als daß sich seit längerem eine tendenziell interdisziplinäre Textwissenschaft1 auszubilden versucht, die neben der Linguistik auch Disziplinen wie Psychologie, Neurobiologie, Soziologie und weitere Teilbereiche integriert. Diese Herangehensweise erhält durch das sich in (bestimmten) sprachwissenschaftlichen Kreisen immer mehr durchsetzende Selbstverständnis der Linguistik als Teildisziplin einer allgemeinen Kognitions- wissenschaft2 vermehrt Rückendeckung. Auch der Untersuchungsgegenstand HYPERTEXT ist natürlich für die unterschiedlichsten Disziplinen relevant, wie die Veröffentlichungsflut aus BWL, Soziologie, Philosophie, Literaturtheorie u.ä. zu diesem Thema zeigt (siehe Kapitel 3).

Meiner Ansicht nach hängt ein interdisziplinäres Projekt bei allen möglichen Synergieeffekten jedoch stark vom Input der Einzeldisziplinen ab. Die Text- linguistik als relativ neue sprachwissenschaftliche Teildisziplin kann im Moment noch nicht die Ergebnisse liefern, die linguistische Grundlage für eine fächer- übergreifende Untersuchung von kognitiver TEXTVERARBEITUNG oder gar HYPER- TEXT -VERARBEITUNG sein könnte. Auf die Integration des deskriptiven Analyse- modells in ein umfassendes kognitives Modell wurde daher bewußt verzichtet, TAH soll als rein textlinguistischer Beitrag zur Beschreibung hypertextueller Funk- tionen und Strukturen gesehen werden.3 Insofern versucht die vorliegende Unter- suchung auch, einen (bescheidenen) Teil der noch ausstehenden ‚Hausaufgaben‘ aus dem Bereich der Textlinguistik zu erledigen. Die Ergebnisse könnten dann ihrerseits Input für empirische Untersuchungen und angewandte Forschung sein, etwa für die Implementierung einer semantisch angereicherten Hypertext-Ober- fläche (siehe Kapitel 15.1.3) unter Benutzung neuer Texttechnologien wie XLINK, XML-TOPIC-MAP und weiterer XML-DERIVATE.

1.5 Zielgruppe

Die Arbeit wendet sich explizit an ein linguistisches Fachpublikum mit gewissen interdisziplinären Neigungen sowie einem besonderen Interesse an moderner Texttechnologie. Allgemeine linguistische Fachbegriffe werden daher ohne gesonderte Vorstellung verwendet. Textlinguistische Termini werden hingegen ausführlich eingeführt und kritisch besprochen. Für das Verständnis ist eine gewisse Vertrautheit mit dem Internet sowie die Kenntnis informations- wissenschaftlicher Grundbegriffe hilfreich - aber nicht unabdingbar. Die für die Arbeit relevanten technischen Konzepte, Implementierungen und Spezifikationen werden von Grund auf eingeführt. Hierbei wird, soweit dies die Komplexität der Materie ermöglicht, ‚behutsam‘ vorgegangen - ohne jedoch übermäßig stark zu vereinfachen. Der technisch interessierte Leser wird hauptsächlich in den Fuß- noten auf Einschränkungen, Problembereiche und weiterführende Literatur aus der Informatik verwiesen. Die wichtigsten technischen Begriffe sind darüber hinaus in einem Glossar aufgeführt.

Die Arbeit dürfte durchaus auch für Informatiker interessant sein, die gewillt sind, sich mit sprachwissenschaftlichen Fragestellungen auseinanderzusetzen. In terminologischen Nöten sei auf die allgemeinen linguistischen Nachschlagewerke aus Kapitel 3.2 verwiesen.

Leser, die mit den Konzepten von Hypertext und den Implementierungen von Markup-Sprachen bereits vertraut sind, können die ausführlichen informationswissenschaftlichen Einführungen des Kapitels 15 getrost ‚querlesen‘.

2 Angaben zum Corpus

Nachdem die allgemeine Ausrichtung der Untersuchung im letzten Kapitel erläutert wurde, sollen nun die Präferenzen genannt werden, die für die Auswahl der Hypertexte des Corpus’ von Bedeutung waren.

2.1 WWW als technische Plattform

Bei der Auswahl des Corpus’ müssen gewisse Festlegungen gemacht werden, um die Vergleichbarkeit der Corpus-Hypertexte zu gewährleisten: Zuerst sollte man sich auf eine mediale Realisierung, eine technische Plattform der zu untersuchenden Hypertexte einigen. Zahlreiche Softwaresysteme stehen nämlich zur Implementierung eines Hypertextes zur Verfügung (vgl. Schnupp 1992 S. 97 f.). Als derzeit mit Abstand bedeutendste elektronische Realisierung darf das WORLD WIDE WEB (WWW) gelten.1 Alle anderen Hypertext-Systeme führen heute mehr oder weniger ein Nischendasein.2 Aus diesem Grund wird sich die Arbeit ausschließlich mit im WWW präsenten und in der Sprache HTML3 geschriebenen Hypertexten beschäftigen. Nur bei relevanten Besonderheiten anderer Systeme wird auf diese Implementierungen kurz eingegangen.

2.2 Informationstexte als primäre Textsorte

Die zweite Einschränkung betrifft die TEXTSORTEN4, die es zu untersuchen gilt. Im WWW sind verschiedene Textsorten zu finden, HYPERTEXT selbst hingegen ist nicht als eine Textsorte zu interpretieren (siehe Kapitel 10.5)! Zweifelsohne werfen die verschiedenen, hypertextuell realisierten Textsorten jeweils spezifische textlinguistische Fragestellungen auf. Zu denken ist hier auch an die unter dem Begriff HYPERFICTION bekanntgewordene, elektronisch realisierte Belletristik, die versucht, im neuen Medium einen ästhetischen Mehrwert zu erlangen.

Für die vorliegende Untersuchung werden jedoch hauptsächlich Informations- und Instruktionstexte herangezogen, die sich mit Informationstechnologien oder linguistischen Fragestellungen beschäftigen. Diese Einschränkung hat mehrere Ursachen methodischer, praktischer und persönlicher Natur: Zum einen ist die Spezialisierung auf diese Textsorte durch den beruflichen Werdegang des Autors zu erklären, der sich über mehrere Jahre hinweg mit dem Verfassen von Anlei- tungen und Lernmedien für Software sowie mit Programmierung beschäftigt hat. Schon aus diesem Grund lag es nahe, vorhandenes Expertenwissen für eine spezielle Textsorte in eine textlinguistische Untersuchung einfließen zu lassen. Andererseits wurden gerade Informations- und Instruktionstexte von Anfang an massiv als Hypertexte realisiert und machen auch heute (noch) die Mehrheit der Hypertexte im WWW aus.1 Auch lautet eine Hypothese des Autors, daß solche Textsorten tendenziell geeigneter für eine semanto-pragmatische Typisierung der Links sind, da sie vermutlich vermehrt über standardisierte inhaltliche Verknüpfungen zwischen Textteilen (bzw. Knoten) verfügen. Ein Beispiel aus dem Hypertext SELF des Corpus’ kann dies veranschaulichen:2

„Spaltenabstand (column-gap)

Anzeigebeispiel: So sieht's aus

Sie können bestimmen, wie groß der Abstand zwischen den einzelnen Spalten sein soll. Bei mehr als zwei Spalten gilt diese Angabe für alle Spaltenabstände.

Beispiel (Style-Sheet-Definition für HTML-Tag im Text): <div style="columns:3; column-gap:0.5cm">Inhalt</div>

Erläuterung:

Mit column-gap: können Sie den Spaltenabstand bestimmen. Erlaubt ist eine numerische Angabe.“

(SELF [tdci.htm] Abschnitt: Spaltenabstand (column-gap))

Die obige Erklärung gliedert sich in mehrere Teile:

- Eine Einleitung, die anreißt, um was es überhaupt geht (Sie k ö nnen
bestimmen, wie ...)
- Ein Beispiel, welches einen exemplarischen Quellcode zeigt, sowie ein
Anzeigebeispiel, welches die Auswirkungen des eben genannten Quellcodes auf dem Bildschirm illustriert. Das Anzeigebeispiel ist in einen separaten Kno- ten ausgelagert und kann per Klick auf den LINK So sieht ’ s aus aufgerufen werden.
- Eine abschließende Erläuterung mit weiterführenden Informationen.

Schon nach einem kurzen Blick auf lediglich ein Beispiel kann vermutet werden, daß Teile von Informationstexten aus der Technischen Dokumentation wiederum aus bestimmten Teiltexten bestehen, die sich einer Typisierung nicht von vorn- herein verschließen dürften. Im obigen Fall könnte man etwa die ad hoc gebildeten LINK-Etiketten Visualisierung (im obigen Beispiel: So sieht ’ s aus) oder Zusatzinfo (im obigen Beispiel: numerische Angabe) einführen. Ob diese ersten Vermutungen Bestand haben, wird sich jedoch erst nach umfangreicheren theoretischen und praktischen Untersuchungen feststellen lassen.

2.3 Die Texte des Corpus’

Wichtigster Hypertext des Corpus’ ist zweifelsohne der Titel SelfHTML. Die Energie des Verstehens: HTML-Dateien selbst erstellen von Stefan Münz, der unter dem Kürzel SELF verwendet wird. Besonders geeignet ist dieser Text auch aufgrund seiner hohen Link-Dichte im Fließtext. SELF wurde im Jahr 1998 unter der Adresse http://www.teamone.de/selfhtml/ online gestellt. Kurz vor Abgabe der vorliegenden Untersuchung ist jedoch eine Neuauflage unter der Adresse http://selfhtml.teamone.de/ ins WWW gestellt worden. Die alte Adresse ist nun nicht mehr gültig. Durch die Neuauflage bot sich die Chance, die beiden Versionen vergleichend zu untersuchen. Dies ist besonders interessant, da sich die in SELF benutzten typisierten LINKS zum Teil geändert haben. Aus diesen Gründen ist so- wohl die alte als auch die neue Auflage in das Corpus aufgenommen. Die Neu- auflage wird im Rahmen der vorliegenden Arbeit mit SELF8 abgekürzt, da diese mit der Versionsnummer 8.0 versehen wurde. Die alte Version befindet sich seit kurzem wieder auf dem neuen Server des SelfHTML-Teams, und zwar im Archiv unter http://selfaktuell.teamone.de/archiv/doku/7.0/. So bleibt die Überprüfbarkeit der Analyse der alten Version gewährleistet.

Ein weiterer Text kommt aus der wissenschaftlichen Fachkommunikation: Das Grammatik-Informationssystem GRAMMIS, welches unter diesem Kürzel verwendet wird. GRAMMIS ist insofern interessant, als daß dieses Projekt in zweifacher Weise TYPISIERTE LINKS verwendet: Zum einen sind die LINKS durch farbige Markierungen bestimmten Bereichen zugeordnet. Zum anderen wird diese Zuordnung zum Teil durch MOUSE-OVER-TEXTE1 unterstützt.

Ein Hypertext, der thematisch aus dem Rahmen fällt, ist das Sportportal der Sport 1 GmbH, das unter dem Kürzel SPORT1 verwendet wird. Dieser Hypertext lohnt aufgrund seiner zahlreichen PIKTOGRAMME1, die für die unterschiedlichen LINK-Typen verwendet werden, einer genaueren Betrachtung. Außerdem stellt SPORT1 eine im WWW im häufiger anzutreffende Sorte von Hypertexten dar, die durch eine geschickte Verquickung von Informations- und Werbetexten gekennzeichnet ist. Hier können zum Teil sehr interessante Unterschiede bzgl. Funktion und Struktur einzelner Knoten im Vergleich zu den restlichen, rein informativen Hypertexten des Corpus’ herausgearbeitet werden.

Ebenfalls als Primärtext dient die Informationsseite des W3C. Der besondere Reiz dieses Hypertextes resultiert nicht nur aus der Tatsache, daß das W3C die Standards im Internet festlegt und verwaltet - und damit als die maßgebende Informationsseite zur Internet-Technologie gesehen werden muß -, sondern auch aus der Herausforderung für die W3C-Verantwortlichen, im Rahmen der sich schnell ändernden Technologien, unterschiedliche Versionen von technischen Spezifikationen - und damit von Hypertext-Knoten - zu verwalten und, im Idealfall, diese zeitlichen Relationen dem Leser auch zu visualisieren.

Folgende Tabelle stellt die Corpus-Hypertexte nochmals übersichtlich zusammen:

Abbildung in dieser Leseprobe nicht enthalten

Tabelle 1: Hypertexte des Corpus’

3 Angaben zur Literaturlage

Im folgenden wird ein kurzer Überblick über die Literaturlage in den Bereichen HYPERTEXT und TEXTLINGUISTIK gegeben.

3.1 Literatur zu Hypertext

Die Arbeiten zum Thema HYPERTEXT sind zahlenmäßig kaum noch zu bewältigen, daher beschränkt sich die Vorstellung auf einige ‚Meilensteine‘ aus unterschiedlichen Disziplinen.

Historische Primärtexte, durch deren Lektüre sich die Entwicklung des Hypertext- Gedankens nacherleben läßt, sind Bush 1945, Engelbart 1963, Engelbart u. Eng- lish 1968, Nelson 1974, ACM Hypertext 1987 und 1989 sowie Berners-Lee 1989. Auf die Bedeutung dieser Texte wird in Kapitel 4 genauer eingegangen. Einen Überblick über die Forschung bis 1990 gibt die kommentierte Bibliographie in Atkinson u. Knee 1990. Die historische Entwicklung beschreiben Berk u. Devlin 1991. Einen geschichtlichen Abriß, der das WWW einschließt, gibt Lennon (Lennon 1997).

Grob kann folgende Gliederung der vorhandenen Literatur vorgeschlagen werden:

(1) Die meisten Untersuchungen zum Thema stammen aus dem Gebiet der Informatik. Als deutschsprachiges Standardwerk gilt Kuhlen 1991. Kuhlen be- schäftigt sich neben Fragestellungen der Informationswissenschaften auch am Rande mit textlinguistischen Problemen wie der KOHÄRENZ von Teiltexten. Schnupp 1992 befaßt sich dagegen besonders ausführlich mit der technischen Implementierung von Hypertexten. In weiteren Titeln der Informatik geht es haupt- sächlich um die Verbindung der Hypertext-Idee mit Konzepten der KÜNSTLICHEN INTELLIGENZ, der WISSENSREPRÄSENTATION sowie des INFORMATION RETRIEVAL.1
(2) Ferner existieren zahlreiche Arbeiten aus der Psychologie, die kognitions- wissenschaftliche und pädagogische Fragen an die neue Technologie stellen. Hierbei soll hauptsächlich ein möglicher Mehrwert hypertextueller Lernmedien kritisch untersucht werden. Ansel Suter dokumentiert den Versuch, Kenntnisse der englischen Sprachwissenschaft mittels eines Hypertextes zu vermitteln (Ansel Suter 1995). Heike Gerdes faßt den Forschungsstand psychologisch-päda- gogischer Disziplinen zusammen, zitiert die Ergebnisse der wichtigsten Fallstudien und kommt aufgrund eigener Experimente zu einer kritischen Einschätzung des sogenannten KOGNITIVEN MEHRWERTS von Hypertexten (Gerdes 1997). Mit allgemeinen, erziehungswissenschaftlich relevanten Fragen des Informationspro- blems in elektronischen Datennetzen aller Art beschäftigt sich Astleitner (Astleitner 1997).1 Eine weitere psychologische Untersuchung ist Unz 2000, die mit empirischen Methoden Hypertexte und gedruckte Texte kontrastiv bzgl. Informationssuche und Navigation untersucht. Die aktuellste Studie zum Thema dürfte Bromme 2002 sein, die allerdings vor Redaktionsschluß nicht mehr gesichtet werden konnte.
(3) Auch die Literatur- und Texttheorie hat sich des Themas mit Begierde angenommen. Offen ist hierbei vor allem das veränderte Verhältnis Autor-Leser, da jeder Benutzer eines Hypertextes einen eigenen Lesepfad durch das Werk wählen kann. HYPERTEXT wird hier als neue Kulturtechnik verstanden und als sol- che analysiert. Bolter untersucht die Auswirkungen des Computers als „writing space“ und geht dabei besonders auf die nicht-lineare Repräsentationsform von Wissen in Hypermedien ein (Bolter 1991). Landow untersucht den Bezug zwischen hypertextuellen Schreibarten und der Kritischen Theorie (Landow 1992 u. 1994), während Gaggi 1997 eine Dezentralisierung des Subjekts durch die - bzw. innerhalb der - neuen Medien sieht und gleichzeitig Nelsons’ Vision eines „alle Texte umfassenden Hypertextes“ neu belebt.2 Eine poststrukturalistische Herangehensweise an den ‚Hypertext-Raum‘ verfolgt Wenz 2001a. Wenz 2001 hingegen unternimmt eine erste Pilotuntersuchung zur unterschiedlichen Akzeptanz von gedrucktem Text, textuellem Hypertext sowie multimedialem Hypertext.
(4) Technische Artikel zu sogenannten MARKUP-SPRACHEN wie HTML und XML, mit denen Hypertexte implementiert werden können, finden sich in großer Anzahl im Internet. Die maßgeblichen Spezifikationen stehen hierbei auf den Seiten des Internet Konsortiums W3C (http://www.w3c.org). Dort sind auch die programmatischen Artikel zum sogenannten SEMANTIC WEB - eine Art semantische Tiefenstruktur für das heutige World Wide Web - zu finden.
(5) So gut wie alle Abhandlungen über Hypertexte gehen in unterschiedlicher Intensität auch auf das Problem der typisierten Links ein. Die These ist meistens, daß typisierte Links einen Mehrwert brächten, ein passendes allgemeines Vokabularium zur Typisierung aber noch nicht existiert.

3.2 Literatur zur Textlinguistik

Als allgemeine linguistische Nachschlagewerke dienen Bußmann 1990 und Glück 2000. Eine erste Annäherung sowie einen Einblick in die Geschichte der Textlinguistik bringt der Sammelband Textlinguistik (Dressler 1978). Grundlegende textlinguistische Gesamtdarstellung für diese Arbeit ist Brinker 2001. Neben weiteren spezifischen Darstellungen zur TEXTUALITÄT (de Beaugrande u. Dressler 1981), REFERENZSTRUKTUREN (Vater 1994) und THEMENENTFALTUNG (van Dijk 1980 a u. b) sind am Rande auch Spezialuntersuchungen interessant, die das Vorkommen von Texten in technischen Distributionen untersuchen (Ott 1996 und Labarta Postigo 1997).

3.3 Literatur zu Textlinguistik und Hypertext

Die textlinguistische Beschäftigung mit Hypertexten ist vergleichsweise jung. Die Zahl der einschlägigen Literatur ist noch überschaubar, steigt seit den letzten Jahren aber sprunghaft an. Die Beiträge sind oftmals texttheoretischer Natur. Sie arbeiten allgemeine Unterschiede und Ähnlichkeiten von traditionellen Texten und Hypertexten heraus und lassen sich unter die oben genannten Arbeiten zur Literaturtheorie subsumieren. Andere Untersuchungen greifen die erarbeiteten Unterschiede auf und machen sie zur Grundlage für Konversionen zwischen Texten und Hypertexten. Besonders wird hierbei auf Aspekte der Kohärenzplanung eingegangen (Campel 1995, Lobin 1999 und Storrer 1999).

Mit den Besonderheiten von Sprache im Internet sowie den Eigenschaften schriftlicher Texte in multimedialen Kontexten beschäftigt sich Schmitz (Schmitz 1995, 1996 u. 1997). Angelika Storrer hat eine rege Publikationstätigkeit zur hypertext-spezifischen Textlinguistik entwickelt (Storrer1999, 2000, 2001a, 2001b und 2001c; Ferner befindet sich ihre Habilitationsschrift zum selben Thema derzeit in Druck.). Interessante Sammelbände sind außerdem Weingarten 1997a, Runkehl u.a. 1998, Holly u. Biere 1998 und besonders Lobin 1999a. Darüber hin- aus befaßt sich Nummer 63 der Zeitschrift Osnabr ü cker Beitr ä ge zur Sprachtheorie (Obst) mit der Thematik Hypermedien und Wissenskonstruktion und versammelt hierfür einige interessante Aufsätze - z.B. Rapp u. Zumbach 2001.

Teil A: Hypertext als Untersuchungsgegenstand

Teil A führt ausführlich in den Untersuchungsgegenstand HYPERTEXT ein.

Hierbei werden zuerst historische Entwicklungslinien und mediale Realisierungen gezeigt. Besonderes Augenmerk gilt hierbei der Geschichte des WWW, als dem für heutige Hypertexte wichtigsten Mediums (Kapitel 4).

Anschließend erfolgt in Kapitel 5 eine differenzierte Betrachtung und Klassi- fizierung ‚hypertext-verdächtiger‘ Phänomene im WWW. Bei einer kontrastiven Betrachtung von traditionellen Texten und Hypertexten wird sich herausstellen, daß nicht jeder elektronische Text im WWW unbedingt ein Hypertext ist - auch wenn häufig vom WWW als dem gr öß ten Hypertext der Welt gesprochen wird.

Im letzten großen Abschnitt von Teil A, Kapitel 6, werden dann die einzelnen Komponenten von Hypertexten vorgestellt. Fokus liegt hierbei auf der Definition aktueller WWW-Hypertexte, die sich zum Teil deutlich von Vertretern anderer Hypertext-Systeme unterscheiden. Wichtig ist in diesem Zusammenhang auch die Beschreibung der zur Betrachtung von WWW-Hypertexten nötigen Software, dem sogenannten BROWSER.

Abschließend folgt nochmals eine kurze Zusammenfassung der wichtigsten Designprinzipien, Eigenschaften und medialen Bedingungen heutiger Hypertexte im WWW, bevor zur Einführung der für Hypertexte relevanten textlinguistischen Begriffe und Methoden in Teil B übergeleitet wird.

4 Hypertext: Ein historischer Abriß

Dieses Kapitel zeichnet die Geschichte des Hypertextes von den ersten theoretischen Konstrukten bis hin zum Durchbruch im Rahmen des World Wide Web und des Internet nach.

4.1 Die Pioniere: Bush, Nelson und Engelbart

Nach allgemeiner Meinung begründete Vannevar Bush mit seinem 1945 veröffentlichten Artikel As we may think (Bush 1945)1 seine Position als „ Vater des Hypertext-Konzepts “(Gerdes 1997 S. 1 [Auszeichnung im Original]). Bush entwirft hier ein futuristisches System namens Memex, mit dem Information in der Form gespeichert werden kann, wie es heute auch für Hypertexte üblich ist:

„Consider a future device for individual use, which is a sort of mechanized private file and library. It needs a name, and, to coin one at random, "memex" will do. A memex is a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility. It is an enlarged intimate supplement to his memory. [...]

Thereafter, at any time, when one of these items is in view, the other can be instantly recalled merely by tapping a button below the corresponding code space. Moreover, when numerous items have been thus joined together to form a trail, they can be reviewed in turn, rapidly or slowly, by deflecting a lever like that used for turning the pages of a book. It is exactly as though the physical items had been gathered together from widely separated sources and bound together to form a new book. It is more than this, for any item can be joined into numerous trails.“

(Bush 1945 S. 107f.)

Die Idee der Memex ist also, daß atomare Informationseinheiten separat gespeichert werden. Da diese zumeist für mehrere Kontexte relevant sind, können sie stets in neuen Kombinationen zusammengefügt werden. Den dadurch entstehenden Lesepfad bezeichnet Bush als „new book“.

Der Begriff Hypertext als solcher ist auf eine Prägung von Theodor Nelson aus dem Jahr 1965 zurückzuführen.2 In dem Artikel Professor Nelson Talk Analyzes P.R.I.D.E. der Zeitung Vassar College Miscellany News vom 3. Februar 1965, wird der Vorschlag für ein neues Informationssystem beschrieben:

„[...] he [Nelson] reminded the audience of the problems of organizing material into a coherent piece of writing. As a new organization method Mr. Nelson has invented the PRIDE (Personalized Retrieval Indexing and Documentary Evolution) system.“

(Wedeles 1965)

Nelson wies auf mögliche Probleme hin, die sich bei der Linearisierung von Informationsmaterial zu einem einzigen „coherent piece of writing“ ergeben. Sein System P.R.I.D.E versucht, diese Probleme zu lösen:

„ In this system passages of material would be translated into machine language and filed in the machine in any sequence. With the proper instructions the machine would print out any sequence the writer wished to try, freeing him from the necessity of keeping the ideas in his head.“

(Wedeles 1965)

Nelson glaubte, diese Form der Informationsrepräsentation entspräche eher der menschlichen Form des Denkens als die der rein linearen Variante. In diesem Zusammenhang prägte er das Wort hyper-text:

„Mr. Nelson pointed out that we often do not think in linear sequences but rather in ‘swirls’ and in footnotes. He introduced the concept of the hyper-text, which would be a more flexible, more generalized, non-linear presentation of material on a particular subject.“

(Wedeles 1965)

Der Schöpfer des Wortes hyper-text nahm also an, menschliches Denken verlaufe nicht in linearen Sequenzen, sondern sei vielmehr mit „swirls“ oder „footnotes“ zu vergleichen. Hypertext ist für Nelson eine nicht-lineare, verallgemeinerte und flexiblere Weise, Wissen über ein bestimmtes Thema zu repräsentieren.

Als zukünftiges Einsatzgebiet von Hypertexten gibt Nelson folgendes an:

„For example, it is possible that basic texts on a subject could be interindexed, so that the necessity and difficulty of tracing footnotes and rare sources would be eliminated.“

(Wedeles 1965)

Zusammenfassend kann also festgehalten werden, daß HYPERTEXT im Sinne des Wortschöpfers eine nicht-lineare Form der Wissensrepräsentation zu einem bestimmten Thema ist. Aufgrund dieser nicht-linearen Form (und mittels geeig- neter Implementierung) kann je nach Bedarf eine bestimmte Sequenz des gespeicherten Informationsmaterials abgerufen werden. Eine wichtige Beobachtung ist, daß die Linearisierung der Information erst im Moment des Le- sens vollzogen wird: Aus einer bestimmten Menge von Informationseinheiten wird also eine Teilmenge (die eventuell auch identisch mit der ursprünglichen Menge sein kann) mittels Verweisen verbunden. Dadurch entwickelt der Leser den Text zum Teil selbst. Wortwahl, Aufteilung der Gesamtinformation in kleinere Einheiten, sowie das Setzen der Verweise bleibt Aufgabe des Autors. Das Aneinanderfügen dieser Informationspakete erfolgt dann durch einen, im Wortsinn kreativen Akt des Lesens. Verschiedenes Kombinieren der Informationseinheiten führt somit für den Leser zu unterschiedlichen Texten. Diese Lesepfade bleiben aber freilich immer eine Teilmenge des vom Autor zusammengestellten Gesamtfundus’. Insofern wird auch beim Hypertext das Konzept Autor nicht aufgegeben!

Auch die heutige (de facto vorhandene) Beschränkung von Hypertexten auf das elektronische Medium wird bereits in dieser ersten Definition vorweggenommen.1

Auffällig ist ferner, daß sich diese erste Definition nicht zwangsläufig auf eine textuelle Form von Information beruft, sondern vielmehr von „material“ aller Art spricht. Hier kommt eine frühe multimediale Auffassung von HYPERTEXT zum Ausdruck:

„Programs can include words, pictures, printing, or strings of words.“

(Wedeles 1965)

Dies nimmt in gewisser Hinsicht den sich heute vollziehenden Wandel von HYPERTEXT zu HYPERMEDIA voraus.

Nelson politisierte später mit der Arbeit Dream Machines: new freedoms through computer screens - A minority Report (Nelson 1974) die Hypertext-Idee:

„Nelson vertrat (und vertritt) die Auffassung, daß alle Informationsquellen in einer demokratischen Informationsgesellschaft frei zugänglich sein sollten. Er meinte, daß ein freier Zugang dann am besten gesichert sei, wenn alle Dokumente in einer Art gigantischem Hypertext miteinander verknüpft seien.“

(Hasebrook 1995 S. 169)

Die erste elektronische Realisierung des Hypertext-Konzeptes gelang Douglas C. Engelbart, deren Grundlagen er in seinen Publikationen beschreibt (Engelbart 1963, Engelbart u. English 1968). Allerdings wurden diese Implementierungen fast ausschließlich von Spezialisten benutzt.

4.2 Der Durchbruch: Berners-Lee und das WWW

Der Hypertext-Idee zum Durchbruch verholfen hat erst Tim Berners-Lee mit der Erfindung des WORLD WIDE WEB (WWW). Berners-Lee begann 1980 seine Arbeit am wissenschaftlichen Zentrum CERN in Genf. Hier schrieb er für den Eigenbedarf sein erstes Programm zur Informationsspeicherung unter Verwendung von assoziativen Verweisen. Er nannte die Software Enquire, unter Bezugnahme auf einen "verstaubten Ratgeber aus viktorianischer Zeit" mit dem Titel "Enquire Within upon Everything". Dieses Buch bildete so etwas wie "das Tor zu einer Welt der Information, in der von der Fleckenentfernung bis zur Geld- anlage alle möglichen Fragen beantwortet wurden." (Berners-Lee 1999a S. 11) Die Software selbst wurde niemals veröffentlicht, bildet aber so etwas wie die konzeptionelle Grundlage für die Entwicklung des World Wide Web.

1989 schlug er ein globales Hypertext-Projekt vor (Berners-Lee 1989). Das Wis- sen der Leute sollte mittels eines Netzes aus Hypertext-Dokumenten kombiniert werden. Aufgrund der Systemunabhängigkeit entschied sich Berners-Lee für die INTERNETPROTOKOLLE TCP/IP (siehe unten) als technische Grundlage für den Austausch von Hypertext-Dokumenten. Auf dieser TCP/IP-Basis entwickelte er 1990 das HYPERTEXT TRANSFER PROTOCOL (HTTP). Auch schrieb er den ersten WWW-Server1, httpd, und den ersten BROWSER2, WorldWideWeb, den er später in Nexus umbenannte.3 Die Webtechnologie machte er am CERN und im Sommer 1991 im Internet verfügbar.4 Das WWW verhalf dem Internet sowie der Hypertext- Idee auf breiter Front zum Durchbruch, da es intuitiv und ohne Expertenwissen zu benutzen war. In der Presse wird heute oftmals das Internet mit dem WWW- Hypertext gleichgesetzt. Dies ist jedoch nicht korrekt, was ein kurzer Blick auf die Geschichte des Internet zeigen soll:

"The Web is an abstract (imaginary) space of information. On the Net, you find computers -- on the Web, you find document, sounds, videos, information. On the Net, the connections are cables between computers; on the Web, connections are hypertext links. The Web exists because of programs which communicate between computers on the Net. The Web could not be without the Net. The Web made the Net useful because people are really interested in information (not to mention knowledge and wisdom!) and don't really want to have know about computers and cables [...]"

(Berners-Lee FAQ Abschnitt General Questions, 1998)

Das Internet selbst ist deutlich älter als das WWW.1 Seine Ursprünge hat es im militärischen Bereich: Im amerikanischen Verteidigungsministerium dachte man in den 60‘er Jahren verstärkt über Möglichkeiten nach, wie militärische Daten selbst vor atomaren Angriffen zu sichern seien. Möglich war dies nur durch ein Daten- netz, bei dem die Daten auf mehreren, weit voneinander entfernten Rechnern lagerten. Wurden Daten modifiziert, sollten diese vom veränderten Rechner an alle angeschlossenen Rechner weitergegeben werden. Ein wichtiger Punkt hierbei war, daß jeder Rechner über mehrere Wege mit allen anderen kommunizieren konnte. Im Notfall konnten so Ausfälle von einzelnen Maschinen oder Verbindungskabeln durch Umleitungen überbrückt werden. Die ersten Rechner wurden 1969 im sogenannten ARPA-NET (ADVANCED RESEARCH PROJECTS AGENCY)2 zusammengeschlossen.

In einem zweiten Schritt erhielten Forschungseinrichtungen der USA Zugang zum ARPA-NET. Für die Wissenschaftler stand nun weniger das Synchronisieren von Daten als vielmehr die schnelle Kommunikation mit Kollegen sowie der unkomplizierte Datenaustausch im Vordergrund. Vor dem Hintergrund der heterogenen EDV-Architekturen der Institute entstand die Notwendigkeit der Ent- wicklung eines gemeinsamen ÜBERTRAGUNSPROTOKOLLS für Daten: diese Rolle übernahm das TRANSMISSION CONTROL PROTOCOL (TCP) in Zusammenarbeit mit dem INTERNET PROTOCOL (IP). Die Kombination TCP/IP ist noch heute das ‚Rück- rat‘ des gesamten Datenverkehrs im Internet. Erst durch dieses Protokoll wurden die getrennten heterogenen Universitäts- und Institutsnetze zu einem ‚Netz der Netze‘.

TCP/IP arbeitet wie folgt: Wenn heutzutage mittels eines Browsers eine HTML- Datei3 im WWW aufgerufen wird, wird diese Datei bei der Übertragung via Internet in kleine Pakete zerstückelt. An jedes Paket ‚heftet‘ das IP einen Adreßaufkleber, auf dem der Empfänger des Datenpakets steht1, also der Computer, auf dem der Browser läuft, mit welchem die fragliche Datei angefordert wurde. Als zusätzliche Information gibt IP an, um das wievielte Paket innerhalb der jeweiligen Sendung es sich handelt. Den korrekten Eingang der Datenpakte beim Empfänger erledigt TCP. Sind alle Pakete eingetroffen, beginnt der Browser mit der Darstellung der Datei.

TCP/IP ist wie gesagt ein universelles Protokoll und wäre prinzipiell zur weltweiten Datenübertragung ausreichend. Die Kommunikation wurde jedoch bald in dem Maß durch die Komplexität der Bedienung erschwert, als daß immer mehr Men- schen Daten austauschen wollten, die selbst keine Experten der Informationstechnologie waren. Aus diesem Grund wurden ‚höhere‘ PROTOKOLLE entwickelt, die sich TCP/IP bedienten aber wesentlich einfacher zu benutzen wa- ren. Beispiele hierfür sind FTP, TELNET und EMAIL. Dem Internet zum eigentlichen Durchbruch verholfen hat jedoch, wie oben bereits angesprochen, das HYPERTEXT TRANSFER PROTOCOL (HTTP) von Berners-Lee.2 HTTP ist das INTERNET- PROTOKOLL zur Übermittlung von Hypertext-Dateien, die mittels der Sprache HTML kodiert sind. Dieses Zusammenspiel von HTTP und HTML wird als WWW bezeichnet - eine Anwendung also, die sich der technischen Infrastruktur des eigentlichen Internet bedient. Das WWW hat sich - neben Email - zur populärsten Anwendung des Internet entwickelt.

Um den Ausführungen der Untersuchung folgen zu können, ist eine tiefere Einsicht in das Zusammenspiel der oben eingeführten geschichteten Protokolle nicht notwendig. Vielmehr sollte in diesem Kapitel nur kurz der technische Hintergrund angedeutet werden, der zum Austausch von HTML-Seiten notwendig ist. Philosophie, Struktur und Anwendung von HTML selbst sind jedoch zum großen Teil Gegenstand dieser Arbeit und werden in Kapitel 15 besprochen.1

5 Text, E-Text, Hypertext und Hypertext-Netz

Im letzten Kapitel wurden die historischen Voraussetzungen geschildert, die letztendlich zu den WWW-Hypertexten unserer Tage geführt haben. Im vorliegenden Kapitel sowie dem nächsten geht es darum, diese heutigen Hypertexte genauer zu bestimmen. Zunächst soll eine extensionale Festlegung der elektronischen Gebilde im WWW geschehen, bevor im nächsten Kapitel dann eine mehr intensionale Definition der WWW-Hypertexte versucht wird.

5.1 Abgrenzung Text vs. Teiltext, Hypertext vs. Knoten

Bei gedruckten belletristischen Werken oder Fachbüchern fällt es noch verhältnismäßig leicht, die Dimension eines Textes aufgrund klarer Begrenzungen festzustellen: Der Roman 1984 von George Orwell ist als TEXT aufzufassen.2 Er verfügt über eine einheitliche TEXTFUNKTION sowie durchgängige KOHÄRENZ.3 Schwieriger hingegen ist die Situation beim Betrachten einer Tageszeitung. Ähnlich wie bei einem gedruckten Roman sendet auch die Beschaffenheit einer Zeitung als physische Entität klare Begrenzungssignale aus. Allerdings bereitet es Schwierigkeiten, eine einheitliche Textfunktion einer Tageszeitung zu erkennen. Zwar kann man in der Regel bei seriösen Zeitungen von einer Überzahl INFORMATIVER Texte ausgehen, die jedoch flankiert werden von Texten mit APPELLFUNKTION (Kommentar, Werbung) und KONTAKTFUNKTION (Öffentliche Glückwünsche, Beileidsbekundungen). Zwischen den einzelnen textuellen Phänomenen bestehen in der Regel relativ selten Kohärenzbeziehungen: Die Großzahl der Nachrichten steht isoliert im Gesamtkontext der Zeitung. Lediglich die entscheidenden Themen der Ausgabe werden durch mehrere Nachrichten und Kommentare abgedeckt, die miteinander durch Referenzen, wie etwa siehe auch etc., verbunden sind.

Die Teiltexte einer Zeitung verfügen mit einer eigenständigen Textfunktion über das wichtigste TEXTUALITÄTSKRITERIUM, ich fasse sie daher als vollwertige, eigenständige Texte auf, die lediglich zum Teil lose - via Referenzen - in den Gesamtkontext einer medialen Realisierung namens Zeitung eingebettet sind.

Wie verhält es sich nun mit Hypertexten? Sind die Knoten hier, vergleichbar mit den Teiltexten einer Zeitung, ebenfalls als eigenständige Texte zu sehen? Eventuell ist es hilfreich, zur Beantwortung dieser Frage zuerst das Medium zu betrachten, in dem die Hypertexte des Corpus’ realisiert sind: das WWW. Es ist davon auszugehen, daß so gut wie alle Hypertexte (und auch die einzelnen Knoten von Hypertexten) durch hinreichend geduldige Navigation von einem beliebigen Startpunkt im WWW aus untereinander erreichbar sind.1 Handelt es sich daher beim WWW um einen einzigen Text?

Ein Argument für diese Vermutung ist zwar die weltweite Vernetzung einzelner WWW-Hypertexte mittels Links, die als explizite KOHÄSIVE MITTEL gelten dürfen. Allerdings mußte festgestellt werden, daß eine gemeinsame Kohärenz, eine gemeinsame KOMMUNIKATIVE FUNKTION sowie ein einheitliches THEMA für das WWW als Ganzes nicht festzustellen sind. Da aber strukturelle Aspekte wie Kohä- sion nie alleinstehend relevant sind, sondern lediglich das Fundament für funktional-kommunikative Aspekte des Textes darstellen, sind Phänomene wie Kohärenz oder Textfunktion als wichtigere Kriterien für die Texthaftigkeit eines Gebildes anzusehen. Hinsichtlich dieser funktional-kommunikativen Kriterien ist das WWW, wie erwähnt, in seiner Gesamtheit aber kein singulärer Text.

Verläßt man nun die Makro-Perspektive des WWW und zieht die MikroPerspektive eines einzelnen Knotens - etwa des Textes SELF - heran, so läßt sich wie folgt argumentieren: Jedem Knoten von SELF kann durchaus ein eigenes Textthema sowie einen Textfunktion zugestanden werden. Diese sind jedoch nur Teilthemen und Teiltextfunktionen von SELF selbst. Dies unterscheidet einen Hypertext wie SELF von Tageszeitungen, macht ihn jedoch vergleichbar mit gedruckten technischen Dokumentationen.

5.2 Abgrenzung E-Text, Hypertext und Hypertext-Netz

Im letzten Abschnitt wurde festgestellt, daß das WWW nach kommunikativ- funktionalen Kriterien beurteilt keinen singulären Text darstellt. Die einzelnen Hypertexte im WWW können, nach erster Betrachtung, wohl als Texte aufgefaßt werden, die sich aus Teiltexten - den Knoten - zusammensetzen. Eine nahe- liegende Frage ist nun, ob denn sämtliche im WWW auftretenden Texte auch automatisch Hypertexte sind.

Zur Beantwortung dieser Frage muß eine Grobgliederung der im WWW vertretenen Phänomene erstellt werden. Laut Storrer 1999 läßt sich das WWW als HYPERTEXT -NETZ interpretieren, in dem sowohl Hypertexte als auch sogenannte E- TEXTE 1 zu finden sind:

„Ein Hypertextnetz verknüpft mehrere Hypertexte und E-Texte sowie Paratexte zu Hypertexten und E-Texten durch Links. Das WWW kann in diesem Sinne als weltumspannendes Hypertextnetz angesehen werden, das [aus] einer wachsenden Anzahl von Teilnetzen besteht, deren Aufbau und Inhalte sich in steter Veränderung befinden und in ihrer Gesamtheit von niemandem mehr überblickt werden.“2

(Storrer 1999 S. 38)

Die beiden möglichen Komponenten von Hypertext-Netzen, Hypertexte und E- Texte, unterscheidet die Autorin wie folgt:

„Ein Hypertext ist ein von einem Hypertextsystem verwalteter nicht-linear organisierter Text mit einer erkennbaren Textfunktion und einer thematischen Gesamtvorstellung, die als über- geordnete Einordnungsinstanz fungiert. [...] Ein Hypertext kann für sich allein stehen und z.B. auf CD-ROM publiziert sein; typischerweise wird er jedoch als Teilnetz in ein größeres Hypertextnetz eingebunden. Hypertexte sind typischerweise keine abgeschlossenen Texte; sie haben ‚offene Enden‘ [...]

Als E-Texte bezeichne ich Texte, die als linear organisierte Texte in ein Hypertextnetz ein- gebunden sind. [...] E-Texte müssen auf nachvollziehbare Art und Weise in das über- greifende Hypertextnetz eingebunden werden, ansonsten ergeben sich im Hinblick auf die Kohärenzbildung jedoch keine wesentlichen Unterschiede gegenüber dem linear organisierten Printtext.“

(Storrer 1999 S. 38 f.)

Wer textuelle Gebilde für das WWW verfaßt, erstellt damit also nicht automatisch Hypertexte sondern eventuell traditionelle, lineare, lediglich elektronisch realisierte Texte - E-Texte eben. Vor- und Nachteile solcher E-Texte gaben und geben Stoff für zahlreiche Untersuchungen3, die vorliegende Arbeit beschäftigt sich jedoch ausschließlich mit Hypertexten - der obigen Definition folgend. Die Komponenten solcher Hypertexte wurden bereits oben kurz angesprochen und werden nun im folgenden Kapitel 6 ausführlich eingeführt.1

6 Komponenten eines Hypertextes

Nachdem zuletzt die Extension des Untersuchungsgegenstandes konkretisiert wurde, geht es in diesem Kapitel nun um die einzelnen Komponenten - also um die intensionale Bedeutung - von Hypertexten.

6.1 Allgemein

Manche Komponenten eines Hypertextes sind mit den Bestandteilen traditioneller Texte zu vergleichen oder gar mit diesen identisch. So stellen die sogenannten KNOTEN den eigentlichen ‚Textkörper‘ zur Verfügung. Ferner haben viele Hypertexte Orientierungsmittel, die auch in normalen Texten vorkommen. Hierbei ist etwa an Inhaltsverzeichnisse oder Indices zu denken. Andere Komponenten hingegen - elektronisch direkt ausführbare Verweise, sogenannte LINKS, und bestimmte NAVIGATIONSKOMPONENTEN - finden sich nicht in Printmedien und können daher als hypertext-spezifisch angesehen werden.

6.2 Komponente I: Knoten

Die Information eines Hypertextes ist in viele disjunkte Einheiten aufgeteilt. Diese Knoten als „grundlegende, atomare Informationseinheiten“2 (vgl. Gerdes 1997 S. 12f. u. Kuhlen 1991 S. 79f.) sollen im folgenden hinsichtlich Größe, Inhalt, Kohärenz3, Funktionalität sowie weiterer Eigenschaften näher charakterisiert wer- den.

6.2.1 Struktur

Der Knoten Buchvorstellung der untenstehenden Abbildung läßt sich in drei Komponenten einteilen: KNOTEN-NAME, KNOTEN-INHALT und LINKS.1

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Knotenstruktur

In der Regel verfügt jeder Knoten über eine eindeutige Etikettierung. Durch diesen Knoten-Namen ist der Knoten im Netzwerk identifizierbar und kann indexiert wer- den2.

Informative Einheiten stellen die Inhalte des Knotens. Die Einheiten können dabei prinzipiell multimedial sein. Im obigen Beispiel ist der Knoten lediglich mit Fließtext und Links (siehe unten) gefüllt.

Durch solche direkt durch Mausklick ausführbare Links kann der Leser vom aktuellen Knoten zu einem anderen navigieren: In obiger Abbildung stellen die markierten Wörter Etymologie und Seebold sogenannte LINK-ANKER - bzw. LINKTEXTE bei rein textueller Realisierung - dar, die auf Knoten (oder Teile von Knoten) verweisen, welche in irgendeiner Form ‚mehr Information‘ zu den besagten Begriffen bereithalten.

6.2.2 Inhalt und Größe

Lassen sich die formalen Aspekte eines Knotens noch relativ eindeutig festlegen, so sind Fragen nach dessen Inhalt und Größe schwerer zu beantworten. Der Inhalt eines Knotens läßt sich laut Kuhlen „weder in intensionaler noch in extensionaler Sicht [...] exakt definieren“ (Kuhlen 1991 S. 79). Nach Bolter sind es „topics“, die mittels entsprechender „connections“ miteinander verbunden sind. Inhalt dieser „topics“ können entweder „paragraphs, sentences, individual words, or indeed digitized graphics“ sein (Bolter 1991 S. 24).

Hierbei stellt sich freilich die Frage nach der richtigen Fragmentierung des Textes durch den Autor, also die Frage nach dem Wieviel an F ü llung pro Knoten. Von manchen Autoren werden hierfür sehr konkrete Lösungen vorgeschlagen; man solle den einzelnen Knoten „short“ gestalten, nicht länger als etwa „hundred lines“ (Shneiderman u.a. 1991 S. 147). Andere greifen auf Ergebnisse der Erforschung der Kapazität des Kurzzeitgedächtnisses zurück, die besagen, der Mensch könne maximal sieben kognitive Einheiten (CHUNKS) auf einmal kurzfristig im Gedächtnis speichern. Horn folgert daraus, daß ein Knoten nicht mehr als sieben Sätze ent- halten solle (sogenanntes „chunking principle“; Horn 1989 S. 86f.; vgl. auch Gerdes 1997 S. 13 sowie Kuhlen 1991 S. 87).

Gerdes bezeichnet die „Festlegung des Knoten-Inhalts“ (und somit auch der Kno- ten-Größe) als „ungelöstes Problem der Hypertext-Technologie“. Nach ihr bestehen die Knoten - abhängig vom spezifischen Hypertext-System - „nur aus einer einzigen Idee, bzw. Proposition, oder auch aus umfangreichen Textdateien“ (Gerdes 1997 S. 12). Das „relevance principle“ von Horn besagt ähnliches, nämlich, daß ein Knoten nur die zentrale Aussage einer einzigen Idee beinhalten darf. Weitere, periphere Aussagen zur selben Idee sollten, durch Links verbunden, in anderen Knoten abgelegt werden.

Wichtig ist an dieser Stelle festzuhalten, daß ein Knoten sowohl eine einzige Proposition als auch eine kohärente Kette mehrerer Propositionen enthalten kann. Der einzelne Knoten hat also potentiell die Möglichkeit, einen Text mit mehreren Kapiteln zu enthalten. In Kapitel 5 wurde festgestellt, daß solche traditionellen, elektronischen Texte, die in einem einzigen Knoten abgelegt sind, als E-TEXTE bezeichnet werden und nicht in den Bereich einer textlinguistischen Untersuchung fallen, die speziell auf Hypertexte ausgerichtet ist.

6.2.3 Darstellungsform

In der Forschung gibt es eine Kontroverse, ob das SCROLLEN ( Hoch- oder Herunterfahren) von Text verboten sein sollte oder nicht.1

Die Befürworter dieses SCROLLING tendieren dazu, einem Knoten keinen bestimmten, bildschirmbedingten Umfang aufzuzwingen. Sie verstehen Hypertexte als elektronische Bücher. Die Knoten werden dabei mit Textabschnitten bzw. Kapiteln von variabler, den Gegebenheiten angepaßter Länge, verglichen.2 Die Gegner des Scrolling hingegen sehen Hypertexte als Karteikartensysteme. Grundelement ist dabei die Karteikarte mit unveränderbarer Größe: Der Knoteninhalt sollte daher der Bildschirmgröße angepaßt werden.3

Ein Blick auf Hypertexte im WWW läßt erkennen, daß sich weitgehend Realisierungen durchgesetzt haben, die einem Knoten keine Längen- beschränkung auferlegen. Allerdings gibt es auch hier eine Gegenbewegung: mittels sogenannter FRAMES4 wird häufig eine ‚scroll-freie Zone‘ innerhalb eines Knotens angestrebt.

6.2.4 Knoten-Typen

Knoten können mindestens nach folgenden Kriterien unterschieden werden:

(1) Inhalt - Text vs. Multimedia
(2) Funktion - Inhaltlicher Knoten vs. Strukturknoten vs. Navigationsknoten
(3) Komplexität - atomar vs. zusammengesetzt

ad (1): Für diese Untersuchung sind primär textuelle Knoten relevant. Dies bedeutet jedoch nicht, daß in den Hypertexten des Corpus’ keine Grafiken o.ä. vorkommen. In vorliegender Arbeit steht aber nicht das exakte Herausarbeiten der Struktur von in Hypertexten auftretenden nichtsprachlichen semiotischen Systemen im Vordergrund. Vielmehr geht es um die funktionale Gesamtwirkung von Knoten im Rahmen der jeweiligen Lesepfade.

ad (2): NAVIGATIONSKNOTEN beinhalten in erster Linie Hilfsfunktionen zur Orien- tierung innerhalb des Hypertextes sowie Angaben zur Handhabung des Systems. STRUKTURKNOTEN hingegen bieten Übersichtsfunktionen an, die sich auf inhaltliche Knoten beziehen. Hierunter fallen zum Beispiel Knoten, die Inhaltsverzeichnisse oder Indices enthalten. Strukturknoten und Navigationsknoten werden öfters zusammengefaßt, so sind zum Beispiel bei Meyerhoff alle Knoten, die „keine inhaltlichen Knoten sind“, ORGANISIERENDE KNOTEN (Meyerhoff 1994 S. 40). Ferner ist wichtig festzuhalten, daß ein einziger Knoten sowohl Inhalts- als auch Struktur- bzw. Navigationsinformationen enthalten kann. Dies ist auch bei Kapiteln normaler Texte der Fall, die neben dem Textkörper PARATEXTUELLE Struktur- (z.B. dem einzelnen Kapitel vorangestellte Kapitelüberschriften) und ‚Navigationsinformation‘ (etwa Seitenzahlen) enthalten können.

ad (3): Bei einigen Hypertext-Systemen besteht die Möglichkeit, sogenannte META-KNOTEN zu konstruieren, die ihrerseits wiederum Knoten enthalten. So könnten die drei Knoten unseres Beispiel-Hypertextes aus Abbildung 5 etwa in ei- nen Meta-Knoten mit der Bezeichnung Beispiel f ü r einen Hypertext integriert werden. Per Klick auf einen entsprechenden Link könnte der integrierte Knoten dann innerhalb des Meta-Knotens als STRETCHTEXT angezeigt werden (vgl. hierzu auch Kapitel 6.3.4). In HTML wiederum ist es möglich, mittels der bereits angesprochenen Frames mehrere Knoten in separaten Bereichen auf einer Bildschirmseite anzuzeigen.

6.3 Komponente II: Links

Kurzdefinition: Im WWW wird der Begriff HYPER-LINK als Synonym für VERKNÜPFUNG, LINK, HYPERTEXT-LINK oder auch HYPERTEXT-VERKNÜPFUNG ge- braucht. Im Rahmen dieser Arbeit wird zumeist aufgrund der Kürze die Form LINK verwendet.

Im Rahmen vieler Hypertext-Modelle, etwa HY TIME1 oder auch XLINK (siehe Kapitel 15.2.3), versteht man unter LINKING das Verknüpfen von Knoten (oder Teilen von Knoten) auf ‚irgendeine‘ Art und Weise. Diese Verknüpfungen können als ausführbare Links realisiert sein, müssen dies aber nicht - der Fokus liegt auf dem Aspekt der Verknüpfung, nicht auf dem der Ausführung!

Links im heutigen WWW sind hingegen ausführbare Verweise und stellen das hypertext-spezifische Element dar. Wobei diese Aussage sogleich etwas relativiert werden muß: Das eigentlich Neue ist die schnelle, direkte Realisierung der Links aufgrund der Möglichkeiten, die das elektronische Medium bietet. Prinzipiell sind nämlich auch Printtexte durchzogen von einem Geflecht mehrerer Verweisebenen: Zu erwähnen ist hier zuallererst das DEIKTISCHE VERWEISSYSTEM. Aber auch mit Inhaltsverzeichnissen o.ä. (siehe Kapitel 6.4.3) wird auf eine bestimmte Seite des fortlaufenden Textes verwiesen. Diese ‚Links’ üben eine hierarchisierende bzw. organisatorische Funktion aus und helfen, den Text als Ganzen zu strukturieren. Besonders in Enzyklopädien und Fachbüchern existieren zusätzlich assoziative Querverweise, die einen Bezug zu anderen Artikeln des Werks herstellen.

Alle drei soeben angesprochenen Verweisklassen existieren - in unterschiedlicher Quantität - auch in Hypertexten. Während die zuletzt genannten assoziativen Links dort sehr häufig anzutreffen und fast als stilbildend anzusehen sind, ist das deiktische Verweissystem hingegen aufgrund der modularen Informations- repräsentation bestimmten Einschränkungen unterworfen.1 Hierarchisierende Links spielen auch in Hypertexten eine nicht zu unterschätzende Rolle, da die meisten großen Hypertexte eben auch über Verzeichnisse unterschiedlichster Art verfügen.

6.3.1 Allgemeine Eigenschaften

Links stellen, wie gesagt, die zweite Hauptkomponente von Hypertexten dar. Hierbei wird in der Regel ein Wort, ein Satz, ein Teiltext oder auch ein graphisches Element im Text des aktiven Knotens in irgendeiner Form graphisch abgesetzt und somit als Ausgangspunkt des Links definiert, welcher auf ein bestimmtes LINK- ZIEL verweist. Das Ziel kann nun seinerseits ein Wort, ein Satz, ein Teiltext oder auch ein graphisches bzw. multimediales Element im selben oder einem anderen Hypertext-Knoten sein. Für alle Links gilt, daß sie sowohl Ausgangs- als auch Zielpunkt haben müssen. Die Ausgangspunkte werden in der Literatur häufig als REFERENCES, LINK-POINTS, HOT SPOTS, LINK-INDIKATOREN, LINK-ICONS, BUTTONS oder ANKER2 bezeichnet, während man für die Zielpunkte Bezeichnungen wie DESTINATION POINTS, LINK REGIONS, REFERENCE POINTS, ZIEL-RESSOURCE oder LINK- ZIEL verwendet (vgl. Conklin 1987 S. 34, Kuhlen 1991 S. 108 sowie Gerdes 1997 S. 18). In dieser Arbeit werden hauptsächlich die Begriffe LINK-ANKER bzw. LINK- TEXT für den Ausgangspunkt und LINK-ZIEL für den Zielpunkt von Links verwendet.

Links werden bei Kuhlen als „informationelle Funktionen erster Ordnung“ gesehen (Kuhlen 1991 S. 98). Dies geschieht in Abgrenzung zu den Navigationshilfen (Kuhlen 1991 S. 124), welche nach seiner Einteilung „Informationelle Funktionen zweiter Ordnung“ darstellen.

Eine Klassifizierung der Links kann inhaltlich-funktional (siehe Kapitel 6.3.3 ) und/oder formal (siehe hierzu das nächste Kapitel) erfolgen. Auch eine Klassi- fizierung nach dem TRAVESIERUNGSVERHALTEN wäre denkbar (vgl. Kapitel 6.3.4).

6.3.2 Formale Unterscheidungsmöglichkeiten

Ein erstes Unterscheidungskriterium ist, ob einem Link nur entlang einer Richtung gefolgt werden kann (= UNIDIREKTIONAL) oder ob dieser BIDIREKTIONAL ist, also ein Link-Anker gleichzeitig potentielles Link-Ziel (innerhalb desselben Links!) sein kann. Bei unidirektionalen Verweisen ist die Reihenfolge Ausgangsknoten - Ziel knoten streng vorgegeben.1 Der Zielpunkt eines Ankers kann entweder im aktuellen Knoten, in einem anderen Knoten oder in einem anderen Hypertext liegen. Die folgende Grafik soll diese Verhältnisse visualisieren:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Intra-, inter- und extra-hypertextuelle Links2

Links können des weiteren bezüglich GLOBALITÄT bzw. LOKALITÄT unterschieden werden. GLOBAL bedeutet, daß ein gesamter Knoten als Ausgangs- bzw. Zielpunkt fungiert. Als LOKALER Ausgangs- bzw. Zielpunkt dient ein Bereich (Wort, Satz, Abbildung) innerhalb eines Knotens. Auf diese Art können vier verschiedene Verweisarten klassifiziert werden:

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 3: Link-Klassifizierung nach Lokalität vs. Globalität

Die INTER-KNOTEN-LINKS und EXTRA-HYPERTEXTUELLEN LINKS (Abbildung 2, Nummer 2 und 3) können prinzipiell jede der in Abbildung 3 beschriebenen Varianten annehmen. Die Intra-Knoten-Links (Abbildung 2, Nummer 1) hingegen schließen die Variante global-global (Abbildung 3, Nummer 1) aus, da ansonsten der globale Knoten nur auf sich selbst verweisen könnte. Im WWW werden jedoch gesamte Knoten äußerst selten als Link-Anker benutzt. Die meisten Links sind dort Lokal-Lokal bzw. Lokal-Global.

6.3.3 Inhaltliche Unterscheidungsmöglichkeiten

Conklin 1987 schlägt die Unterscheidung in REFERENTIELLE und ORGANISATORISCHE LINKS vor. Diese von Kuhlen modifizierte Einteilung wurde von einem Großteil der Sekundärliteratur übernommen.1

Bei referentiellen Links wird der Grund für das Setzen eines Verweises nicht explizit gemacht. Sie sind semantisch nicht näher spezifiziert. So entstehen assoziative Relationen zwischen Knoten, „[...] ohne daß der Autor dies in jedem Fall genau begründen könnte“ (Kuhlen 1991 S. 114). Organisatorische Links definieren dagegen explizite semantische Beziehungen. Sie drücken die „primär logische Struktur eines Hypertextes“ aus (Ansel Suter 1995 S. 16). Kuhlen nimmt in diese Klasse auch Links auf, die argumentative Strukturen aufbauen. In der neueren Literatur wurde diese erweiterte Definition größtenteils übernommen.

[...]


1 Dieser Vorgang der Textsequenzierung innerhalb eines Hypertextes durch den Leser wird oft mit Navigieren in einem Hypertext paraphrasiert.

1 Dies freilich auf Grundlage des Textbegriffes, der in dieser Arbeit verwendet wird und auf dessen theoretische Unvollständigkeiten bereits hingewiesen wurde.

2 Die Corpus-Hypertexte haben keine Links, die über mehr als einen Zielknoten verfügen. Mit neuen Technologien ist dies jedoch denk- und machbar, mehr dazu auch in Kapitel 15.2.3.

3 Siehe hierzu Kapitel 6.4.2.

1 Vgl. hierzu etwa Kapitel 1 von van Dijk 1980a, Strohner 1990 sowie Friederici 1999.

2 Vgl. hierzu etwa Rickheit u. Strohner 1993, Sucharowski 1996 sowie Pörings u. Schmitz 1999.

3 Auf eine mögliche, voraussichtlich unproblematische Einbettung des deskriptiven TAH in ein größeres kognitives Erklärungsmodell der Hypertext-Verarbeitung wird im Kapitel Ausblick dieser Arbeit hingewiesen.

1 Die Entwicklung des Word Wide Web und des Internet wird in Kapitel 4.2 zusammenfassend beschrieben.

2 Drei Gründe lassen sich nennen, wieso Hypertext-Realisierungen überwiegend im WWW stattfinden: Die Hypertexte können mit der im Hinblick auf das Betriebssystem unabhängigen Hypertext-Beschreibungssprache HTML auf einer nahezu beliebigen Rechnerarchitektur implementiert werden. Die erstellten Hypertexte werden in das weltweite Computernetz INTERNET eingespielt, das noch immer mit einem exponentiellen Wachstum der Benutzerzahlen aufwarten kann. Die zur Ansicht von WWW-Hypertexten notwendige Browser-Software wird von den meisten Firmen aus Marketinggründen verschenkt (vgl. auch: Münz 1997a [htxt212.htm]).

3 Eine kurze Einführung in HTML gibt das Kapitel 15.2.

4 Sämtliche textlinguistischen Begriffe werden ausführlich in Teil B eingeführt.

1 In Kapitel 4.2 wird über die Motivationen zur Gründung des WWW zu lesen sein, daß diese primär darin bestand, das „problem of information access“ zu lösen (vgl. Berners-Lee 1989).

2 Die Unterstreichungen symbolisieren Links (siehe hierzu auch den Abschnitt Typographische Konventionen dieser Arbeit).

1 Darunter versteht man Texte, die auf dem Bildschirm erscheinen, sobald der Mauszeiger auf einen Link bewegt wird.

1 PIKTOGRAMME sind kleine, ikonenhafte Bilder, die zur Visualisierung von Link-Typen benutzt werden können. Sie werden in Kapitel 15.2.4 vorgestellt.

1 z.B.: Sarre1991, Brown 1991, Cordes u. Streitz 1992, Neubert 1994, Agosti 1996, Haake 1997 und Riggert 1998

1 Weitere psychologisch bzw. erziehungswissenschaftlich motivierte Arbeiten sind Ambron u. Hooper 1988, Marchionini u. Shneiderman 1988, Jonassen 1990, Nix u. Spiro 1990, Retterer 1991, Fickert 1992, Hammwöhner 1993, McKnight 1993, Tergan 1993 u. 1995, Hasebrook 1994 u. 1995, Meyerhoff 1994, Glowalla 1995, Rada 1995 sowie Rouet 1996.

2 Weitere Titel aus der Literaturtheorie sind: Doland 1988, Bolter 1989, Moulthrop 1991, Andersen 1992, Idensen1993 und Ramm 1994.

1 Die Bedeutung dieses Grundsatzartikels arbeiteten Nyce u. Kahn 1991 heraus.

2 vgl. Kuhlen 1991 S. 38, Nielsen 1990 S. 33 u. Hasebrook 1995 S. 169; Nelson selbst bestätigt, daß die Begriffe Hypertext und Hypermedia von ihm stammen (vgl. hierzu auch den offiziellen Newsletter von Nelson im Internet unter der Adresse http://www.picosof.com/993[momentan offline!]);

1 Dies bezeugt ebenfalls eine Stelle aus Nelson 1967. Hier definiert der Autor HYPERTEXT als Sammelbegriff für „[...] any text, which cannot be printed [...] on a conventional page" (Nelson 1967, S. 195). Dieser Sammelbegriff schließt aber Printmedien, welche über ‚hypertextuelle‘ Strukturen verfügen (etwa Enzyklopädien) explizit nicht mit ein.

1 Der Begriff S ERVER ist im Glossar erläutert.

2 Ein BROWSER ist ein Programm zum Lesen von Hypertexten im WWW. En détail wird diese Software in Kapitel 6.4.8 vorgestellt.

3 Nähere Details stehen im Internet unter http://www.w3.org/People/Berners- Lee/WorldWideWeb.html

4 Interessant ist, daß es sich bei dem ersten Programm sowohl um einen Browser als auch um einen Editor handelte. Mit Hilfe des Editors sollte jedermann ermöglicht werden, zu bestehenden Dokumenten Bemerkungen hinzuzufügen bzw. von bestehenden Dokumenten aus selbständig zusätzliche Links einzubauen. Hierbei handelt es sich um eine Kernforderung von Berners-Lee, die jedoch in dieser Form nicht erfüllt wurde. Die späteren Entwicklungen konzentrierten sich ausschließlich auf die Navigationsfunktionen. Mögliche Gründe für die Vernachlässigung der Editierfunktion werden bei Berners-Lee 1999a S. 111f. genannt.

1 Die Geschichte des Internet wird hier nur kurz angerissen. Für weitere Informationen gibt es sehr gute Ressourcen in ausreichender Anzahl im WWW. Ein Ausgangspunkt hierfür ist die Kategorie Internet / History bei Yahoo! [ http://dir.yahoo.com/Computers_and_Internet/ Internet/History/ ]. Einen schnellen Überblick in Tabellenform gewährt die Seite see.think. The History of the Net. [ http://members.magnet.at/dmayr/history.htm ]. Ausführlich über den Entwicklungsstand im Jahre 1994, also kurz vor dem weltweiten Durchbruch des WWW, informiert die Seite Entering the Web: A Guide to Cyberspace von Kevin Hughes

[ http://sunsite.sut.ac.jp/coll/guide.61.html/guide.toc.html ]. Besonders zu erwähnen sind auch die umfangreichen Archive des W3C [ http://www.w3.org/History/ ], die die verschiedenen Entwicklungsphasen des Internet und besonders die des WWW nachvollziehbar machen.

2 Dieses Netz existiert noch heute und hat unter http://www.arpa.mil eine Schnittstelle zum WWW.

3 In das Konzept der HYPERTEXT MARKUP LANGUAGE (HTML) wird in Kapitel 15.2 eingeführt.

1 Dazu gibt es ein Adressierungsschema - die sogenannten IP-Adressen. Eine typische IP- Adresse sieht in Dezimalschreibweise beispielsweise etwa so aus: 127.174.211.5 - vier höchstens dreistellige Zahlen, getrennt durch Punkte. Im Rahmen dieser Arbeit ist kein weiteres Verständnis der IP-Adressierung bzw. der Namensauflösung mittels sogenannter DOMAIN NAME SERVER notwendig. Für den geneigten Leser sei jedoch auf die TCP/IP Resources List

[ http://www.private.org.il/tcpip_rl.html ] bzw. die DNS Resources Directory

[ http://www.dns.net/dnsrd/ ] verwiesen.

2 Ein ausgezeichneter Einstieg in HTTP ist der Aufsatz von Tim Furche [ http://www.pms.informatik.uni-muenchen.de/lehre/seminar/html-metamorphosen/00ss/ ausarbeitungen/HTTP/ ]. Sämtliche relevanten Spezifikationen des W3C werden hier verständlich erläutert. Die Spezifikationen selbst finden sich unter http://www.w3.org/Protocols/.

1 In diesem und dem nächsten Kapitel müssen bereits einige textlinguistische Termini wie KOHÄSION oder KOHÄRENZ verwendet werden, die explizit erst im Teil B eingeführt werden. Vorab zum besseren Verständnis sei erwähnt: Unter KOHÄSION versteht man den durch grammatische Mittel hergestellten Textzusammenhang. Der Begriff der KOHÄRENZ hingegen bezeichnet den semantischen Zusammenhalt des Textes.

2 Der eigentliche Text wird flankiert von PARATEXTUELLEN Elementen, auf die in Kapitel 11 näher eingegangen wird.

3 In Kapitel 9 wird sich zeigen, daß KOHÄRENZ das wichtigste Kriterium für die Bestimmung der TEXTUALITÄT sind.

1 Dies gilt vor allem, wenn man die Ergebnisseiten von SUCHMASCHINEN im WWW ebenfalls als - dynamisch generierte - Hypertexte betrachtet. Die Behauptung gilt jedoch nicht für sogenannte HYPERTEXT-INSELN, die bewußt keine Anbindung an solche Knoten haben, die öffentlich zugänglich sind. Technisch möglich ist das durch die Arbeitsweise der Suchmaschinen: Diese navigieren Link für Link durch das WWW und bauen einen Index der besuchten Seiten auf. Existiert www-weit kein einziger LINK zur Hypertext-Insel, ist diese auch nicht zu indexieren. Zu denken ist hier etwa an Bewerbungsunterlagen, deren Adresse nur der jeweilige potentielle Arbeitgeber vom Bewerber erhält. Solche Hypertexte setzen jedoch lediglich auf der Technik des WWW auf, gehören aber nicht zum eigentlichen WWW-HYPERTEXT-NETZ (siehe unten).

1 Der Begriff E-TEXT wurde laut Storrer zuerst von Zimmer in dessen Digitaler Bibliothek geprägt (Online im WWW unter http://www.zeit.de/digbib/index1.html).

2 Der Begriff PARATEXT wird von Storrer nicht näher erläutert. Es kann aber wohl davon ausgegangen werden, daß hiermit in etwa die paratextuellen Phänomene gemeint sind, welche auch in Kapitel 11 dieser Arbeit beschrieben werden.

3 Als Vorteile sind der schnelle Zugriff, die Möglichkeit der Volltextsuche, das kostengünstige und verlagsunabhängige Publizieren sowie die schnelle Wiederverwendbarkeit der Texte zu werten. Außerdem muß sich der Leser bei der Lektüre von E-Texten nicht auf hypertext-spezifische Eigenschaften einlassen. Als Nachteil dürfte sich das unkomfortable Lesen längerer Texte am Bildschirm herausstellen. Storrer 2001b geht genauer auf diese Punkte ein.

1 Dieses Kapitel ist eine überarbeitete und erweiterte Version des Abschnitts 2.2 meiner unveröffentlichten Magisterarbeit. Die Arbeit ist über das Internet als PDF-Datei zu beziehen [ http://www.huberoliver.de/Magister.pdf ].

2 „Knoten sind [...] nicht immer atomar.“ (Schnupp 1992 S. 58) In manchen Hypertext-Systemen ist es möglich, Knoten in einen anderen Knoten einzubauen, und/oder die Information ein und desselben Knotens in einer zusammengefaßten sowie einer ausführlichen Version, die vom Leser bei Bedarf mittels eines Software-Mechanismus’ aktiviert werden kann, darzustellen. In diesem Fall spricht man von STRETCHTEXTEN (vgl. Schnupp 1992 S. 40; Ansel Suter S. 19 f.). Mit XLINK, dem LINKING-Mechanismus von XML, sind solche Stretchtexte ebenfalls möglich (siehe Kapitel 15.2.3). Eine Unterscheidung bzgl. dieses TRAVESIERUNGSVERHALTENS unternimmt Kapitel 6.3.4.

3 Die Definitionen textlinguistischer Termini finden Sie in den Kapiteln von Teil B.

1 Kuhlen definiert neben den genannten drei Komponenten noch zwei weitere: einen BEGRIFFSORIENTIERTEN REFERENZTEIL (Schlüsselwörter) sowie einen ZUSAMMENFASSENDEN REFERENZTEIL (Kurzinhalt). Allerdings sind diese Komponenten in erster Linie für das INFORMATION RETRIEVAL in größeren Hypertexten und somit für informationswissenschaftliche Disziplinen interessant. (vgl. Kuhlen 1991 S. 79 f. u. 97).

2 Die Etikettierung wird bei Horn „labeling principle“ genannt: Der Knoteninhalt soll sich für den Leser möglichst einfach durch den Knotennamen erschließen lassen (Horn 1989 S. 86 f.).

1 Den aktuellen Stand der Diskussion um diese Designalternativen - besonders aus lernpsychologischer Sichtweise - beschreibt Gerdes 1997 S. 15 f.

2 Meiner Meinung nach ist aber eher eine Analogie von SCROLLING zum Lesen einer Papyrusrolle anzusetzen, da Kapitel in Büchern oft über mehrere Seiten gehen. Aufgrund des dadurch nötigen Umblätterns ist die Buchmetapher für zu scrollende Knoten nur bedingt aussagefähig.

3 Der Umfang des Knotens müßte allerdings relational definiert werden. Aufgrund sehr unterschiedlichen Bildschirmgrößen und Auflösungen könnte die Karteikartenmetapher ansonsten nicht aufrechterhalten werden.

4 Frames unterteilen die Bildschirmanzeige in mehrere Bereiche. Jeder dieser Bereiche kann eigene Inhalte haben. Oftmals sind einige der Frame-Bereiche an die Bildschirmgröße angepaßt, wodurch ein Scrolling nicht mehr nötig ist.

1 Mehr Information zum Standard HYTIME bietet das WWW [ http://www.hytime.org/ ]. XLink erbte einige Eigenschaften dieses Hypertext-Modells, darunter die multidirektionalen Verweise. Auf die weitere Philosophie von HyTime wird im Rahmen dieser Arbeit jedoch nicht eingegangen.

1 Die größte Einschränkung liegt darin, daß deiktische Mittel in der Regel nicht ohne weiteres knotenübergreifende Verweisstrukturen erstellen können. Ähnlichen Einschränkungen unterliegen auch die einzelnen Artikel einer Enzyklopädie.

2 Die bestmögliche Darstellungsform dieser LINK-A NKER wird dabei rege diskutiert (vgl. Gerdes 1997 S. 23 f.).

1 In HTML lassen sich nur unidirektionale Links konstruieren. Allerdings ist über rückwärtsgerichtete Navigationshilfen des Browsers eine Rückkehr zum Ausgangspunkt möglich. Sämtliche Browser für das WWW verfügen beispielsweise über eine sogenannte BACKTRACK - FUNKTION, die Rückwärtsnavigation ermöglicht (siehe Kapitel 6.4.8 und 6.4.9; vgl. auch Utting u. Yankelovich 1989 S. 59, Kuhlen 1991 S. 104 sowie Gerdes 1997 S. 18).

2 Die von Kuhlen eingeführten und von Gerdes und anderen übernommenen Begriffe INTRA - und INTER-HYPERTEXTUELL wurden in dieser Arbeit durch INTRA -KNOTEN bzw. EXTRA -KNOTEN ersetzt. Sie treffen meiner Meinung nach den Sachverhalt besser, da es sich bei den seitens der Autoren beschriebenen Relationen um Verhältnisse innerhalb eines Knotens bzw. zwischen zwei Knoten handelt. Es geht also nicht um gesamt-hypertextuelle, sondern vielmehr um knoten-interne Verweisrelationen. Einen Begriff zu verwenden, der sich auf den Hypertext als Gesamtstruktur bezieht, ist nur bei Beziehung (3) sinnvoll, die als EXTRA-HYPERTEXTUELL eine Relation zu einem an- deren Hypertext beschreibt (siehe Kuhlen 1991 S. 107 f. und Gerdes 1997 S. 20).

1 Siehe Conklin 1987 S. 33 f. (ferner: Kuhlen 1991 S. 113 f., Astleitner 1997 und Gerdes 1997 S. 21. Eine andere Terminologie findet sich hingegen bei Schnupp 1992 S. 134.)

Ende der Leseprobe aus 257 Seiten

Details

Titel
Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web)
Hochschule
Ludwig-Maximilians-Universität München  (Falkultät für Sprach- und Literaturwissenschaft)
Note
2
Autor
Jahr
2002
Seiten
257
Katalognummer
V5552
ISBN (eBook)
9783638133951
Dateigröße
2672 KB
Sprache
Deutsch
Schlagworte
Hypertext WWW Links typisierte Links Kognition Linguistik Textlinguistik Kohärenz Text
Arbeit zitieren
Oliver Huber (Autor:in), 2002, Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web), München, GRIN Verlag, https://www.grin.com/document/5552

Kommentare

  • Noch keine Kommentare.
Blick ins Buch
Titel: Hyper-Text-Linguistik (TAH: Ein Textlinguistisches Analysemodell für Hypertexte; Theoretisch und praktisch exemplifiziert am Problemfeld der typisierten Links von Hypertexten im World Wide Web)



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden