Lade Inhalt...

Sprachtechnologien und Computerlinguistik. Textverbesserungsmaßnahmen in Office Word

Seminararbeit 2015 15 Seiten

Sprachwissenschaft / Sprachforschung (fachübergreifend)

Leseprobe

Inhaltsverzeichnis

Einleitung

Aufbau der Arbeit

1 Sprachtechnologien als Teil der Sprachindustrie
1.1 Definition
1.2 Allgemeine Informationen
1.3 Anwendungsgebiete

2 Exkurs: Computerlinguistik als theoretische Grundlage
2.1 Definition und allgemeine Aspekte
2.2 Teilbereiche und Anwendung

3 Fokus: Textverbesserungsmaßnahmen in Office Word
3.1 Rechtschreibung
3.2 Grammatik
3.3 Thesaurus (in mehreren Sprachen)
3.4 Auto-Korrektur
3.5 Automatische Silbentrennung
3.6 Kommentarfunktion und Änderungen nachverfolgen
3.7 Texte übersetzen

4 Zusammenfassung und Fazit

5 Literaturverzeichnis

6 Abbildungsverzeichnis

Einleitung

Schon seit langer Zeit versucht man, die menschliche Sprache mithilfe von Maschinen in verschiedenen Formen zu verarbeiten. Anfängliche Ideen wie die maschinelle Übersetzung oder Gespräche mit Computern bildeten nach und nach zwei zusammengehörige Teilbereiche: Sprachtechnologien und Computerlinguistik. In diesen beiden Gebieten erfolgt eine große Anzahl an Untersuchungen und Forschungsprojekten - besonders in der heutigen Zeit. Viele erfolgreich erstellte Anwendungen werden bereits kommerziell genutzt; dazu zählen etwa die maschinelle Übersetzung, Diktierfunktionen sowie Möglichkeiten zur Textklassifikation.

Ein großer Bereich umfasst auch die Funktionen, die eine Person im Hinblick auf die Erstellung von Texten aller Art unterstützen können. Vor allem der Erhöhung sprachlicher Qualität kommt im modernen Zeitalter immer mehr Bedeutung zu (vgl. Carstensen 2012:1f.). Die folgende Hausarbeit für die Vorlesung „Methoden, Prozesse und Technologien der Sprachindustrie“ beschäftigt sich daher mit der folgenden Frage:

„Welche Anwendungen bzw. Funktionen existieren in Office Word, um einen Text qualitativ zu verbessern?“

Dieses Thema wurde ausgewählt, weil sich die Autorin selbst beruflich der Korrektur und dem Lektorat mehrsprachiger Dokumente widmet. Die Möglichkeiten, die Word bietet (und die in einem späteren Kapitel beschrieben werden), erleichtern diese Tätigkeiten enorm.

Aufbau der Arbeit

Die vorliegende Arbeit ist in vier große Kapitel (und in dazugehörige Unterkapitel) gegliedert. Für ein besseres Verständnis findet der Leser zu Beginn eine Erklärung und Beschreibung der Hauptthemen:

Der erste Abschnitt wird dem Thema Sprachtechnologien gewidmet, die ein sehr bedeutendes Teilgebiet der Sprachindustrie darstellen. Gleichzeitig soll ein Überblick über Computerlinguistik gegeben werden, der eine technische und auch theoretische Basis für dieses Untersuchungsgebiet liefert. Dieser ist in Kapitel 2 zu finden.

Im dritten Abschnitt der Arbeit erfolgen die Untersuchung und Beantwortung der zu Beginn gestellten Frage. Dafür werden verschiedene Möglichkeiten beschrieben und analysiert, die die Qualität von Texten aller Art verbessern können. Diese Verbesserungsmaßnahmen dienen sowohl dem Verfasser selbst als auch dem Korrekturleser bzw. Lektor eines Dokuments.

Daraufhin wird die Hausarbeit im letzten Kapitel zusammengefasst, um das Gelesene vertiefen zu können. Das Resümee steht in Verbindung mit einem abschließenden Fazit.

1 Sprachtechnologien als Teil der Sprachindustrie

Dieses Kapitel soll theoretische Grundlagen zum Thema Sprachtechnologie liefern. Dafür wird es in die drei Bereiche Definition, Allgemeine Informationen und Anwendungsgebiete eingeteilt.

1.1 Definition

In der Literatur gibt es unterschiedliche Definitionen des Terminus Sprachtechnologie. Nach Rehm/Uszkoreit (2012:17) dient sie „der Entwicklung von Softwaresystemen zur Verarbeitung geschriebener oder gesprochener Sprache. [...] Sprachtechnologie verarbeitet oder erzeugt diese unterschiedlichen Formen der Sprache mithilfe von Wörterbüchern und syntaktischen und semantischen Regelsystemen oder aber mit statistischen Sprachmodellen. Sprachtechnologie verknüpft also Sprache mit verschiedenen Wissensformen [...].“

Eine kürzere und prägnante Begriffsbestimmung gibt Carstensen (2012:7): „Die Sprachtechnologie befasst sich mit der Entwicklung marktreifer Anwendungen der maschinellen Sprachverarbeitung (Computerlinguistik, CL).“

Womit sich Sprachtechnologie im praktischen Bereich befasst, wird im Unterkapitel Anwendungsgebiete detaillierter erläutert.

1.2 Allgemeine Informationen

Die Disziplin der Sprachtechnologien ist ein Teilbereich der maschinellen Sprachverarbeitung

- dieses Gebiet wiederum bildete sich aus den Zweigen Informatik und Linguistik. Die maschinelle Sprachverarbeitung beinhaltet noch drei weitere (teilweise eigenständige) Disziplinen: die Linguistische Datenverarbeitung (LDV), die theoretisch orientierte Computerlinguistik und die maschinelle Sprachverarbeitung im engeren Sinn, die Sprache als kognitives System auffasst (vgl. Carstensen 2012:8).

Im Idealfall kann man hierbei sowohl mit Schriftsprache als auch mit Lautsprache agieren. Diese beiden Bereiche werden im folgenden Kapitel detaillierter beschrieben.

1.3 Anwendungsgebiete

Um näher auf die praktische Anwendung von Sprachtechnologien einzugehen, muss von drei Differenzierungskriterien ausgegangen werden (vgl. Carstensen 2012:13ff.):

1. Die sprachliche Ausdrucksform bezieht sich auf die Unterscheidung zwischen gesprochener und geschriebener Sprache. Daraus werden die zwei Bereiche Text- und Speech-Technologie abgeleitet.

- Speech-Technologien beschäftigen sich sowohl mit der Erkennung als auch mit der Produktion von gesprochener Sprache. Besonders Produkte zur Spracherkennung sind heute bereits von vielen Personen in Verwendung (Stimmenerkennung, Vorlesen von E-Mails, Mobiltelefon-Applikationen).
- Text-Technologien inkludieren bekannte Anwendungsgebiete wie die Rechtschreib- und Grammatikkorrektur, Textbearbeitung, Dokumentenerschließung sowie die maschinelle Übersetzung.

2. Die Komplexität der Anwendungen erstreckt sich von spezifischen Plug-ins bzw.

Modulen und Werkzeugen bis hin zu natürlich-sprachlichen Systemen auf eigenständiger Basis.

- Methoden in sogenannten (semi)-eigenständigen Werken sind Systeme mit Hilfsfunktionen wie Grammatik-Werkbänke sowie Werkzeuge zur Korpora- Verwaltung und zur computergestützten Übersetzung.
- Des Weiteren ist ein Einsatz von Methoden als Bestandteil eines komplexen Systems möglich. Dazu zählen computergestütztes Sprachlehren/-lernen oder elektronische Kommunikationshilfen im Bereich Alternative and Augmentative Communication (AAC).

3. Der Zweck bzw. der Funktionalitätsbereich von sprachtechnologischer Software kann diverse Möglichkeiten einschließen. Zu diesen zählen unter anderem die Kommunikation mit Computern, automatische Behandlung von sprachlichen Phänomenen, maschinelle Sprachverarbeitung als Mehrwert für Personen und automatisches Herausfiltern von Informationen aus Texten.

2 Exkurs: Computerlinguistik als theoretische Grundlage

Dieses Kapitel soll in kurzer und prägnanter Form ein paar bedeutsame Informationen über Computerlinguistik und ihre Teilbereiche liefern.

2.1 Definition und allgemeine Aspekte

Die Computerlinguistik ist unter anderem in den wissenschaftlichen Zweigen der Informatik, der theoretischen Linguistik, der Lexikographie, der Psycholinguistik, der analytischen Philosophie und der Textverarbeitung verankert. Ihre Anfänge sind in den 50er Jahren datiert; heute gilt sie als ein anerkanntes Gebiet der Forschung.

Der Terminus bezieht sich auf diejenigen Gebiete der Kognitionswissenschaften, die sich mit Sprachproduktion und -verstehen befassen. Dies hebt hervor, dass Computerlinguistik interdisziplinär arbeitet und nicht nur einem Bereich zugeordnet werden kann.

2.2 Teilbereiche und Anwendung

Computerlinguistik hat eine große Anzahl an praktischen Anwendungsbereichen zu bieten. Die nachfolgende Liste stellt die wichtigsten Optionen kurz und prägnant dar:

1. Abruf und Indizierung von textuellen Datenquellen
2. Automatische Textproduktion
3. Maschinelle Übersetzung
4. Automatische Textüberprüfung
5. Automatische Inhaltsanalyse
6. Automatische Auskunft/Dialogsysteme
7. Automatisierter Unterricht in Schulen (vgl. Hausser 2013:13ff.)

[...]

Details

Seiten
15
Jahr
2015
ISBN (eBook)
9783668314139
ISBN (Buch)
9783668314146
Dateigröße
879 KB
Sprache
Deutsch
Katalognummer
v341572
Institution / Hochschule
Universität Wien
Note
1
Schlagworte
Sprachtechnologie Computerlinguistik Verbesserung Word

Autor

Zurück

Titel: Sprachtechnologien und Computerlinguistik. Textverbesserungsmaßnahmen in Office Word