Suchen im Netz - Informationbeschaffung im Internet


Hausarbeit, 2001

18 Seiten


Leseprobe


Inhaltsverzeichnis

1. Informationen im WWW / Internet
1.1 Welche Informationen sind im Internet erreichbar?
1.2 Wer bietet Informationen im Netz an?

2. Suchverfahren im WWW
2.1 Webkataloge und Verzeichnisse
2.1.1 WWW
2.1.2 Telefonnummern / Adressen
2.1.3 Portale
2.1.4 E-Mail
2.2 Suchmaschinen
2.2.1 WWW
2.2.2 Usenet
2.2.3 FTP
2.2.4 Metasuchmaschinen

3. Suchmethoden
3.1 Bedienung von Suchmaschinen
3.2 Wie finde ich was ich suche?
3.3 Wie suchen Suchmaschinen?
3.4 Vor- und Nachteile
3.5 Andere Wege der Informationsbeschaffung

1 Informationen im WWW / Internet

Das Internet bietet eine kaum zu erfassende Masse an Informationen. Mit einem Datenvolumen von über 21000 Gigabyte reinem Text und mehr als 2,1 Milliarden Seiten, Tendenz um ca. 7,3 Millionen Seiten pro Tag steigend, sind Werkzeuge zur Navigation bzw. Suche im Medium Internet inzwischen unerlässlich.

1.1 Welche Informationen sind im Internet erreichbar?

Der am häufigsten genutzte Dienst im Internet, nicht zuletzt wegen seiner grafischen Aufbereitung, ist das WWW (World Wide Web.) Jeder der imstande ist eine grafische Oberfläche zu bedienen hat die Möglichkeit Informationen aus dem Internet abzurufen und sogar nahezu kostenfrei global bereitzustellen.

Um sich zurechtzufinden wurden kostenlose Suchdienste geschaffen mit deren Hilfe man auf Stichwortbasis das Internet durchsuchen kann. Ähnlichen Service bieten Webkataloge bzw. Verzeichnisse bei denen man jedoch auch gezielt Interessengebiete ansteuern kann.

Suchmaschinen bieten hauptsächlich die Möglichkeit auf HTML Seiten zuzugreifen die sich in ihrem Index befinden. Der Inhalt dieser Seiten wiederum kann von beliebiger Natur sein. Das Internet wird nicht zensiert, es sei denn unzulässige Seiten werden aufgespürt und nachträglich geschlossen. Im Allgemeinen jedoch hat man die Möglichkeit auf jede Art von Information zurückzugreifen die auf einer Homepage verarbeitet wurde.

Immer mehr Suchmaschinen bieten auch die Suche nach Bildern, Audio- und Videodateien an. Durch die technische Entwicklung der letzten Jahre in Sachen Bandbreite und Übertragungsgeschwindigkeit sowie durch die rasante Verbreitung des MP3 Formats für Audiodateien ist der Bestand dieser Art von Informationen im Netz erheblich angestiegen.

Weitere Informationsdienste im Internet sind Email und Newsgroups. Vor allem bei Newsgroups spielen Suchmaschinen wieder eine unterstützende Rolle. Die Architektur des ehemaligen Usenets, der Newsgroups, ist von vornherein schon nach Interessengruppen gegliedert. Ähnlich wie bei schwarzen Brettern können Benutzer Nachrichten in Newsgroups senden und lesen. Durch die enorme Anzahl an Nachrichten täglich die weltweit in Newsgroups gesendet und damit Informationen ausgetauscht werden ist es hilfreich mit Hilfe von Suchmaschinen Beiträge zu suchen die bereits zum gesuchten Thema verfasst wurden. Die umfangsreichsten Newsgroupsuchmaschinen finden sogar noch Beiträge die mehr als drei Jahre alt sind.

Ein anderer häufig genutzter Dienst im Netz ist FTP. Das ,,File Transfer Protocol" erlaubt den Austausch von Daten, speziell in binärer Form. Auf FTP Servern findet sich, sofern öffentlich zugänglich, ein breites Spektrum an verfügbaren Dateien von Freeware und Shareware für alle Rechnertypen über Treiber und Zusatzmodule bis hin zu Video, Sound und Bilddateien aller Art. Um dem Benutzer die Möglichkeit zu geben den richtigen FTP Server in bezug auf Inhalt und Geschwindigkeit zu finden wurde weltweit ein Netz von sogenannten Archie-Servern aufgebaut die als Internetkatalog für FTP galten. Mittlerweile sind die meisten Archie-Server an Suchmaschinen angebunden bzw. bieten Suchmaschinen Selbst die Möglichkeit in deren Archiven zu suchen.

1.2 Wer bietet Informationen im Netz an?

Privatpersonen

Heutzutage ist jeder in der Lage eine private Homepage ins Internet zu stellen. Meist bietet der Internetprovider schon die Möglichkeit Speicherplatz im Web zu nutzen. Jedoch gibt es auch zahlreiche werbefinanzierte Anbieter die kostenlos bis 100 MB und mehr an Platz für die private Homepage zur Verfügung stellen. Dadurch entsteht eine Vielzahl von Informationen jeglicher Art da jeder seinen Interessen entsprechend die eigene Homepage frei gestalten kann.

Kommerzielle Organisationen / Firmen

Firmen aller Größen und Sparten präsentieren sich und ihre Produkte auf WWW Seiten. Mittlerweile gehört eine Homepage und eine E-Mailadresse zu einer Firma wie eine Telefon- und Faxnummer. Es besteht die Möglichkeit Produkte online zu bestellen, Geschäfte transparent zu machen oder wie im Falle von Direktbanken die Kontoführung zu übernehmen. Meist spiegelt sich der Unternehmensname im Domainname wider (z.B. www.ibm.com, www.microsoft.com )

Universitäten, Institute und sonstige Forschungseinrichtungen

Über die WWW-Seiten von Universitäten stehen recht umfangreiche Informationen zu Studiengängen, Fakultäten, Forschungsprojekten und sonstigen für das Studium wichtigen Informationen bereit. Immer mehr wissenschaftliche Einrichtungen gehen dazu über, WWW-Bereiche und Email-Accounts sowohl allen Mitarbeitern als auch Studenten kostenlos zur Verfügung zu stellen. Deutsche Hochschulserver sind an einem der Kürzel ,,uni", ,,fu", ,,tu" oder ,,fh", die englischsprachiger Länder meistens an ,,.edu" (Education) in ihren Domain-Namen zu erkennen.

Medienanbieter und Anbieter kommerzieller Datenbanken

Traditionelle Vermittler von gedruckter und nicht-gedruckter Information wie Zeitungen, Verlage, Agenturen, Buchhandlungen, Radio- und Fernsehsender bieten ihre Produkte über das WWW an. Dabei wird oft auch die Möglichkeit gegeben, in Archiven zu stöbern, was früher nur bestimmten Personen möglich oder ansonsten recht schwierig war.

Kommunikations- und Diskussionsforen

Elektronische Foren als Kommunikationsmittel im WWW erfreuen sich einer immer größer werdenden Zahl von Teilnehmern. Mit diesem Werkzeug kommen die Anbieter dem Bedürfnis der Anwender nach, mit anderen Teilnehmern über bestimmte Themen oder Interessensgebiete zu kommunizieren bzw. diskutieren.

Forumsteilnehmer haben den Vorteil direkt über ihren Webbrowser Beiträge in das jeweilige Forum einbringen zu können. Im Großen und Ganzen kann man Foren im Web mit Newsgroups vergleichen, jedoch hat sich die dahinter steckende Technik grundlegend geändert.

2 Suchverfahren im WWW

Wie bereits angesprochen unterscheidet man hauptsächlich zwischen Webkatalogen / Verzeichnissen und Suchmaschinen. Die ältere der beiden Formen der Informationssuche im Netz stellen die Webverzeichnisse dar.

2.1 Webkataloge und Verzeichnisse

Webkataloge charakterisieren sich durch die Tatsache das der Datenbestand per Hand eingegeben bzw. nach der Eingabe durch den User, der Vorschläge zur Aufnahme von Webseiten etc. machen kann, per Hand geprüft und zugelassen wird. Dadurch entsteht ein qualitativ (relativ) hochwertiges Archiv das nach Interessengruppen / Kategorien sortiert werden kann.

2.1.1 WWW

Abbildung in dieser Leseprobe nicht enthalten

Die Art von Webkatalogen die am weitesten verbreitet sind und am Meisten genutzt werden sind diejenigen, die Webseiten wie private, kommerzielle und andere Homepages auflisten. Sehr bekannte Beispiele hierfür sind z.B. www.Yahoo.de oder www.Web.de.

Oberfläche von www.Yahoo.de

Das Interface zu Webkatalogen gleicht eigentlich dem jeder anderen Suchmaschine, jedoch kann man andere Suchergebnisse erwarten. Wie bei normalen Suchmaschinen auch gibt man einen oder mehrere Suchbegriffe als Stichwort oder mit Hilfe von speziellen Operatoren als komplexere Suchmaske ein und bekommt eine Liste von Treffern präsentiert.

Zusätzlich bieten Webkataloge jedoch auch die Möglichkeit in Kategorien wie Bildung & Ausbildung, Nachrichten & Medien und vielem mehr zu ,,stöbern". Zwar bieten das reine Suchmaschinen inzwischen auch, jedoch nur mit qualitativ niedrigerem Inhalt da sich Suchmaschinen auf die Angaben der User verlassen müssen.

Dadurch das bei Webkatalogen die Daten vor der Aufnahme in den Bestand von Menschen per Hand geprüft werden ist der Umfang der gebotenen Daten im direkten vergleich zu Suchmaschinen eher gering. Ebenfalls kann man davon ausgehen das die Aktualität der Inhalte immer etwas zurückliegt da für die Aufnahme einer Seite in den Bestand oft mehrere Tage vergehen. Doch gerade diese handverlesene Auswahl an Seiten sichert die Qualität der Inhalte.

2.1.2 Telefonnummern / Adressen

Im Laufe der Zeit wurde es auch möglich nach Adressen und Telefonnummern im Netz zu suchen. Dies geschieht ebenfalls auf Katalogbasis da es rechtlich nicht vertretbar wäre eine Suchmaschine automatisch Adressen und Nummern ihrem Index hinzufügen zu lassen.

Abbildung in dieser Leseprobe nicht enthalten

Inzwischen, da es auch verschiedene Telefonanbieter in Deutschland gibt, hat sich die Zahl der Telefonnummern und Adressensuchdienste im Netz erhöht. Bekanntestes Beispiel für eine Telefonauskunft im Internet ist www.Telefonbuch.de , welche auf dem frei erhältlichen Telefonbuch für Deutschland basiert. Das Branchenverzeichnis ,,Gelbe Seiten" gibt es ebenfalls in vielfacher Ausführung, unter www.GelbeSeiten.de findet man die offizielle Version. Jedoch entwickelt sich heutzutage ein Trend in Richtung Portale, welche spezialisiert auf ein bestimmtes Fachgebiet eingehen.

Oberfläche von www.Telefonbuch.de

2.1.3 Portale

Portale bilden eine spezielle Ausprägung von Webkatalogen bzw. Verzeichnissen und gelten als Einstiegspunkte in das WWW.

Meistens versucht ein Portal sich einem bestimmten Thema zuzuordnen und dann so viele Seiten wie möglich zu diesem Thema zusammenzutragen (sogenannte Nischenportale.) Die Art von Portalen kann ebenfalls vielfältig ausfallen. Viele Portale bilden sogenannte Communities, die weit mehr Möglichkeiten bieten als eine reine Auflistung und Suche in einem bestimmten Themengebiet.

Einen großen Teil der bekanntesten Portale bilden E-Commerce Portale die nochmals in horizontale Portale und vertikale Portale unterschieden werden können. Horizontale Portale kann man allgemein als Dienste definieren, die große Mengen von wiederkehrendem Traffic (Abruffrequenz einer Internetseite) erzeugen und hierfür verschiedene weitgefächerte Funktionalitäten anbieten. Beispiele hierfür sind der Internetprovider AOL ( www.aol.com ) oder Yahoo! ( www.yahoo.com ), ursprünglich als reine Internetsuchmaschine konzipiert. Inzwischen bieten AOL und Yahoo! ein breites Spektrum von Internetdienstleistungen an.

Vertikale Portale sind hingegen virtuelle Orte an denen spezifisch ausgerichtete Inhalte dargestellt werden. Dies steht im Gegensatz zu den horizontalen Portalen, die eine Vielzahl von verschiedenen Dienstleistungen anbieten. Diese vertikalen Electronic Business Commerces (ECBs) sind vor allem auf die Entwicklung eines Markennamens konzentriert, was zu einem Wachstum der Seitenbesucherzahl und dadurch zu einem festen Kundenstamm führen soll. Ein Beispiel hierfür ist der virtuelle Buchhandel Amazon ( www.amazon.de .)

Abbildung in dieser Leseprobe nicht enthalten

Oberfläche von www.Amazon.de

2.1.4 E-Mail

Ähnlich wdch dem Datenbestand einer Datenbank, ohne Zustimmung der Personen die Eigentümer der Adresse sind, hinzugefügt werden. Daher entstanden zu diesem Zweck manuell erstellte Verzeichnisse wie www.Email-Verzeichnis.de .

Genau wie bei der Onlinesuche in den Gelben Seiten oder dem Telefonbuch lässt sich hierbei nach Nachnamen, Ort, Postleitzahl und Land suchen, jedoch lassen die wenigsten Web-Nutzer ihre E-mailadresse in ein solches Verzeichnis eintragen und die Trefferquote ist, jedenfalls was den privaten Bereich betrifft, recht gering.

2.2 Suchmaschinen

Die Haupteigenschaft die Suchmaschinen von Webverzeichnissen unterscheidet ist, dass der Datenbestand größtenteils automatisch aktualisiert und hinzugefügt wird. Meist geschieht das durch sogenannte Robots oder Spider:

Eine HTML-Seite wird geladen und einer Inhaltserschließung unterzogen. Danach werden alle von dieser HTML-Seite referenzierten Dokumente geladen und wieder das gleiche Prinzip angewendet. Da dieses rekursive Verfahren automatisierbar ist, wird auch von einem maschinellen bzw. roboterbasierten Verfahren gesprochen.

2.2.1 WWW

In den letzten Jahren wurden diverse Suchmaschinen in Betrieb genommen, deren Roboter große Teile des Webs laufend abarbeiten. Die zugehörigen Volltextindizes oder auch nur Teilindizes der Dokumente werden in Datenbanken gespeichert. Diese Datenbanken bilden die Grundlage für die Suchmaschinen bzw. Suchserver, die über Benutzerschnittstellen mit diversen Abfrageformularen die Suche nach WWW- Dokumenten ermöglichen.

Abbildung in dieser Leseprobe nicht enthalten

Heutzutage gehören WWW Suchmaschinen zu unersetzlichen Werkzeugen im Netz. Neben Portalen bilden sie oft die erste Anlaufstelle für die Navigation im Internet. Im Laufe der Zeit haben sich in den größten internationalen Suchmaschinen unglaubliche Datenmengen angesammelt. Eine der Größten ist Altavista ( www.altavista.com ) mit über 250 Millionen Webseiten im Index.

Oberfläche von www.Altavista.com

Diese Größe erreichen Suchmaschinen nicht allein durch roboterbasierte Akquisition von Seiten. Inzwischen hat auch der Benutzer die Möglichkeit eigene Vorschläge für die Aufnahme in den Index einzubringen. Anders als bei Webkatalogen erfolgt hier lediglich die Prüfung ob die angemeldete Adresse auch wirklich existiert. Den Rest der Arbeit übernehmen dann wieder die Robots, welche genau wie mit den anderen Seiten diese Seite nach Inhalten scannen und deren Links weiterverfolgen.

Der Vorteil dieses Vorgangs ist, das der Datenbestand einer Suchmaschine stets von außen aktuell gehalten werden kann. Um der Suchmaschine zu helfen die Inhalte der eigenen Seite besser zuordnen zu können werden meistens Meta-tags abgefragt die sich innerhalb der HTML Dokumente befinden (siehe 3.3.)

Allerdings hat das Verfahren dieser rekursiven Indizierungsmethode auch Nachteile. Wenige Suchmaschinen beherrschen den Umgang mit Frame-Dokumenten außerhalb der Startseite da von Dokumente aus ,,tiefer" liegenden Frames nicht in Zusammenhang mit zugehörigen Framebereichen gebracht werden können.

Links die über die CGI Schnittstelle erfolgen sind ebenfalls für Suchmaschinen nicht nachvollziehbar da oft mehrere Bedingungen erfüllt sein müssen die vom Benutzer selbst ausgelöst werden um an eine bestimmte Stelle gelinkt zu werden.

Nicht verlinkte Dokumente die zwar auf WWW Servern liegen aber auf die nicht verwiesen wird können nicht aufgespürt werden da in der Regel der Zugriff auf die Auflistung des Verzeichnisinhaltes verwehrt wird.

Zugriffsgeschützte und dynamische Dokumente sind ebenfalls nicht erreichbar für Suchroboter da sie eine Passworteingabe erfordern bzw. erst nach bestimmten Vorgaben zusammengesetzt werden.

Sogenannte ,,Roboter-Exclusion-Standards" können ein weiteres Vordringen des Suchroboters ebenfalls verhindern. Im jeweiligen Verzeichnis des WWW Servers befindet sich dazu eine Datei namens ,,robots.txt" in denen die Serverbereiche spezifiziert sind die vom Roboter nicht erreicht werden dürfen. Die meisten Suchroboter halten sich an diese Regelung, es gibt jedoch Ausnahmen.

2.2.2 Usenet

Die Hierarchie des Usenets (Newsgroups), welche Themenzuordnungen vorweg nimmt, reicht schon lange nicht mehr aus um den Überblick über die verschiedenen Newsgroups bzw. deren Beiträge zu behalten. Durch die hohe Aktivität in Newsgroups werden dort aktuelle Fragen und Themen oft früher besprochen als Webseiten zum jeweiligen Thema auf dem aktuellen Stand sind. Eine Suche nach Problemlösungen bietet sich in Newsgroups deshalb an.

Einige Suchmaschinen unterstützen die Suche nach Newsgroupartikeln, jedoch ist man mit spezialisierten Suchdiensten wie www.Deja.com besser beraten. Das Archiv von länger zurückliegenden Artikeln ist bei spezialisierten Suchmaschinen oft größer und die Suchmethoden sind auf das Usenet abgestimmt was zu besseren Ergebnissen führt. Mitunter wird dem Benutzer auch die Möglichkeit geboten selbst Beiträge ins Usenet abzusetzen (zu ,,posten") um Antworten von anderen Teilnehmern zu erhalten.

Oberfläche der www.Deja.com Newsgroupsuche und Suchergebnisse

Ein weiterer wichtiger Bestandteil von Newsgroups sind die FAQ (Frequently Asked Questions), die am Häufigsten gestellten Fragen. Annähernd jede gut geführte Newsgroup bietet diese Ansammlung von Fragen und Antworten um immer wiederkehrenden Fragen von Neulingen dieser Gruppe vorzubeugen. So ist es mit Hilfe von Suchmaschinen möglich diese FAQ Listen ausfindig zu machen und somit schnelle Hilfe zu bekommen.

2.2.3 FTP

Ausgehend von dem ursprünglichen Netz der Archie-Server sind verschiedene FTP Suchmaschinen entstanden. Diese bieten Überblick über einen großen Bestand an FTP Servern und deren Verzeichnisinhalten die in regelmäßigen Abständen kontaktiert, abgefragt und in den Datenbestand aufgenommen werden. FTP Suchmaschinen nutzen allerdings eher, wenn man eine relativ genaue Vorstellung hat nach welcher Datei man sucht. Bis auf Verzeichnisinhalte und den Volltextinhalt von Textdateien auf den Servern werden nämlich kaum Informationen gespeichert.

Durch die Möglichkeit der Automatisierung sind FTP Server stets aktuell und verwaiste Links auf nicht mehr vorhandene Dateien sollten seltener vorkommen als bei gewöhnlichen WWW Suchdiensten. Ein weiterer Vorteil der FTP Suche ist, dass ein kompletter Verzeichnisinhalt erschlossen wird und nicht nur Verweise innerhalb von HTML Dokumenten. Dadurch wird der Datenbestand eines FTP Servers komplett indiziert.

Die bekannteste FTP Suchmaschine mit über 100 Millionen Dateien im Index befindet sich seit einiger Zeit im ,,Besitz" von Lycos, welche noch weitere Suchdienste anbieten (unter anderem auch eine der größten WWW Suchmaschinen.) Sie bietet neben einer vereinfachten Suche auch die Möglichkeit auf ,,klassische" Art mit sehr vielen Parametern die Suche nach der gewünschten Datei einzuschränken und zu beeinflussen (http://ftpsearch.lycos.com .)

Abbildung in dieser Leseprobe nicht enthalten

Oberfläche von http://ftpsearch.lycos.com

2.2.4 Metasuchmaschinen

Der Sinn von Metasuchmaschinen ist es parallel in den Archiven von anderen großen Suchdiensten zu suchen um so ein breiteres Spektrum an Informationsbeständen abzudecken und dem Benutzer mehr Treffer zu ermöglichen (Beispiele: www.MetaGer.de, www.Dogpile.com, www.SavvySearch.com )

Die Vorteile hierbei sind die größere Abdeckung und das Vereinen der Datenbestände vieler Suchmaschinen auf einer Oberfläche. Vorraussetzung ist jedoch meistens das die Suche nicht allzu spezialisiert sein darf. Die Nachteile von Metasuchmaschinen sind, gerade durch die Nutzung vieler verschiedener Suchdienste, weniger flexible Suchoperatoren, auch oft die Anzeige doppelter Treffer oder die Einbindung weniger leistungsstarker und wenig treffsicherer Suchmaschinen. Hier ist es widerum oft möglich, die Suchdienste die zur Meta-Suche benutzt werden selbst auszuwählen (siehe Bild)

Abbildung in dieser Leseprobe nicht enthalten

Suchdiensteauswahl von www.MetaGer.de

3 Suchmethoden

3.1 Bedienung von Suchmaschinen

Suchmaschinen sind von vornherein so gestaltet, dass die Bedienung sehr benutzerfreundlich ausfällt. Für eine einfache Stichwortsuche genügt die Eingabe von einem oder mehreren Suchbegriffen. Wenn jedoch Einschränkungen wie Ausschluss von bestimmten Begriffen oder zwingendes Vorkommen bestimmter Wortteile etc. getroffen werden müssen, bieten Suchmaschinen meist eine große Anzahl an Operatoren die, im Eingabefeld für den Suchbegriff eingegeben, die Suche unterstützen und präzisieren.

Normalerweise handelt es sich hierbei um Boolesche Operatoren wie AND, OR, NOT oder + und - (gleiche Bedeutung wie AND und NOT), jedoch gibt es von Suchmaschine zu Suchmaschine unterschiedlich auch spezielle Möglichkeiten der erweiterten Suche.

Beispiel: www.Altavista.com bietet Methoden an um den Ursprung der Suchergebnisse einzugrenzen.

Der Parameter domain: gefolgt von einer Länderkennung wie DE oder UK etc. wird nur Suchergebnisse liefern die auf Seiten mit dieser Länderkennung liegen. Domain:uk +london als Suchbegriff eingegeben würde Verweise auf Seiten mit der Endung .uk liefern die das Wort london zwingend beinhalten.

Der Parameter url: liefert Ergebnisse die ein bestimmtes Wort oder eine bestimmte Phrase in der URL (Internetadresse) enthalten.

url:amazon erzeugt Suchergebnisse auf Seiten wie www.amazon.com,

www.amazon.de, www.1-800-amazon.com etc.. Das Wort amazon ist in der URL zwingend enthalten.

Da das Erlernen oder verwenden dieser Operatoren für viele zu umständlich oder

unverständlich ist, haben die meisten Suchmaschinen eine ,,Advanced Search" oder ,,Power Search" eingeführt, bei denen man mit Hilfe von Pull-Down Menüs die Eigenschaften der Suche genau definieren kann. Der Rahmen des Suchumfanges wird dadurch verkleinert und bei richtiger Anwendung dieser erweiterten Suche erhält man ebenfalls bessere Treffer als bei normaler Stichwortsuche.

Abbildung in dieser Leseprobe nicht enthalten

Oberfläche von Altavista ,,Powersearch"

Inzwischen kommt es auch oft vor das größere Suchmaschinen extra ,,Abteilungen" der Homepage bieten die speziell nach Bildern, Tönen oder Video suchen können, was die Suche noch weiter vereinfacht.

3.2 Wie finde ich was ich suche?

Trotz oder gerade wegen des unwahrscheinlichen Informationsumfanges auf den man mit Hilfe von Suchmaschinen zurückgreifen kann, ist eine gute Trefferquote von der richtigen Suchstrategie und der richtigen Bedienung der Suchmaschine abhängig.

Wenn man eine ziemlich genaue Vorstellung von dem hat, was man sucht, ist es empfehlenswert Stichworte die eng mit gerade diesem gesuchten Thema zusammenhängen aneinander zu reihen.

Der Einsatz von Booleschen Operatoren (AND, OR, NOT bzw. +, -), Anführungszeichen zum Definieren eines Strings aus verschiedenen Begriffen, Jokerzeichen (Wildcards) wie * oder Klammern verfeinert die Suche erheblich und ermöglicht präzises Auffinden von Informationen.

Beispiele:

+"James Bond" -film*

- liefert Ergebnisse welche die Phrase ,,James Bond" enthalten, jedoch nicht das Wort ,,film" und Abwandlungen des Wortes wie ,,Filmvorführung" oder ,,Filme"

(Mona AND Lisa) OR (Louvre AND Frankreich)

- liefert Ergebnisse die entweder die Wörter ,,Mona" und ,,Lisa" oder die Wörter ,,Louvre" und ,,Frankreich" enthalten.

Bei allgemeineren Fragen zu einem Thema, beispielsweise ,,Wie funktioniert die menschliche Lunge?" erreicht man die besten Resultate indem man genau diese Frage ohne jegliche Operatoren einfach als Suchbegriff eingibt. Die leistungsstarken Suchalgorithmen der Suchmaschinen finden mit den im Fragesatz enthaltenen Informationen sehr oft extrem treffsichere Ergebnisse.

Es bietet sich auch an bei bestimmten Themen spezialisierte Suchmaschinen zu benutzen. Diese haben oft einen auf ihr Gebiet abgestimmten Suchalgorithmus und sind deshalb dem Thema entsprechend nützlicher. Auch ist es zu empfehlen Suchmaschinen zu benutzen deren Suchalgorithmus auch wirklich leistungsstark ist. Manche Suchmaschinen liefern trotz präziser Suchmaske ungenaue Ergebnisse. Allerdings sollte man sich da auf seine eigenen Erfahrungen verlassen.

3.3 Wie suchen Suchmaschinen?

Das Verfahren allgemein könnte man in drei Schritten teilen.

Das erste wichtige Teil der Suchmaschine ist jener, welcher sich mit der Aktualisierung und Akquisition von Seiten befasst. Meist nennt man (wie schon in 2.2 genannt) diese Dienste Robot oder Spider. Der robot besucht die Web Seiten in regelmäßigen Abständen und wobei er die Seiten und auch die damit verbundenen Links "ließt". Zusammenfassend kann man also sagen, daß der Robot dafür verantwortlich ist, festzustellen, ob es Änderungen auf einer Seite gegeben hat.

Der zweite Komponent der Suchmaschine ist der Index, oder auch Catalog. Den Index kann man sich wie eine große Tabelle vorstellen, welche die Schlüsselwörter der Seiten enthält die der Robot gefunden hat. Dementsprechend muß der Index also auch immer erneuert werden, wenn der Robot eine Änderung einer Seite entdeckt. Bevor Neuerungen nicht im Index enthalten sind, stehen sie der Suchmaschine auch nicht zur Verfügung, können also nicht über die Suchmaschinen gefunden werden.

Der letzte Teil der Suchmaschine ist die Software der Suchmaschine selbst. Diese Software durchsucht alle Schlüsselwörter im Index, wenn ein Suchbegriff eingegeben wird. Das heißt, daß die Software versucht die im Index vorhandenen Begriffe mit dem Suchbegriff anhand eines leistungsstarken Algorithmus in Zusammenhang zu bringen und gleichzeitig auch eine Platzierung (Ranking) nach Trefferquote vorzunehmen.

3.4 Vor- und Nachteile

Die Vorteile von Suchmaschinen und Webkatalogen allgemein liegen auf der Hand. Eine überaus schnelle und meist zielsichere Navigation durch den riesigen Datenbestand des Internets wird möglich.

Vorteile, die Suchmaschinen gegenüber Webverzeichnissen und Katalogen haben:

Suchmaschinen sind aktueller und verfügen über einen größeren Datenbestand.

Darüber hinaus haben sie keine ,,Meinung", was die eventuelle Zensur von vornherein ausschließt. Keine Seite, die angemeldet oder besucht wird, wird auf ihren Inhalt kontrolliert. Der Nachteil hierbei ist natürlich, das somit auch keine Qualitätskontrolle stattfindet. Irreführende Links, falsche ,,Versprechungen" vom Titel ausgehend und illegale Seiten tauchen weitaus häufiger auf als bei handverlesenen Webkatalogen. Eine Interessensortierung ist nur bedingt möglich.

Hier liegen die klaren Vorteile von Webverzeichnissen. Selbst wenn man keine genaue Vorstellung davon hat was man genau sucht, kann man sich anhand von Kategorien in die richtige Richtung lenken. Auch wenn die Qualität der Suchergebnisse vom Inhalt her besser zu sein scheint muß jedoch keine zwingende Qualitätskontrolle bei Webkatalogen vorliegen. Oft wird nur geprüft ob der angegebene Inhalt tatsächlich vorhanden ist, nicht wie gut er ist.

3.5 Andere Wege der Informationsbeschaffung

Neben reinen Suchmaschinen und Katalogen hat der Nutzer auch die Möglichkeit auf spezielle Datenbanken wie Pressearchive (z.B. http://recherche.newsaktuell.de) zurückzugreifen. Eine Tendenz zu intelligenten Suchagenten ist ebenfalls zu erkennen. Hierbei handelt es sich meist um Menschen die mit der Suche nach einem Thema beauftragt werden und nach einem bestimmten Zeitraum sehr effektive Suchergebnisse liefern können (z.B. www.ClickFish.de .)

Selbst Geld lässt sich mit der Suche und dem Angebot von Informationen schon verdienen. Das neu aufkommende Informationsbrokerage, bei dem eine Person Geld für die gesuchte Information bietet und andere, die im Besitz dieser Information sind, dafür bezahlt werden (www.hurra.de), sowie die Bezahlung für das Bereitstellen seiner Meinung zu bestimmten Produkten (www.Ciao.com, www.Yopi.de) sind Beispiele für Informationsmarketing.

Ebenfalls ein boomender Informationspool im Netz: Kurznachrichten, Klatsch und Tratsch. Unterhaltungsbasierte, aktuelle Informationen werden von vielen Diensten im Internet wie www.ShortNews.de oder www.Express.de geboten oder das bestehende Angebot eines Printmediums wie der BILD-Zeitung wird durch ein Onlineangebot erweitert (www.Bild.de .)

Schlusswort

Die Bedeutung von Suchmaschinen, Webkatalogen oder anderen Instrumenten der Informationsbeschaffung im Internet nimmt immer mehr zu. Durch das immense Wachstum des WWW steigt der Wunsch nach Ordnung und Übersicht. Ich denke das die Tendenz in Sachen Informationsmanagement im Netz in Richtung spezialisierter Portale bzw. intelligenten Agenten geht. Zwar werden reine Suchmaschinen immer unerlässlich sein und Webkataloge ebenfalls von großer Bedeutung doch wird vor allem die spezialisierte Informationssuche in die Hände von fachspezifischen Diensten fallen.

Quellen:

,,Wie groß ist und wird das Internet?" http://www.geog.uni-heidelberg.de/~ttavk/infos02.htm

,,UNDERSTANDING AND COMPARING WEB SEARCH TOOLS" http://web.hamline.edu/administration/libraries/search/comparisons.html

"Search Engine Watch: Tips About Internet Search Engines & Search Engine Submission" http://searchenginewatch.com/

"Literature about search services" http://www.ub2.lu.se//desire/radar/lit-about-search-services.html

Wie findet man Informationen im Netz? http://www.suchfibel.de

Altavista www.altavista.com

DEJA

www.Deja.com

Lycos www.Lycos.com

sowie alle weiteren genannten Internetadressen und Suchdienste.

Ende der Leseprobe aus 18 Seiten

Details

Titel
Suchen im Netz - Informationbeschaffung im Internet
Hochschule
Technische Hochschule Wildau, ehem. Technische Fachhochschule Wildau
Veranstaltung
Einführung in die Telematik
Autor
Jahr
2001
Seiten
18
Katalognummer
V98940
ISBN (eBook)
9783638973908
Dateigröße
545 KB
Sprache
Deutsch
Schlagworte
Suchen, Netz, Informationbeschaffung, Internet, Einführung, Telematik
Arbeit zitieren
Henri Schmidt (Autor:in), 2001, Suchen im Netz - Informationbeschaffung im Internet, München, GRIN Verlag, https://www.grin.com/document/98940

Kommentare

  • Gast am 25.3.2002

    Ziemlich gut.

    Ich finde den Vortrag gut strukturiert und inhaltlich durchdacht.

Blick ins Buch
Titel: Suchen im Netz - Informationbeschaffung im Internet



Ihre Arbeit hochladen

Ihre Hausarbeit / Abschlussarbeit:

- Publikation als eBook und Buch
- Hohes Honorar auf die Verkäufe
- Für Sie komplett kostenlos – mit ISBN
- Es dauert nur 5 Minuten
- Jede Arbeit findet Leser

Kostenlos Autor werden