Lade Inhalt...

Suchmaschinen im Internet. Entwicklung und Bedeutung von Google

Hausarbeit 2015 23 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

1 Einleitung

Mit der rasanten Entwicklung des Internets, des Web 2.0 sowie dem Einzug von Facebook, YouTube, Twitter etc. ist das Internet kein reines Speichermedium mehr, sondern wächst immer weiter. Um sich in der komplexen und großen Vielfalt zu Recht zu finden, werden Suchmaschinen genutzt, mit denen das Internet durchsucht und Ergebnisse selektiert werden können. Diese Technologie ist seit Beginn des Internets sehr beliebt und gehört zu den meistgenutzten Anwendungen. Ohne die einfache Volltextsuche ist der Zugang zu den Informationen im Internet heute kaum noch möglich.

Das Unternehmens Google Inc. hat in nur wenigen Jahren eine noch rasantere Entwicklung als das Internet durchgemacht und sich innerhalb kurzer Zeit im Suchmaschinenmarkt als Marktführer behauptet. Der Name Google wird heutzutage synonym für die Online-Suche genutzt. Global dominiert Google in fast allen Ländern den Suchmaschinenmarkt.[1] Um seinen Marktanteil zu behaupten und weiter auszudehnen, entwickelte Google seit Unternehmensgründung zahlreiche innovative Anwendungen, wie z.B. Google Mail und Google Maps, die neben der Suche weitere Dienstleistungen im Internet abdecken. Des Weiteren bietet Google einen eigenen Internetbrowser mit Namen Chrome und nimmt Beteiligungen an anderen Unternehmen wahr.

In der folgenden Arbeit soll die Entwicklung und Bedeutung von Google beleuchtet werden. Dazu wird zu Beginn in Kapitel 2 auf die Geschichte sowie die allgemeine Funktionsweise von Suchmaschinen eingegangen. Danach wird die Entwicklung der Suchanfragen, die mit Google getätigt wurden, dargestellt sowie die weltweite und regionalen Marktanteile aufgezeigt Im Weiteren Verlauf erfolgt in Kapitel 3 ein Einblick auf die Funktionsweise sowie Gründung des Unternehmens Google Inc.. Anschließend werden einige Produkte und Dienste, die von Google angeboten werden aufgezeigt. Zuletzt erfolgt ein Fazit dieser Arbeit.

2 Entwicklung der Suchmaschinen

Suchmaschinen gehören zu dem meistbenutzten Internet-Medium für Privat- und Geschäftszwecke und sie sind aus dem Alltag nicht mehr wegzudenken. Seit Entstehung der ersten Technologien zur Informationssuche, wurden immer neue Suchmaschinen entwickelt. Im Folgenden soll die Geschichte der Suchmaschinen näher betrachtet und anschließend die Funktionsweise von Suchmaschinen erläutert werden. Zum Ende des Kapitels erfolgt eine Darstellung, welche Suchmaschine weltweit, in Deutschland und den USA (United States of America) am Häufigsten genutzt wird.

2.1 Geschichte der Suchmaschinen

Die Geschichte der Suchmaschinen begann ab den 1950er Jahren mit den automatischen Suchverfahren in Datenbanken, die durch den Fachbereich des IR (Information Retrieval) erstellt wurden. In den 1970er Jahren gab es die ersten wirtschaftlichen Systeme namens Orbit, BRS und Dialog. Diese stellten einen elektronischen Zugriff auf Fachzeitschriften-Indizes für Bibliotheken bereit. Im privaten Sektor wurden diese Techniken kaum genutzt. Erst mit der Nutzung des Internets im Privatbereich sind die Suchmaschinen, wie sie heute existieren, entstanden.

Durch die Abspaltung des zivilen Internets und dem Militär mit ARPANet im Jahr 1983, stieg die Anzahl an zugänglichen Hosts und dadurch ebenso die Anzahl an verfügbaren Informationen stark an. Damit wurde die Möglichkeit sich einen Überblick zu verschaffen, ohne die Nutzung automatisierter Methoden nicht mehr möglich. Zur selben Zeit wurden zum Speichern oder zum Abrufen von Inhalten größtenteils Gopher- und FTP (File Transfer Protocol)-Server genutzt. Über dem sog. Gopherspace konnten Textinformationen über vorgegebene Adressen abgerufen werden. Bilder und Hyperlinks gab es, ähnlich wie im WWW (World Wide Web), noch nicht.

Die erste Suchmaschine im Internet wurde im Jahr 1990 erstellt und hieß Archie. Diese war dahingehend eingeschränkt, dass nur die Indexierung von FTP-Servern möglich war. Erst mit der Suchmachine Veronica wurde ab 1993 die Suche über Gopher-Server und in den eigentlichen Inhalten möglich. Im Jahr 1993 wurde der WWW-Standard zum freien Gebrauch veröffentlicht und führte zu einem Anstieg der verfügbaren Inhalte mit diesem Standard. Matthew Gray (Massachusetts Institute of Technology) entwickelte im selben Jahr den ersten Crawler namens The Wanderer. Mit diesem konnten unterschiedliche Seiten im WWW aufgerufen und dessen Inhalte gesichert werden, so dass eine Suche nach Volltexten möglich wurde.[2]

Mit Altavista kam im Jahr 1995 eine Suchmaschine auf den Markt, die im Vergleich zu Anderen, sehr leistungsfähig und einfach in der Bedienung war. Dadurch wurde Altavista schnell zu einem der erfolgreichsten Suchmaschinen im Internet. Bereits nach einem Jahr kannte Altavista über 30 Mio. Internetseiten und Ende 1997 wurden täglich um die 20 Mio. Suchanfragen verarbeitet. Dies führte dazu, dass der Marktanteil von Altavista in kurzer Zeit auf 54 Prozent anstieg. Auf Grund einer Strategie der Gründer, über Bannerwerbung Geld zu verdienen, begann der Niedergang von Altavista.[3] Die Gründung der Suchmaschine Google erfolgte im Jahr 1998. Der ursprüngliche Algorithmus wurde von den Informatik-Doktoranden Sergey Brin und Larry Page an der Universität Stanford programmiert. Zu Beginn gab es kein Geschäftsmodell, wie mit der Suche Gewinne erzielt werden könnte. Im Gegensatz zu anderen Anbietern legte Google anfänglich den Fokus nicht auf die Portalentwicklungen, sondern auf die kontinuierliche Weiterentwicklung der Suchfunktion. Diese Strategie galt zu jener Zeit nicht als Ökonomisch, führte aber zu einer hohen Popularität.[4] Auf die Funktionsweise und Gründung von Google wird in Kapitel 3 näher eingegangen.

2.2 Funktionsweise von Suchmaschinen

Das Primärziel von Suchmaschinen ist das Angebot vielfältiger und interessanter Informationen, auf die einfach zugegriffen werden kann. Bei allen Suchmaschinen erfolgt die Suchabfrage über Stichworte oder Kategorien auf der Website des Anbieters. Dabei erfolgt die Durchsuchung der Suchmachinen-Datenbank.

Das ständige Sammeln von Dokumenten aus dem Internet erfolgt mit besonderen Browserprogrammen, den sog. Spidern, Searchbots oder Crawlern. Diese Programme übernehmen beim Besuch von Seiten teilweise oder gesamte Seiteninhalten, bereiten diese für die weitere Verwendung auf und speichern diese. Des Weiteren prüft der Spider, ob die bereits vorhandenen Dokumente sich verändert haben bzw. noch bestehen. Die Qualität ihrer Daten stellt die Suchmaschine sicher, indem der eigene Datenbestand ständig mit den vorliegenden Daten von Webseiten verglichen wird. Der Suchmachinenanbieter legt die Häufigkeit dieser Spideraktivitäten anhand verschiedener Kennzeichen fest. Nach der Speicherung der Daten durch den Spider, erfolgt eine Aufbereitung für die automatisierte Keywortanalyse. Dieser Prozess entfernt aus den gespeicherten Daten alle irrelevanten Texte, wie z.B. Programmcodes. Der restliche Teil wird für die weitere Verwendung in ein standardisiertes Datenformat überführt und beinhaltet damit relevante Informationen über Struktur sowie Format. Nach der Ermittlung und Gewichtung der Keywörter werden diese für das Dokument gesichert und bilden die Grundlage für die Indexierung.[5]

2.3 Marktanteile

Die häufigsten Suchanfragen werden von zu Hause getätigt und es werden hauptsächlich Suchmaschinen der vier großen Anbieter Microsoft, Yahoo, Google und AOL, genutzt. User bleiben zumeist bei der Suchmaschine mit der sie begonnen haben und wechseln eher selten. In den vergangenen Jahren haben sich die Marktanteile der großen Anbieter ein wenig verändert, aber Google ist, trotz durchgeführter Suchverbesserungen von Microsoft und Yahoo, International der Marktführer.[6]

Im weltweiten Vergleich, aus dem Jahr 2014, weist Google mit einem Marktanteil von 71 % den höchsten Wert auf. An zweiter Stelle folgt die chinesische Suchmaschine Baidu mit einem Anteil von 15,6 %. Die Suchmaschinen von Yahoo und Microsoft (Bing) sind jeweils mit 6,1 % und 5,9 % sehr weit abgeschlagen (s. Abbildung 1).[7]

Abbildung in dieser Leseprobe nicht enthalten

Quelle: Eigene Abbildung nach: (Maier, 2014)

Abbildung 1: Suchmaschinen Marktanteile Weltweit 2014

Auch in einem Vergleich zwischen Deutschland und den USA wird deutlich, dass Google den Suchmaschinenmarkt dominiert. In Deutschland lag der Anteil von Google im ersten Quartal 2014 bei 90,5 %. Die Suchmaschine von Microsoft wurde im selben Zeitraum mit einem Anteil von 3,2 % und Yahoo mit nur 1,6 % relativ wenig genutzt.

Abbildung in dieser Leseprobe nicht enthalten

Quelle: Eigene Abbildung nach: (Rosenbusch, 2014)

Abbildung 2: Suchmaschinen Marktanteile Deutschland 2014

Auf dem amerikanischen Markt sieht die Dominanz von Google sehr ähnlich aus, allerdings nicht mit einem so hohen Wert wie in Deutschland. So wurde die Suchmaschine von Google im ersten Quartal 2014 zu 66,7 % genutzt. An zweiter Stelle stand die Suchmaschine von Microsoft mit einem Anteil von 18,2 %. Auch Yahoo wies einen höheren Anteil mit 11,2 % als in Deutschland auf. Der Marktanteil von AOL lag immerhin noch bei 1,4 % in den USA.[8] In Deutschland hingegen lag der Anteil von AOL Ende des Jahres 2014 bei 0,14 % und wurde damit so gut wie gar nicht genutzt.[9]

Abbildung in dieser Leseprobe nicht enthalten

Quelle: Eigene Abbildung: (Rosenbusch, 2014)

Abbildung 3: Suchmaschinen Marktanteile USA 2014

Die Devise von Google war immer schon die Globalisierung. Seit dem Jahr 2000 wird die Suchmaschine in verschiedenen Sprachen angeboten. So existiert diese mittlerer weile in 136 Sprachen.[10] Trotz der Internationalisierungsstrategie gibt es Länder, in denen Google nicht an erster Stelle steht. So wird z.B. in Russland die landeseigene Suchmaschine Yandex am Häufigsten genutzt und war 2014 mit ca. 53 % Marktanteil wesentlich beliebter als Google mit ca. 34 %.[11] Es wird angenommen, dass Yandex mit der kyrillischen Schrift und der russischen Sprache besser zu Recht kommt als Google.[12] In China spielt die Suchmaschine von Google mit 1,65 % Marktanteil in 2014 kaum eine Rolle. Am Häufigsten wird die landeseigene Suchmaschine Baidu genutzt. Ihr Anteil lag im ersten Quartal 2014 bei 60,47 %.[13] Der niedrige Anteil von Google lässt sich auf dem Rückzug aus dem chinesischen Markt im Jahr 2010 zurückzuführen. Die Gründe hierfür liegen u.a. in der staatlichen auferlegten Zensur.[14]

3 Entwicklung und Bedeutung von Google

Wie in Kapitel 2 aufgezeigt wurde, dominiert Google den Suchmaschinenmarkt weltweit, insbesondere in Deutschland und den USA.

In diesem Kapitel sollen die Suchmaschine und das Unternehmen Google Inc. beleuchtet werden. Dazu wird in Kapitel 3.1 aufgezeigt, was das Besondere an Google`s Suchalgorithmus und wie das Unternehmen hinsichtlich der Hard- und Software aufgestellt ist. Anschließend erfolgt in Kapitel 3.2 eine Unternehmensbetrachtung. Dazu wird als Erstes auf die Gründung der Google Inc. eingegangen. Anschließend erfolgt ein Einblick in das Finanzierungsmodell und es wird aufgezeigt welche Dienste Google neben der eigentliche Suche noch anbietet.

3.1 Informationstechnologie von Google

Der Programmcode des Suchalgorithmus ist das bestgehütete Geheimnis eines jeden Suchmaschinenanbieters, ebenso wie die Aufstellung seiner Hard- und Software.

Die Funktionsweise des Suchalgorithmus von Google wird im Folgenden dargestellt. Anschließend wird aufgezeigt, wie die Rechenzentren aufgestellt sind und welche Softwareprogramme grundlegend genutzt werden.

3.1.1 Suchalgorithmus

Die Basistechnologie von Google ist ein Suchalgorithmus mit Namen PageRank. Dieses war die erste Suchmaschine, die neben der Suche nach Texten und Worten, auch nach gegenseitigen Empfehlungen von anderen Internetseiten suchen konnte. Die Grundlage der Suchlogik von Google bildet der Hyperlink, der die bedeutendste Innovation im Bereich des Internets ist. Hyperlinks sind ein typischer Bestandteil des Internets und verknüpfen Internetseiten sowie anderen Dokumente miteinander.[15]

Das Verfahren von PageRank nimmt eine Bewertung der Verweise von externen Seiten zu einer Internetseite vor. Ähnlich wie bei wissenschaftlichen Texten, die bedeutsamer werden, je öfter daraus Zitiert wird, sind Seiten mit vielen Verlinkungen wichtiger als Seiten auf denen nur wenige Hyperlinks verweisen.[16] PageRank zählt diese Anzahl an Verlinkungen, die sog. Backlinks. Jedem indexierten Dokument wird dann ein statischer Wert zwischen 0 und 10 zugeordnet. Der Wert soll aufzeigen, wie hoch die Wahrscheinlichkeit ist, dass ein Nutzer auf diese Internetseite kommt. Weltweit besitzen etwa zwei Drittel aller Internetseiten einen Wert von 0 und etwa eine Handvoll den höchsten Wert mit 10. Der PageRank einer Internetseite wird also aus den Werten von anderen Seiten, die auf diese verweisen, gebildet. Nicht jede einzelne Seite verteilt ihren eigenen Wert, sondern gibt ihren Wert an Seiten weiter, auf die sie verlinkt. So erhält jede Seite ihren eigenen Wert dividiert durch die Zahl ihrer abgehenden Links. Damit werden Seiten mit einer hohen und einer niedrigen Anzahl an ausgehenden Links ausgeglichen.

Eine große Herausforderung für das PageRank-Verfahren liegt in der Berücksichtigung der hohen Anzahl an Hyperlinks. Wie bereits erwähnt, erhält jede Seite einen berechneten statischen Wert, der der jeweiligen Seite fest zugeordnet bleibt. Demnach erfolgt keine erneute Berechnung, wenn eine Suchanfrage durchgeführt wird, wodurch keine weitere Rechenzeit benötigt wird. Ein Nachteil des statischen Wertes ist jedoch, dass Seiten die populär sind, in der Suche bevorzugt werden, egal ob diese für die Anfrage von Bedeutung sind. Des Weiteren nimmt das PageRank-Verfahren nur Bezug auf die einzelne Internetseite und nicht auf das gesamte Webangebot. Um diesem Problem entgegen zu wirken, nutzt Google ein Reranking-Verfahren. Dieses ermittelt die Qualität der ermittelten Dokumente bezüglich der Suchanfrage und sortiert die vorhandene Ergebnisliste neu. Text-Matching-Technologien sind neben dem PageRank-Verfahren ebenfalls von großer Bedeutung. Durch das Text-Matching wird der Inhalt des Umfeldes von Suchwörtern ermittelt und dies fließt indirekt mit in den Suchalgorithmus ein. Um die Qualität der Ergebnisse weiter zu erhöhen, wird der Suchalgorithmus bei Google fortlaufend weiterentwickelt. So wurde der Algorithmus im Jahr 2007 rund 450-mal verändert. Experten vermuten, dass der Suchalgorithmus aus 200 verschiedenen Variablen besteht.[17]

[...]


[1] Vgl. (Röhle, 2010), S.11 ff.

[2] Vgl. (Röhle, 2010), S. 17 f.

[3] Vgl. (Kaumanns, et al., 2009), S. 14

[4] Vgl. (Röhle, 2010), S. 18 f.

[5] Vgl. (Greifender, 2010), S. 30-34

[6] Vgl. (Battelle, 2006), S. 44 f.

[7] Vgl. (Maier, 2014)

[8] Vgl. (Rosenbusch, 2014)

[9] Vgl. (SEO-united.de)

[10] Vgl. (Krys, et al., 2011), S. 258

[11] Vgl. (Rosenbusch, 2014)

[12] Vgl. (Hallberg, 2013)

[13] Vgl. (Rosenbusch, 2014)

[14] Vgl. (Hallberg, 2013)

[15] Vgl. (Kaumanns, et al., 2009), S. 51 f.

[16] Vgl. (Reppesgaard, 2010), S. 78

[17] Vgl. (Kaumanns, et al., 2009), S. 53-56

Details

Seiten
23
Jahr
2015
ISBN (eBook)
9783668156487
ISBN (Buch)
9783668156494
Dateigröße
580 KB
Sprache
Deutsch
Katalognummer
v316524
Note
1,7
Schlagworte
Google Suchmaschine Web 2.0 Informationen digital Suchmaschinenmarkt Online-Suche Volltextsuche

Autor

Zurück

Titel: Suchmaschinen im Internet. Entwicklung und Bedeutung von Google