Lade Inhalt...

Grid Computing

Referat (Ausarbeitung) 2005 15 Seiten

Informatik - Wirtschaftsinformatik

Leseprobe

Inhaltsverzeichnis

Kurzfassung

Abstract

Inhaltsverzeichnis

Abbildungsverzeichnis

Abkürzungsverzeichnis

1 Web Services
1.1 Definition
1.2 WSDL
1.3 SOAP

2 Grid Computing (GC)
2.1 Begriffsklärung
2.2 Funktionsweise
2.3 Mögliche Einsatzbereiche
2.4 Unterschiede zum Distributed Computing

3 Das Globus-Toolkit
3.1 Architektur
3.1.1 Ressourcenmanagement
3.1.2 Datenmanagement
3.1.3 Informationsdienste
3.2 Weitere Komponenten

Literaturverzeichnis

Erklärung

Abbildungsverzeichnis

Abbildung 1: Funktionsweise eines Grid (Vgl. Schlesinger, 2003) 9

Abbildung 2: Globus-Architektur (vgl. Kornmayer, 2004) 11

Abkürzungsverzeichnis

Abbildung in dieser Leseprobe nicht enthalten

Kurzfassung

Diese Arbeit ist Teil einer Dokumentation eines Web Service-Projekt zum Thema Grid Computing. Zuerst werden die Begriffe Web Service und Grid Computing definiert und näher erläutert. Darauf folgt eine Beschreibung des Globus Toolkit 3. Das entwickelte Projekt selbst ist nicht Bestandteil dieser Arbeit

Abstract

This work is part of a documentation of a Web Service-Project, which topic is Grid Computing. First, the terms Web Service and Grid Computing are defined and more precisely illustrated. Then the Globus Toolkit 3 is described. The developed project itself is not part of the work.

1 Web Services

1.1 Definition

Der Begriff Web Service (WS) bezieht sich zuerst auf ein Set von Standards, welches vom W3C (World Wide Web Consortium) entwickelt und zur Verfügung gestellt wird. Die Basis hierfür ist die Web Service Definition Language (WSDL), welche auf XML (eXtensible Markup Language) basiert. WSDL-Dokumente werden zwischen den Services und den Service (Requesters) ausgetauscht, ohne das die Notwendigkeit besteht, dass beide Parteien dieselbe (darunter liegende) Software benutzen. Üblicherweise werden WSDL-Dokumente in SOAP (Simple Object Access Protocol) „gewrapped“ und dann meistens mittels HTTP (Hypertext Transfer Protocol) übertragen.

1.2 WSDL

WSDL ist eine Metasprache im XML-Format, die die Funktionen eines WS definiert.

Das W3C (Chinnici, 2003) definiert die WSDL wie folgt:

WSDL describes Web services starting with the messages that are exchanged between the service provider and requestor. The messages themselves are described abstractly and then bound to a concrete network protocol and message format. A message consists of a collection of typed data items. An exchange of messages between the services provider and requestor are describes as an operation . A collection of operations is called a port type . A service contains a collection of ports , where each port is an implementation of a portType, which includes all the concrete details needed to interact with the service

1.3 SOAP

(Vgl. P&I, 2005) Das Simple Object Access Protocol ist ein Datenaustauschprotokoll zur Nachrichtenübermittlung via Internet. SOAP setzt auf HTTP(S) auf und spezifiziert das Nachrichtenformat, in dem Informationen zwischen zwei Systemen ausgetauscht werden, die über die Web Services -Technologie miteinander verbunden sind.

2 Grid Computing (GC)

2.1 Begriffsklärung

Ähnlich zum Distributed Computing (DC) werden beim Grid Computing die Rechenleistung vieler Computer in einem Netzwerk zusammengefasst, so dass die Lösung von rechenintensiven Problemen ermöglicht wird. Jeder Rechner in diesem „Gitter“ (Grid) ist eine den anderen Computern gleichgestellte Einheit. Neue Rechner lassen sich sehr gut hinzufügen, sowie mehrere Grids zu einem Übergrid zusammenfassen. So lässt sich die Rechenleistung leicht und kostengünstig erhöhen. Schlesinger (2003):

„Netzwerk Technologie zum Zwecke des flexiblem, sicheren, koordiniertem „resource-sharing“ zwischen dynamischen Gruppen von Einzelnen oder Institutionen.“

Ressourcen können fast alles sein: Prozessorleistung, Arbeitsspeicher, Dateien. Grenzen zwischen Firmen, Plattformen, Netzwerken, Domains werden überschritten. Teilnehmer eines Grids bilden eine virtuelle Organisation, welche dynamisch (on demand) entstehen kann (Vgl. Schlesinger, 2003).

2.2 Funktionsweise

Die Funktionsweise eines Grid lässt sich am besten anhand des Modells von Schlesinger erklären (s.u.) (Vgl. Schlesinger, 2003):

Fabric: Dies ist die unterste Ebene im Stack. Dort liegt propritärer Code für physikalische Ressourcen, auf welche der Zugriff via Interface erfolgt. Die Ressourcen implementieren Enquiry und Resource Management Operationen. Diese nennen sich Grid Resource (GR).

Connectivity: Diese greift auf eine GR über ein Interface zu und behandelt Kommunikation und Authentifizierung mit der GR.

Resource: Stellt Interfaces, APIs (Application Programming Interface), und SDKs (Software Development Kit) bereit, um auf eine GR via Connectivity-Ebene zuzugreifen.

Collective: Behandelt Aufgaben des globalen Zustands des Grids, sowie Gruppen von Ressourcen.

Application: Hier liegen die Anwendungen, die auf dem Grid laufen.

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 1: Funktionsweise eines Grid (Vgl. Schlesinger, 2003)

2.3 Mögliche Einsatzbereiche

Unternehmen könnten Verträge über die gegenseitige Nutzung ihrer Rechnerressourcen abschließen, um zum Beispiel Über- oder Unterkapazitäten auszugleichen. Eine weitere Idee ist die Entwicklung einer Ressourcenbörse, an der mit Prozessorleistung gehandelt wird. Das Globus-Toolkit (GTK) bietet hierfür das RessourceBroker-Konzept an mit dem Ressourcen gehandelt werden können.

2.4 Unterschiede zum Distributed Computing

Schon ab ca. 1970 entwickelte sich das DC als Antwort auf die riesigen Mainframes (Supercomputer). Grundlage hierfür war die Entwicklung der ersten LANs (Local Area Network) und dann in den 80ern Standards wie TCP/IP (Transmission Control Protocol/Internet Protocol), die es möglich machten Daten über Netzwerke auszutauschen. Von einem zentralen Rechner (Server) werden Pakete über das Internet verschickt, welche dann von Client-PCs, auf denen eine passende Anwendung installiert ist, berechnet und dann zurückgeschickt werden. Vorteile des GC zum DC sind Folgende:

- Es ist möglich Daten dezentral zu speichern.
- Jeder Rechner kann gleichzeitig Client und Server zu sein.
- Im Gegensatz zum DC sind Schnittstellen vorhanden, die es möglich machen Anwendungen auf Clients zu laden, ohne, dass diese selbst etwas ausführen müssen. Beim DC müssen die Benutzer selbst neue Programme installieren.

3 Das Globus-Toolkit

Die Entwicklung des GTK begann 1995. Zuerst als Zusammenschluss mehrerer Supercomputerzentren und Entwicklungszentren in den USA. 1996 gab man dem Projekt den Namen Globus.

Das GTK stellt eine Reihe von Softwarekomponenten zur Verfügung, um Grids zu betreiben. Es basiert auf Java und ist OpenSource. Es liegt mittlerweile in den Versionen 2, 3 und 4 vor, wobei den beiden Letzteren die Schnittstellen auf Web Services basieren. Dies ist beim GTK2 noch nicht der Fall. Ab GTK3 wird die Open Grid Service Architecture (OGSA) implementiert, welche beschreibt, wie Grid -Schnittstellen zu gestalten sind, um mit anderen Clients kommunizieren zu können. Aus dem IBM On demand glossary (2005):

Open Grid Service Architecture is a distributed interaction and computing architecture based around the Grid Computing service, assuring interoperability on heterogeneous systems so that different types of resources can communicate and share information“ Zusätzlich kann der Benutzer in Version 3 und 4 sehr leicht eigene Services einbinden.

3.1 Architektur

Das GTK verfügt über ein Ressourcenmanagement, Informationsdienste und ein Datenmanagement, die alle auf eine gemeinsame Sicherheitsstruktur zugreifen (Vgl. Kornmayer, 2004):

Abbildung in dieser Leseprobe nicht enthalten

Abbildung 2: Globus-Architektur (Vgl. Kornmayer, 2004)

3.1.1 Ressourcenmanagement

Globus nutzt als Ressourcenmanager den Globus Ressource Allocation Manager (GRAM). Dieser funktioniert wie folgt: Ein Client schickt mittels HTTP (Hypertext Transfer Protocol) einen Auftrag an das Grid. Um die genaue Anforderung zu beschreiben wird die Sprache RSL (Ressource Specification Language) benutzt. Auf dem Remoterechner wird der Auftrag vom Gatekeeper angenommen, welcher den Jobmanager startet, der den Auftrag übernimmt. Dieser stellt Ressourcen bereit und startet die notwendigen Prozesse.

3.1.2 Datenmanagement

Der Transferdienst GridFTP greift auf die Daten im Grid zu und verteilt sie. Zusätzlich zum üblichen FTP (File Transfer Protocol) gibt es einige Grid -spezifische Erweiterungen, z.B. Third Party File Transfer, d.h. der Datenaustausch zwischen zwei Rechnern kann von einem Dritten aus gesteuert werden. Ein globaler Namensraum ist nicht notwendig. Stattdessen wird ein lokales Naming zusammen mit Host-IP und DNS (Domain Name Server) verwendet.

3.1.3 Informationsdienste

Der Monitoring and Discovery Service (MDS) dient dazu Rechenaufträge effizient im Grid zu verteilen, sowie um Ressourcen zu finden und zu überwachen. Dieser besteht aus zwei Teilen: GRIS (Grid Resource Information Service) und GIIS (Grid Index Information Service). GRIS verwaltet lokale Ressourceninformation und registriert sich beim GIIS.

3.2 Weitere Komponenten

Core: Umfasst die OGSI (Open Grid Services Infrastructure)-Implementierung, den Grid Service Container (Laufzeitumgebung für anwendungsspezifische Services) und die System Level Services (Sicherheitsstruktur).

GSI (Grid Security Infrastructure): Bietet Sicherheitsinfrastruktur für Grid Services mit den GSI3-Bibliotheken (Mechanismen für Authentifizierung, Autorisierung, Delegierung, Nachrichtenintegrität und Verschlüsselung). Weiterhin benötigt kein Dienst im GTK priviligierte Rootrechte. Ein sogenanntes Mapfile wird verwendet um lokale Benutzer auf ihre Identität im Grid abzubilden. Dadurch wird die Zusammenfassung unabhängiger Netzwerke zu einem Grid erleichtert. Als Berechtigungsnachweis innerhalb des Grid dienen X.509-Zertifikate. Zur Authentifizierung und Verschlüsselung wird TSL/SSL (TSL:s.o./Secure Socket Layer) verwendet.

CAS (Community Authentication Service): Sicherheitskomponente, die die Zugriffskontrolle auf einen Verbund in einer sogenannten Community regelt. Der User, der innerhalb einer Community einen bestimmten Service in Anspruch nehmen möchte, stellt eine Anfrage an den CAS, der, je nach den Rechten des Benutzers, ein passendes Zertifikat ausstellt.

RFT (Reliable File Transfer): WS der auf GridFTP aufbaut, jedoch ermöglicht, Dateien im Hintergrund zu übertragen, ohne dass ein Benutzer angemeldet sein muss.

XIO (eXtensible Input/Output Library:TCP, HTTP, UDP, ...): Mechanismus zur Eingabe/Ausgabe, der als API für Grid -Applikationen entwickelt wurde. Er bietet sogenannte Drivers. Diese sind austauschbare Module, die bestimmte Datenübertragungsprotokolle implementieren, teils auch nur temporär, um diese zu testen.

Literaturverzeichnis

Carpenter, B. (2003): Grid Computing - ISOC Member Briefing #11. The Internet Society, Reston, Virginia.

Chinnici, R., Gudgin, M., Moreau, J.-J., Weerawarana, S. (2003): Web Services Description Language (WSDL) Version 1.2. Internet-Quelle: http://www.w3.org/TR/2003/WD-wsdl12-20030303/. (Datum des Zugriffs: 22.06.05)

Kornmayer, H. (2004): Vernetzte Welten – Das Globus-Toolkit, Version 2, Linux-Magazin. Internet-Quelle: http://www.linuxmagazin.de/Artikel/ausgabe/2004/06/globus/globus.html. (Datum des Zugriffs: 22.06.05)

o.V. (2005): Open Grid Service Architecture – Definition. IBM On demand glossary. Internet-Quelle: http://www-8.ibm.com/e-business/au/glossary/glossary_o.html. (Datum des Zugriffs: 22.06.05)

o.V. (2005): Simple Object Access Protocol – Definition. P&I Glossar. Internet-Quelle: http://www.pi-ag.com/de/glossar/glossar.php. (Datum des Zugriffs: 22.06.05)

Schlesinger, F. (2003): Web Services und Grid Computing. Powerpoint-Folien. Internet-Quelle: http://www.inf.fu-berlin.de/inst/ag-tech/teaching/LehreFUSeiten/WS03/19589-S/talks_slides/Schlesinger_gridcomputingNWebservices_V2.ppt. (Datum des Zugriffs: 22.06.05)

Spindler, R. (2004): Open Grid Service Architecture, Grid Services and Globus 3.Pdf-Datei. Internet-Quelle: http://dps.uibk.ac.at/~tf/lehre/ws0405/gc/sourcen/spindler-seminar.pdf (Datum des Zugriffs: 22.06.05)

Erklärung

Hiermit erkläre ich, dass ich die vorliegende Seminararbeit selbständig angefertigt habe. Es wurden nur die in der Arbeit ausdrücklich benannten Quellen und Hilfsmittel benutzt. Wörtlich oder sinngemäß übernommenes Gedankengut habe ich als solches kenntlich gemacht.

Ort, Datum Unterschrift

Details

Seiten
15
Jahr
2005
Dateigröße
442 KB
Sprache
Deutsch
Katalognummer
v110319
Institution / Hochschule
Hochschule der Medien Stuttgart
Note
--
Schlagworte
Grid Computing Seminar Services/Wissensmanagement

Autor

Teilen

Zurück

Titel: Grid Computing