Verteiltes Rechnen

  • Typ: Vorlesung (V)
  • Semester: WS 15/16
  • Zeit: 21.10.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)


    28.10.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    04.11.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    11.11.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    18.11.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    25.11.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    02.12.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    09.12.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    16.12.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    23.12.2015
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    13.01.2016
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    20.01.2016
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    27.01.2016
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    03.02.2016
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)

    10.02.2016
    14:00 - 15:30 wöchentlich
    SR 217 (Geb. 20.21)


  • Dozent: Prof. Dr. Achim Streit
    Dr. Christopher Jung
  • SWS: 2
  • LVNr.: 2400050
BeschreibungDie Vorlesung „Verteiltes Rechnen“ gibt eine Einführung in die Welt des verteilten Rechnens mit einem Fokus auf Grundlagen, Technologien und Beispielen aus Grid, Cloud und dem Umgang mit Big Data.

Zuerst wird eine Einführung in die Hauptcharakteristika verteilter Systeme gegeben. Danach wird auf die Thematik Grid näher eingegangen und es werden Architektur, Grid Services, Sicherheit und Job Ausführung vorgestellt. Am Beispiel des WLCG (der Grid Infrastruktur zur Verteilung, Speicherung und Analyse der Daten des LHC-Beschleunigers am CERN) wird die enge Verwandtschaft zwischen Grid Computing und verteiltem Daten-Management dargestellt.

Im zweiten Teil werden Prinzipien und Werkzeuge zum Management großer bzw. verteilter Daten vorgestellt - dies schließt Datenlebenszyklus, Metadaten und Archivierung ein. Beispiele aus Wissenschaft und Industrie dienen zur Veranschaulichung. Moderne Speichersysteme wie z.B. dCache, xrootd, Ceph und HadoopFS werden als praktische Beispiele vorgestellt.

Der dritte Teil der Vorlesung geht auf das Thema Cloud ein. Nach der Definition grundlegender Begriffe und Prinzipien (Iaas, PaaS, SaaS, public vs. private Clouds), auch mittels Beispielen, wird das Thema Virtualisierung als grundlegende Technik des Cloud Computing vorgestellt. Den Abschluss bildet MapReduce als Mechanismus zur Verarbeitung und Analyse großer, verteilter Datenbestände wie es auch von Google eingesetzt wird.
Literaturhinweise
  1. Andrew Tanenbaum, Maarten van Steen: “Distributed systems: principles and paradigms”, Prentice Hall, 2007, ISBN 0-13-613553-6
  2. Ian Foster, Carl Kesselmann: “The Grid. Blueprint for a New Computing Infrastructure (2nd Edition)”, Morgan Kaufmann, 2004, ISBN 1-55860-933-4
  3. Fran Berman, Geoffrey Fox, Anthony J.G. Hey: “Grid Computing: Making the Global Infrastructure a Reality”, Wiley, 2003, ISBN 0-470-85319-0
  4. Tony Hey: “The Fourth Paradigm: Data-intensive Scientific Discovery”, Microsoft Research, 2009, ISBN 978-0-9825442-0-4
  5. Rajkumar Buyya, James Broberg und Andrzej M. Goscinski: “Cloud Computing: Principles and Paradigms”, Wiley, 2011, ISBN 978-0-470-88799-8
LehrinhaltDie Vorlesung "Verteiltes Rechnen" gibt eine Einführung in die Welt des verteilten Rechnens mit einem Fokus auf Grundlagen, Technologien und Beispielen aus Grid, Cloud und dem Umgang mit Big Data.

Zuerst wird eine Einführung in die Hauptcharakteristika verteilter Systeme gegeben. Danach wird auf die Thematik Grid näher eingegangen und es werden Architektur, Grid Services, Sicherheit und Job Ausführung vorgestellt. Am Beispiel des WLCG (der Grid Infrastruktur zur Verteilung, Speicherung und Analyse der Daten des LHC-Beschleunigers am CERN) wird die enge Verwandtschaft zwischen Grid Computing und verteiltem Daten-Management dargestellt.

Im zweiten Teil werden Prinzipien und Werkzeuge zum Management großer bzw. verteilter Daten vorgestellt - dies schließt Datenlebenszyklus, Metadaten und Archivierung ein. Beispiele aus Wissenschaft und Industrie dienen zur Veranschaulichung. Moderne Speichersysteme wie z.B. dCache, xrootd, Ceph und HadoopFS werden als praktische Beispiele vorgestellt.

Der dritte Teil der Vorlesung geht auf das Thema Cloud ein. Nach der Definition grundlegender Begriffe und Prinzipien (Iaas, PaaS, SaaS, public vs. private Clouds), auch mittels Beispielen, wird das Thema Virtualisierung als grundlegende Technik des Cloud Computing vorgestellt. Den Abschluss bildet MapReduce als Mechanismus zur Verarbeitung und Analyse großer, verteilter Datenbestände wie es auch von Google eingesetzt wird.

Arbeitsbelastung120 h / Semester, davon 30 h Präsenzzeit und 90 h Selbstlernen aufgrund der Komplexität des Stoffs
ZielStudierende verstehen die Grundbegriffe verteilter Systeme, im Speziellen in den aktuellen Techniken des Grid und Cloud Computing sowie des Management großer bzw. verteilter Daten. Sie wenden zugrundeliegenden Paradigmen und Services auf gegebene Beispiel an.

Studierende analysieren Methoden und Technologien des Grid und Cloud Computing sowie verteilten Daten-Managements, die für den Einsatz in alltags- und industriellen Anwendungsgebieten geeignet sind bzw. welche heute von Google, Facebook, Amazon, etc. eingesetzt werden. Hierfür vergleichen die Studierenden Web/Grid Services, elementare Grid Funktionalitäten, Datenlebenszyklen, Metadaten, Archivierung, Cloud Service Typen (IaaS, SaaS, PaaS) und Public/Private Clouds anhand von Beispielen aus der Praxis.

PrüfungDie Erfolgskontrolle erfolgt in Form einer mündlichen Prüfung im Umfang von i.d.R. 20 Minuten nach § 4 Abs. 2 Nr. 2 SPO.