Hadoop Aufbau und Einsatz von Big Data Plattformen

Language: German, Chinese

Dieses Modul fokussiert das Java-basierte Open-Source-Framework Hadoop. Am Ende des Moduls werden Sie dazu in der Lage sein, Hadoop zu installieren und anzuwenden. Zudem werden Sie mit dem Dateisystem HDFS und dessen wichtigsten Befehlen zur Datenverwaltung und -nutzung vertraut sein. Darüber hinaus werden Sie die Phasen des Programmiermodells Map Reduce kennengelernt haben und verfügen über das Wissen, wie sich Hadoop-Prozesse auf sehr vielen Rechner-Knoten verteilen und parallel ausführen lassen. Außerdem werden Sie gelernt haben, wie und wofür Sie Hive ausführen und welche Datentypen von Hive erkannt werden. Des Weiteren werden Sie die Java-Anwendung Sqoop verwenden können, um Daten aus relationalen Datenbanksystemen mit Hadoop auszutauschen. Zusätzlich werden Sie mit der Funktionsweise von HBase und den für die Konfiguration relevanten Parametern vertraut sein. Letztlich werden Sie mit NoSQL-Datenbanken und deren unterschiedlichen Gruppen vertraut sein.