Big Data on AWS
(AWSBD)
In diesem Kurs zeigen wir Ihnen, wie Sie Amazon EMR zum Verarbeiten von Daten mithilfe des umfassenden Angebots an Hadoop-Tools wie beispielsweise Pig und Hive einsetzen. Sie erfahren außerdem, wie Sie Big Data-Umgebungen erstellen, mit Amazon DynamoDB, Amazon Redshift und Amazon Kinesis arbeiten, und wie Sie durch Befolgen bewährter Methoden sichere und wirtschaftliche Big Data-Umgebungen einrichten.In diesem Kurs lernen Sie Folgendes:
Verstehen von Apache Hadoop im Kontext von Amazon EMR Verstehen der Architektur eines Amazon EMR-Clusters Starten eines Amazon EMR-Clusters mithilfe eines geeigneten Amazon-Computerabbilds (AMI) und Amazon EC2-Instance-Typs Auswählen passender AWS-Datenspeicheroptionen für Amazon EMR Verstehen der Optionen für die Eingabe, Übertragung und Komprimierung von Daten zur Nutzung mit Amazon EMR Einsetzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming Implementieren einer Big Data-Lösung mithilfe von Amazon Redshift Nutzen von Software zur Visualisierung von Big Data Auswählen geeigneter Sicherheitsoptionen für Amazon EMR und Ihre Daten Ausführen von In-Memory-Datenanalysen mithilfe von Spark und Shark in Amazon EMR Auswählen passender Optionen zur wirtschaftlichen Verwaltung Ihrer Amazon EMR-Umgebung Verstehen der Vorteile der Nutzung von Amazon Kinesis für Big Data.
ZIELGRUPPE
KURSVORAUSSETZUNGEN
Details anzeigen
Verstehen von Apache Hadoop im Kontext von Amazon EMR Verstehen der Architektur eines Amazon EMR-Clusters Starten eines Amazon EMR-Clusters mithilfe eines geeigneten Amazon-Computerabbilds (AMI) und Amazon EC2-Instance-Typs Auswählen passender AWS-Datenspeicheroptionen für Amazon EMR Verstehen der Optionen für die Eingabe, Übertragung und Komprimierung von Daten zur Nutzung mit Amazon EMR Einsetzen gängiger Programmierungs-Frameworks, die für Amazon EMR zur Verfügung stehen, wie z. B. Hive, Pig und Streaming Implementieren einer Big Data-Lösung mithilfe von Amazon Redshift Nutzen von Software zur Visualisierung von Big Data Auswählen geeigneter Sicherheitsoptionen für Amazon EMR und Ihre Daten Ausführen von In-Memory-Datenanalysen mithilfe von Spark und Shark in Amazon EMR Auswählen passender Optionen zur wirtschaftlichen Verwaltung Ihrer Amazon EMR-Umgebung Verstehen der Vorteile der Nutzung von Amazon Kinesis für Big Data.
- Sie kennen die Terminologie und Konzepte im Zusammenhang mit der AWS-Plattform
- Sie erhalten fundierte Grundkenntnisse über die Sicherheitsmaßnahmen von AWS
- Sie können durch die AWS Management Console navigieren
- Sie sind in der Lage, AWS-Speicheroptionen zu unterscheiden und einen Amazon Simple Storage Service (S3)-Bucket zu erstellen
- Sie haben gute Kenntnisse über Bereitstellungs- und Verwaltungsoptionen
- Sie kennen AWS-Datenverarbeitungs- und Netzwerkoptionen und können mit Amazon Elastic Compute Cloud (EC2) und Amazon Elastic Block Storage (EBS) arbeiten
- Sie wissen, wie Sie eine Amazon Relation Database Service (RDS)-Instance starten
- Sie können Managed Services- und Datenbankoptionen beschreiben
ZIELGRUPPE
- Zuständige für die Konzeption und Umsetzung von Big Data-Lösungen, d. h. Solutions Architects und SysOps-Administratoren
- Big Data-Manager und Big Data-Analysten, die sich für Big Data-Lösungen in AWS interessieren
KURSVORAUSSETZUNGEN
- GRUNDKENNTNISSE IN BIG DATA-TECHNOLOGIEN EINSCHLIEßLICH APACHE HADOOP UND HDFS
- KENNTNISSE IN BIG DATA-TECHNOLOGIEN WIE PIG, HIVE UND MAPREDUCE SIND HILFREICH, ABER NICHT ERFORDERLICH
- ARBEITSKENNTNISSE DER WICHTIGEN AWS-SERVICES UND IMPLEMENTIERUNG ÖFFENTLICHER CLOUDS
- TEILNEHMER MÜSSEN DEN KURS AWS TECHNICAL ESSENTIALS (AWSE) ABSOLVIERT HABEN ODER EINE ÄHNLICHE ERFAHRUNG AUFWEISEN
- GRUNDLEGENDES VERSTÄNDNIS VON DATA WAREHOUSES, RELATIONALEN DATENBANKSYSTEMEN UND DATENBANK-DESIGN
SEMINARINHALT
IN DIESEM KURS WERDEN DIE FOLGENDEN KONZEPTE BEHANDELT:
- ÜBERSICHT ZU BIG DATA, APACHE HADOOP UND DEN VORTEILEN VON AMAZON EMR
- ARCHITEKTUR VON AMAZON EMR
- VERWENDEN VON AMAZON EMR
- STARTEN UND NUTZEN EINES AMAZON EMR-CLUSTERS
- HADOOP-PROGRAMMIERUNGS-FRAMEWORKS 2. TAG
- VERWENDEN VON HIVE FÜR DIE ANALYSE VON WERBUNG
- VERWENDEN VON STREAMING FÜR BIOWISSENSCHAFTLICHE ANALYSEN
- ÜBERSICHT: SPARK UND SHARK FÜR IN-MEMORY-ANALYSEN
- VERWENDEN VON SPARK UND SHARK FÜR IN-MEMORY-ANALYSEN
- KOSTENMANAGEMENT FÜR AMAZON EMR
- ÜBERSICHT ÜBER DIE AMAZON EMR-SICHERHEIT
- EINGABE, ÜBERTRAGUNG UND KOMPRIMIERUNG VON DATEN
- VERWENDEN VON AMAZON KINESIS FÜR DIE VERARBEITUNG VON BIG DATA IN ECHTZEIT3. TAG
- VERWENDEN VON AMAZON KINESIS UND AMAZON EMR FÜR STREAMING UND VERARBEITUNG VON BIG DATA
- OPTIONEN FÜR DIE DATENSPEICHERUNG IN AWS
- VERWENDEN VON DYNAMODB MIT AMAZON EMR
- ÜBERSICHT: AMAZON REDSHIFT UND BIG DATA
- VERWENDEN VON AMAZON REDSHIFT FÜR BIG DATA
- VISUALISIEREN UND ORCHESTRIEREN VON BIG DATA
- VISUALISIEREN VON BIG DATA MIT TABLEAU DESKTOP ODER JASPERSOFT BI