it innovations.de

MOC 20775 - SQL Server 2016 - Durchführung von Data Engineering mit Microsoft HD Insight - Schulung

SQL Server 2016 - Performing Data Engineering on Microsoft HD Insight

Seminar Beschreibung Kurzbeschreibung

In dieser SQL Server 2016-Schulung lernen Dateningenieure, - Architekten und Datenentwickler große Daten-Workflows auf HDInsight zu planen und zu implementieren. Die behandelten Themen sind u.a. die Abfrage großer Daten, die Bereitstellung von HDInsight Clustern, der Ressourcenzugriff, die Implementierung von Batch-Lösungen, die Datenanalyse mit Spark SQL, Stream Analytics und Troubleshooting von HDInsight.

Seminar Voraussetzungen Voraussetzungen

  • Programmiererfahrung mit R und Vertrautheit mit gängigen R-Paketen

  • Kenntnis der gemeinsamen statistischen Methoden und Datenanalyse Best Practices

  • Grundkenntnisse des Microsoft Windows Betriebssystems und seiner Kernfunktionalität

  • Kenntnisse der relationalen Datenbanken

Seminar Software Software

Microsoft SQL Server 2016

Seminar Technikinfo Informationen zur Technologie

Der SQL Server 2016 ist eine Plattform mit Echtzeitanalyse für operative Daten, Visualisierungen auf Mobilgeräten und erweiterter Analytics-Funktionen. Die neuen Funktionen sind das Dynamic Data Masking, das verbesserte Datenbank Caching, das verbesserte Reporting, die neue Always Encrypted-Technologie, die AlwaysOn-Technologie, die Row-level Security und einem verbesserten Support für Windows Server.

 

Im Data Engineering werden Datenbank- und Datenfluss-Architekturen modelliert. Es umfasst die Datensammlung bzw. die -Generierung, die Speicherung und das zur Verfügung stellen von Instanzen.

Seminar Beschreibung Inhalt

Erste Schritte mit HDInsight

• Big Data

• Hadoop

• MapReduce

• HDInsight

 

Bereitstellung von HDInsight-Clustern

• HDInsight-Cluster-Typen

• Erstellung, Anpassung und Löschung von HDInsight Clustern mit dem Azure Portal

• Erstellung, Anpassung und Löschung von HDInsight Clustern mit PowerShell

 

Berechtigung zum Zugriff auf Ressourcen

• Nicht-Domain-verbundene Cluster

• Konfiguration von Domänen-verbundenen HDInsight-Clustern

• Verwaltung von Domänen-verbundenen HDInsight-Clustern

 

Laden von Daten in HDInsight

• HDInsight Speicher und Architekturen

• Datenladetools

• Performance und Zuverlässigkeit

 

Troubleshooting bei HDInsight

• Analyse der HDInsight-Protokolle

• Analyse der YARN-Protokolle

• Analyse der Heap Dumps

• Verwendung der Operations Management Suite zur Ressourcen-Überwachung

 

Implementierung von Batch-Lösungen

• Apache Hive Storage

• Abfrage mit Hive und Pig

• Betrieb von HDInsight

 

Design der Batch ETL-Lösungen für Big Data mit Spark

• Bedeutung und Einsatz von Spark

• Verwendung von ETL mit Spark

• Spark Performance-Analyse

 

Datenanalyse mit Spark SQL

• Implementierung interaktive Abfragen

• Durchführung einer Erkundungs-Datenanalyse

 

Datenanalyse mit Hive und Phoenix

• Implementierung interaktiver Abfragen für Big Data mit interaktivem Hive

• Durchführung einer Erkundungs-Datenanalyse mit Hive

• Durchführung einer interaktiven Verarbeitung mit Apache Phoenix

 

Stream Analytics

• Stream Analytics

• Verarbeitung der Streaming-Daten aus Stream Analytics

• Verwaltung von Stream Analytics Aufträge

 

Spark-Streaming mit der DStream-API

• Dstream

• Erstellung von Spark-strukturierten Streaming-Anwendungen

• Persistenz und Visualisierung

 

Entwicklung große Daten-Echtzeit-Verarbeitungslösungen mit Apache Storm

• Bestehende Langzeitdaten

• Stream Daten mit Storm

• Erstellung von Storm-Topologien

• Konfiguration von Apache Storm

Seminar Ziel Ziel

Dieser 5-tägige SQL Server 2016-Kurs vermittelt dem Teilnehmer Kenntnisse
zur Implementierung großer Data Engineering Workflows auf HDInsight.

Seminar Zielgruppe Zielgruppe

  • Dateningenieure

  • Datenarchitekten

  • Datenentwickler

  • Datenwissenschaftler

offene Schulung

Eine offene Schulung findet in einem unserer Schulungszentren statt.
Dauer: 5 Tage
Preis: 1.595,00 € zzgl. USt. pro Teilnehmer
(1.898,05 € inkl. USt.)
Seminarstandorte:
Start-Termine: (Ortsabhängig)
Unterlagen:
Verpflegung:
Prüfung:

Firmenschulung

Eine Firmenschlung kann sowohl bei Ihnen vor Ort als auch in einem unserer Schulungszentren stattfinden.
Dauer: 5 Tage
Preis ab: 1.295,00 € zzgl. USt. pro Tag
(1.541,05 € inkl. USt.)
Schulungszentren:
  • Berlin
  • Düsseldorf
  • Frankfurt
  • Hamburg
  • München
  • Nürnberg
Unterlagen: zzgl.
Verpflegung: zzgl.
Prüfung: zzgl.
alle Preise verstehen sich zzgl. Reisekosten/Spesen
MOC 20775 Microsoft SQL Server 2016 Data Engineering HD Insight
Artikelnummer: 2017000085

Application programming interface (API) ist eine Schnittstelle zur Anwendungsprogrammierung

Structured Query Language (SQL). Eine Datenbanksprache zur Definition von Datenstrukturen in relationalen Datenbanken sowie zum Bearbeiten (Einfügen, Verändern, Löschen) und Abfragen von Datenbeständen.

Cloud-Dienst von Microsoft. Stellt Anwendungen und Datenbanken zur Verfügung, die netzbasierend genutzt werden können. Auch die eigenen Daten des Anwenders liegen nicht mehr auf dem eigenen Computer, sondern auf den Servern des Providers.

Windows PowerShell ist ein von Microsoft entwickeltes Automations- und Verwaltungsframework, bestehend aus Kommandozeile und einer objektorientierte Skriptsprache, das administrative Aufgaben und Massenkonfiguration unter Windows erleichtert.

Als (Daten-) Stream bezeichnet man die Darstellung von Operationen beim Data Mining über eine Reihe von Knoten (Knotenreihe). Die Verbindung zwischen den Knoten gibt die Richtung des Datenflusses an. Datenstreams werden bei IBM SPSS Modeller in der Regel zum Einlesen von Daten, um Daten einer Reihe von Bearbeitungen zu unterziehen und um Daten an eine definierte Zieltabelle zu senden, verwendet.

Ein Cluster ist eine logische Zusammenfassung von Sektoren eines Datenträgers.