Zurück zur Übersicht
Fortgeschritten
Data-Engineering für Data-Scientists
Entdeckt mit uns die Kunst der professionellen Entwicklung von Data-Pipelines
Dauer2 Tage
LevelFortgeschritten
FormatPräsenz & Online
Preis2.495 €
Lernziele
- •Professionelle Softwareentwicklung
- •CI/CD, Cloud-Native, GitOps
- •High-Performance Query Engines
- •Daten-Architektur
- •Technologieauswahl
- •Data-Management und Organisation
Module
Modul 1: Grundlagen und Data-Engineering
- ›Vorstellung und Diskussion moderner Data-Plattformen
- ›Requirements-Engineering
- ›Charakteristiken von Data-Projekten
Modul 2: Cloud-Native Software Engineering (deployment auch on-prem)
- ›Testgetriebene Softwareentwicklung
- ›Containerieiserung
- ›CI/CD
- ›Effiziente Datentransformationen mit Python und Rust
- ›Apache Arrow Datafusion
Modul 3: Echtzeit Datenverarbeitung
- ›Vorstellung der Anforderungen und Diskussion
- ›Entwufsmuster
- ›Ausfallsicherheit
Modul 4: Batch-Data Engineering
- ›Vorstellung der Anforderungen und Diskussion
- ›Batch Data-Engineering Softwarearchitektur
- ›Vorstellung und Hands-on Projekt Apache Airflow
Voraussetzungen
- •Grundlagen Softwareentwicklung
- •Grundlagen SQL