Kakadu Labs
Schreib uns!
Zurück zur Übersicht
Fortgeschritten

Data-Engineering für Data-Scientists

Entdeckt mit uns die Kunst der professionellen Entwicklung von Data-Pipelines

Dauer2 Tage
LevelFortgeschritten
FormatPräsenz & Online
Preis2.495 €

Lernziele

  • Professionelle Softwareentwicklung
  • CI/CD, Cloud-Native, GitOps
  • High-Performance Query Engines
  • Daten-Architektur
  • Technologieauswahl
  • Data-Management und Organisation

Module

Modul 1: Grundlagen und Data-Engineering

  • Vorstellung und Diskussion moderner Data-Plattformen
  • Requirements-Engineering
  • Charakteristiken von Data-Projekten

Modul 2: Cloud-Native Software Engineering (deployment auch on-prem)

  • Testgetriebene Softwareentwicklung
  • Containerieiserung
  • CI/CD
  • Effiziente Datentransformationen mit Python und Rust
  • Apache Arrow Datafusion

Modul 3: Echtzeit Datenverarbeitung

  • Vorstellung der Anforderungen und Diskussion
  • Entwufsmuster
  • Ausfallsicherheit

Modul 4: Batch-Data Engineering

  • Vorstellung der Anforderungen und Diskussion
  • Batch Data-Engineering Softwarearchitektur
  • Vorstellung und Hands-on Projekt Apache Airflow

Voraussetzungen

  • Grundlagen Softwareentwicklung
  • Grundlagen SQL