Cursusaanbod

Week 1 — Inleiding tot Data Engineering

  • Fundamentals van data engineering en moderne data stacks
  • Data innamepatronen en -bronnen
  • Batch versus streamingconcepten en gebruiksscenario's
  • Praktische opdracht: inname van voorbeeldgegevens in cloudopslag

Week 2 — Databricks Lakehouse Foundation Badge

  • Fundamentals van de Databricks-platform en werkruimte-navigatie
  • Delta Lake-concepten: ACID, tijdreizen en schemavolgende ontwikkeling
  • Beveiliging van werkruimte, toegangskontroles en basisprincipes van Unity Catalog
  • Praktische opdracht: creatie en beheer van Delta-tabels

Week 3 — Geavanceerde SQL op Databricks

  • Geavanceerde SQL-constructies en schermfuncties op grote schaal
  • Query-optimalisatie, uitlegplannen en kostenbewuste patronen
  • Gematerialiseerde weergaven, caching en prestatieafstemming
  • Praktische opdracht: optimaliseren van analytische queries op grote datasets

Week 4 — Databricks Certified Developer for Apache Spark (Prep)

  • Diepgaande kennis van Spark-architectuur, RDD's, DataFrames en Datasets
  • Sleutel Spark-transformaties en -acties; prestatieoverwegingen
  • Basisprincipes van Spark streaming en structureringspatronen
  • Oefenexamens en praktische testproblemen

Week 5 — Inleiding tot Data Modeling

  • Concepten: dimensioneel modeleren, ster/schema ontwerp en normalisatie
  • Lakehouse-modelering versus traditionele aanpak van opslagplaatsen
  • Ontwerppatronen voor analytisch-klare datasets
  • Praktische opdracht: bouwen van consumptieklare tabellen en weergaven

Week 6 — Inleiding tot Import Tools & Data Innameautomatisering

  • Connectors en innamehulpmiddelen voor Databricks (AWS Glue, Data Factory, Kafka)
  • Streaming-innamepatronen en micro-batch-ontwerpen
  • Data validatie, kwaliteitscontroles en schemainvoering
  • Praktische opdracht: bouwen van robuste innamepijplijnen

Week 7 — Inleiding tot Git Flow en CI/CD voor Data Engineering

  • Git Flow-takstrategieën en repositoryorganisatie
  • CI/CD-pijplijnen voor notebooks, taken en infrastructuur als code
  • Testen, linten en automatiseren van implementaties voor datacode
  • Praktische opdracht: implementatie van Git-based workflow en automatische job-implementatie

Week 8 — Databricks Certified Data Engineer Associate (Prep) & Data Engineering Patterns

  • Beoordeling van certificeringsonderwerpen en praktische oefeningen
  • Architectuurpatronen: bron/zilver/goud, CDC, langzaam veranderende dimensies
  • Operationele patronen: monitoring, waarschuwing en lijnvoering
  • Praktische opdracht: eind-op-eind-pijplijn met toepassing van engineeringpatronen

Week 9 — Inleiding tot Airflow en Astronomer; Scripting

  • Airflow-concepten: DAGs, taken, operators en planning
  • Overzicht van de Astronomer-platform en beste praktijken voor orkestratie
  • Scripting voor automatisering: Python-scriptingpatronen voor datataken
  • Praktische opdracht: orkestratie van Databricks-taken met Airflow-DAGs

Week 10 — Data Visualisatie, Tableau en Customized Final Project

  • Tableau verbinden met Databricks en beste praktijken voor BI-lagen
  • Principe van dashboardontwerp en prestatiebewuste visualisaties
  • Capstone: scoping, implementatie en presentatie van aangepast eindproject
  • Eindpresentaties, peer review en feedback van de instructeur

Samenvatting en volgende stappen

Vereisten

  • Begrip van basis SQL en data concepten
  • Ervaring met programmeren in Python of Scala
  • Kennis van clouddiensten en virtuele omgevingen

Doelgroep

  • Toekomstige en praktiserende data engineers
  • ETL/BI ontwikkelaars en analytics engineers
  • Data-platform en DevOps teams die pipelines ondersteunen
 350 Uren

Aantal deelnemers


Prijs Per Deelnemer

Voorlopige Aankomende Cursussen

Gerelateerde categorieën