Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Week 1 — Inleiding tot Data Engineering
- Fundamentals van data engineering en moderne data stacks
- Data innamepatronen en -bronnen
- Batch versus streamingconcepten en gebruiksscenario's
- Praktische opdracht: inname van voorbeeldgegevens in cloudopslag
Week 2 — Databricks Lakehouse Foundation Badge
- Fundamentals van de Databricks-platform en werkruimte-navigatie
- Delta Lake-concepten: ACID, tijdreizen en schemavolgende ontwikkeling
- Beveiliging van werkruimte, toegangskontroles en basisprincipes van Unity Catalog
- Praktische opdracht: creatie en beheer van Delta-tabels
Week 3 — Geavanceerde SQL op Databricks
- Geavanceerde SQL-constructies en schermfuncties op grote schaal
- Query-optimalisatie, uitlegplannen en kostenbewuste patronen
- Gematerialiseerde weergaven, caching en prestatieafstemming
- Praktische opdracht: optimaliseren van analytische queries op grote datasets
Week 4 — Databricks Certified Developer for Apache Spark (Prep)
- Diepgaande kennis van Spark-architectuur, RDD's, DataFrames en Datasets
- Sleutel Spark-transformaties en -acties; prestatieoverwegingen
- Basisprincipes van Spark streaming en structureringspatronen
- Oefenexamens en praktische testproblemen
Week 5 — Inleiding tot Data Modeling
- Concepten: dimensioneel modeleren, ster/schema ontwerp en normalisatie
- Lakehouse-modelering versus traditionele aanpak van opslagplaatsen
- Ontwerppatronen voor analytisch-klare datasets
- Praktische opdracht: bouwen van consumptieklare tabellen en weergaven
Week 6 — Inleiding tot Import Tools & Data Innameautomatisering
- Connectors en innamehulpmiddelen voor Databricks (AWS Glue, Data Factory, Kafka)
- Streaming-innamepatronen en micro-batch-ontwerpen
- Data validatie, kwaliteitscontroles en schemainvoering
- Praktische opdracht: bouwen van robuste innamepijplijnen
Week 7 — Inleiding tot Git Flow en CI/CD voor Data Engineering
- Git Flow-takstrategieën en repositoryorganisatie
- CI/CD-pijplijnen voor notebooks, taken en infrastructuur als code
- Testen, linten en automatiseren van implementaties voor datacode
- Praktische opdracht: implementatie van Git-based workflow en automatische job-implementatie
Week 8 — Databricks Certified Data Engineer Associate (Prep) & Data Engineering Patterns
- Beoordeling van certificeringsonderwerpen en praktische oefeningen
- Architectuurpatronen: bron/zilver/goud, CDC, langzaam veranderende dimensies
- Operationele patronen: monitoring, waarschuwing en lijnvoering
- Praktische opdracht: eind-op-eind-pijplijn met toepassing van engineeringpatronen
Week 9 — Inleiding tot Airflow en Astronomer; Scripting
- Airflow-concepten: DAGs, taken, operators en planning
- Overzicht van de Astronomer-platform en beste praktijken voor orkestratie
- Scripting voor automatisering: Python-scriptingpatronen voor datataken
- Praktische opdracht: orkestratie van Databricks-taken met Airflow-DAGs
Week 10 — Data Visualisatie, Tableau en Customized Final Project
- Tableau verbinden met Databricks en beste praktijken voor BI-lagen
- Principe van dashboardontwerp en prestatiebewuste visualisaties
- Capstone: scoping, implementatie en presentatie van aangepast eindproject
- Eindpresentaties, peer review en feedback van de instructeur
Samenvatting en volgende stappen
Vereisten
- Begrip van basis SQL en data concepten
- Ervaring met programmeren in Python of Scala
- Kennis van clouddiensten en virtuele omgevingen
Doelgroep
- Toekomstige en praktiserende data engineers
- ETL/BI ontwikkelaars en analytics engineers
- Data-platform en DevOps teams die pipelines ondersteunen
350 Uren