Plan du cours
Revue des fondamentaux d'Apache Airflow
- Concepts clés : DAGs, tâches et opérateurs
- Architecture et composants d'Airflow
- Recapitulatif des cas d'utilisation et workflows courants
Optimisation des performances des workflows
- Identification des goulots d'étranglement dans les pipelines Airflow
- Techniques d'optimisation au niveau des tâches
- Exploitation des retry de tâches, de la parallélisation et de la concurrence
Gestion des dépendances complexes
- Définir des dépendances dynamiques dans les workflows
- Gérer les workflows conditionnels et à branchements
- Utiliser efficacement les groupes de tâches et les sous-DAGs
Fonctionnalités avancées d'Apache Airflow
- Création d'opérateurs et de hooks personnalisés
- Mise en œuvre de capteurs (sensors) pour les déclenchements externes
- Intégration de services tiers et de plugins
Mise à l'échelle des déploiements Apache Airflow
- Approches de mise à l'échelle horizontale et verticale
- Utilisation des Celery Executors pour l'exécution distribuée
- Meilleures pratiques pour la mise à l'échelle dans les environnements cloud
Monitoring et débogage des workflows
- Configuration de la journalisation et des alertes pour le suivi des workflows
- Utilisation de l'interface utilisateur (UI) et de la CLI d'Airflow pour le dépannage
- Identification et résolution des problèmes courants dans les déploiements Airflow
Sécurisation d'Apache Airflow
- Authentification et contrôle d'accès dans Airflow
- Protection des données sensibles et des configurations d'environnement
- Mise en œuvre de pistes d'audit (audit trails) pour les workflows
Cas d'utilisation enterprise et meilleures pratiques
- Conception de workflows robustes pour les environnements de production
- Exploitation d'Airflow pour l'ingénierie des données et les pipelines ETL
- Exploration d'études de cas réelles de déploiements Airflow évolutifs
Synthèse et prochaines étapes
Pré requis
- Connaissances de base d'Apache Airflow
- Maîtrise de la programmation Python et des concepts d'orchestration de workflows
- Expérience dans la gestion et le déploiement d'applications sur des environnements Linux
Public visé
- Ingénieurs de données
- Professionnels DevOps
- Développeurs logiciels
Nos clients témoignent (1)
L'instructeur a adapté la formation au niveau des participants et a répondu à toutes les questions. Il était très communicatif, et il était facile d'interagir avec lui. J'ai vraiment apprécié le format de la formation, qui comprenait de nombreux exercices pratiques. Dans l'ensemble, c'était une séance très engageante et bien organisée.
Jacek Chlopik - ZAKLAD UBEZPIECZEN SPOLECZNYCH
Formation - Apache Airflow: Building and Managing Data Pipelines
Traduction automatique