Prenez contact avec nous

Plan du cours

Rappel des fondamentaux d'Apache Airflow

  • Concepts clés : DAGs, opérateurs et flux d'exécution.
  • Architecture et composants d'Airflow.
  • Compréhension des cas d'utilisation et workflows avancés.

Création d'opérateurs personnalisés

  • Compréhension de l'anatomie d'un opérateur Airflow.
  • Développement d'opérateurs personnalisés pour des tâches spécifiques.
  • Tests et débogage des opérateurs personnalisés.

Hooks et capteurs personnalisés

  • Implémentation de hooks pour l'intégration avec des systèmes externes.
  • Création de capteurs pour la surveillance des déclencheurs externes.
  • Amélioration de l'interactivité des workflows avec des capteurs personnalisés.

Développement de plugins Airflow

  • Compréhension de l'architecture des plugins.
  • Conception de plugins pour étendre les fonctionnalités d'Airflow.
  • Meilleures pratiques pour la gestion et le déploiement des plugins.

Intégration d'Airflow avec des systèmes externes

  • Connexion d'Airflow aux bases de données, APIs et services cloud.
  • Utilisation d'Airflow pour les workflows ETL et le traitement de données en temps réel.
  • Gestion des dépendances entre Airflow et les systèmes externes.

Débogage et surveillance avancés

  • Utilisation des journaux et métriques d'Airflow pour le dépannage.
  • Configuration d'alertes et de notifications pour les problèmes de workflows.
  • Utilisation d'outils de surveillance externes avec Airflow.

Optimisation des performances et de l'évolutivité

  • Mise à l'échelle d'Airflow avec les exécuteurs Celery et Kubernetes.
  • Optimisation de l'utilisation des ressources dans des workflows complexes.
  • Stratégies pour la haute disponibilité et la tolérance aux pannes.

Études de cas et applications réelles

  • Exploration de cas d'utilisation avancés en ingénierie de données et DevOps.
  • Étude de cas : implémentation d'un opérateur personnalisé pour un ETL à grande échelle.
  • Meilleures pratiques pour la gestion des workflows d'entreprise.

Résumé et prochaines étapes

Pré requis

  • Bonne maîtrise des concepts de base d'Apache Airflow, y compris les DAGs, opérateurs et architecture d'exécution.
  • Maîtrise de la programmation Python.
  • Expérience dans l'intégration de systèmes de données et l'orchestration de workflows.

Public cible

  • Ingénieurs de données
  • Ingénieurs DevOps
  • Architectes logiciels
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires