Plan du cours

Introduction à l'alerting avancé

  • Principes clés de l'alerting dans les systèmes IT
  • Aperçu de Prometheus Alertmanager
  • Capacités d'alerting dans Grafana

Création de règles d'alerting avancées

  • Définition des règles d'alerting dans Prometheus
  • Utilisation des labels et annotations pour les alertes
  • Stratégies de groupement et de silenciation

Intégration d'Alertmanager avec des systèmes externes

  • Configuration des webhooks pour les intégrations externes
  • Intégration avec des outils comme Slack, PagerDuty et les systèmes de messagerie électronique
  • Personnalisation des modèles d'Alertmanager

Automatisation des réponses aux alertes

  • Mise en œuvre de flux de travail d'automatisation corrective
  • Intégration avec des outils d'orchestration (par exemple, Ansible, Kubernetes)
  • Utilisation de scripts pour la résolution automatisée des problèmes

Visualisation des alertes dans Grafana

  • Configuration des panneaux d'alerte dans Grafana
  • Personnalisation des notifications et seuils d'alerte
  • Bonnes pratiques pour la surveillance de l'état des alertes

Gestion des alerts en grand volume

  • Gestion efficace des tempêtes d'alertes
  • Optimisation des performances de Prometheus pour l'alerting
  • Considérations de scalabilité pour Alertmanager

Évolution et techniques avancées

  • Configurations d'alerting distribuées avec Prometheus et Alertmanager
  • Intégration avec des solutions d'alerting basées sur le cloud
  • Exploration des nouvelles fonctionnalités dans les écosystèmes Grafana et Prometheus

Résumé et étapes suivantes

Pré requis

  • Expérience de base avec Grafana et Prometheus
  • Compréhension des concepts de surveillance IT
  • Connaissance du scripting ou de la programmation pour l'automatisation

Public cible

  • Ingénieurs DevOps
  • Ingénieurs de fiabilité des sites (SREs)
 14 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires