Prenez contact avec nous

Plan du cours

Introduction à l'AIOps avec des outils open source

  • Aperçu des concepts et avantages de l'AIOps.
  • Prometheus et Grafana dans la pile d'observabilité.
  • La place du machine learning dans l'AIOps : analytics prédictifs vs réactifs.

Configuration de Prometheus et Grafana

  • Installation et configuration de Prometheus pour la collecte de données série temporelle.
  • Création de tableaux de bord dans Grafana à l'aide de métriques en temps réel.
  • Exploration des exporters, du relabeling et de la découverte de services.

Prétraitement des données pour le machine learning

  • Extraction et transformation des métriques Prometheus.
  • Préparation des ensembles de données pour la détection d'anomalies et la prévision.
  • Utilisation des transformations de Grafana ou des pipelines Python.

Application du machine learning pour la détection d'anomalies

  • Modèles ML basiques pour la détection de valeurs aberrantes (par ex. Isolation Forest, One-Class SVM).
  • Entraînement et évaluation des modèles sur des données série temporelle.
  • Visualisation des anomalies dans les tableaux de bord Grafana.

Prévision des métriques avec le machine learning

  • Construction de modèles de prévision simples (ARIMA, Prophet, introduction à LSTM).
  • Prédiction de la charge système ou de l'utilisation des ressources.
  • Utilisation des prévisions pour les alertes précoces et les décisions de mise à l'échelle.

Intégration du machine learning avec les alertes et l'automatisation

  • Définition des règles d'alerte basées sur les sorties ML ou les seuils.
  • Utilisation d'Alertmanager et du routage des notifications.
  • Déclenchement de scripts ou de workflows d'automatisation lors de la détection d'anomalies.

Mise à l'échelle et industrialisation de l'AIOps

  • Intégration d'outils externes d'observabilité (par ex. ELK stack, Moogsoft, Dynatrace).
  • Industrialisation des modèles ML dans les pipelines d'observabilité.
  • Bonnes pratiques pour l'AIOps à grande échelle.

Synthèse et prochaines étapes

Pré requis

  • Une compréhension des concepts de surveillance système et d'observabilité.
  • De l'expérience avec Grafana ou Prometheus.
  • Familiarité avec Python et les principes de base du machine learning.

Public cible

  • Ingénieurs en observabilité.
  • Équipes infrastructure et DevOps.
  • Architectes de plateformes de monitoring et ingénieurs fiabilité des sites (SRE).
 14 Heures

Nombre de participants


Prix par participant

Cours à venir

Catégories Similaires