Prenez contact avec nous

Plan du cours

Fondamentaux des opérations cloud sur AWS

  • Rôles et responsabilités opérationnels dans le cloud
  • Structure des comptes AWS, organisations et stratégie multi-comptes
  • Services opérationnels principaux : CloudWatch, CloudTrail, AWS Config

Infrastructure as Code et provisionnement

  • Principes de l'IaC et de l'infrastructure immuable
  • Provisionnement avec Terraform et AWS CloudFormation
  • Gestion de l'état, des modules et de la promotion des environnements

CI/CD et stratégies de déploiement

  • Conception de pipelines CI/CD pour les applications natives du cloud
  • Déploiements blue/green, canary et en roulement
  • Automatisation du retour arrière, des vérifications de santé et de la validation des releases

Surveillance, observabilité et alertes

  • Métriques, journaux et traces : collecter, stocker et analyser
  • Utilisation de CloudWatch, X-Ray et d'outils d'observabilité tiers
  • Définition des SLO/SLI, des politiques d'alerte et des pratiques de garde après-service (on-call)

Opérations de sécurité et gestion des identités

  • Bonnes pratiques IAM, privilège minimum et accès inter-comptes
  • Gestion des secrets, KMS et magasins de paramètres sécurisés
  • Sécurité opérationnelle : stratégies de mise à jour, analyse des vulnérabilités et traces d'audit

Résilience, sauvegarde et reprise après sinistre

  • Conception pour la tolérance aux pannes et la haute disponibilité
  • Stratégies de sauvegarde, automatisation des snapshots et procédures de restauration
  • Planification de la reprise après sinistre et création de runbooks

Optimisation des coûts et gouvernance

  • Visibilité des coûts : facturation, étiquetage et stratégies d'allocation des coûts
  • Droitsizing, instances réservées/plans d'économies et contrôles budgétaires
  • Gouvernance : politiques, garde-fous et automatisation pour la conformité

Conteneurs, serverless et opérations d'exécution

  • Considérations opérationnelles pour ECS, EKS et Lambda
  • Découverte de services, mise à l'échelle automatique et limites de ressources
  • Journalisation, traçage et débogage des charges de travail conteneurisées

Réponse aux incidents, playbooks et ingénierie du chaos

  • Réponse aux incidents guidée par des runbooks et pratiques de retour d'expérience (postmortem)
  • Automatisation des corrections et des schémas d'auto-guérison
  • Introduction aux expériences de chaos pour valider la résilience

Atelier pratique : exploitation d'une charge de travail exemple

  • Déployer une application exemple en utilisant l'IaC et un pipeline CI/CD
  • Mettre en œuvre la surveillance, les alertes et un script de correction automatisée
  • Simuler des incidents et pratiquer la réponse basée sur les runbooks

Résumé et prochaines étapes

Pré requis

  • Une compréhension de base des concepts du cloud et du réseau
  • Familiarité avec la ligne de commande Linux et la programmation de scripts
  • Expérience avec le contrôle de versions (Git) et les concepts de base de CI/CD

Participants concernés

  • Ingénieurs d'exploitation cloud
  • Ingénieurs SRE et plateforme
  • Ingénieurs DevOps et chefs d'équipe technique
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires