Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Fondamentaux des opérations cloud sur AWS
- Rôles et responsabilités opérationnels dans le cloud
- Structure des comptes AWS, organisations et stratégie multi-comptes
- Services opérationnels principaux : CloudWatch, CloudTrail, AWS Config
Infrastructure as Code et provisionnement
- Principes de l'IaC et de l'infrastructure immuable
- Provisionnement avec Terraform et AWS CloudFormation
- Gestion de l'état, des modules et de la promotion des environnements
CI/CD et stratégies de déploiement
- Conception de pipelines CI/CD pour les applications natives du cloud
- Déploiements blue/green, canary et en roulement
- Automatisation du retour arrière, des vérifications de santé et de la validation des releases
Surveillance, observabilité et alertes
- Métriques, journaux et traces : collecter, stocker et analyser
- Utilisation de CloudWatch, X-Ray et d'outils d'observabilité tiers
- Définition des SLO/SLI, des politiques d'alerte et des pratiques de garde après-service (on-call)
Opérations de sécurité et gestion des identités
- Bonnes pratiques IAM, privilège minimum et accès inter-comptes
- Gestion des secrets, KMS et magasins de paramètres sécurisés
- Sécurité opérationnelle : stratégies de mise à jour, analyse des vulnérabilités et traces d'audit
Résilience, sauvegarde et reprise après sinistre
- Conception pour la tolérance aux pannes et la haute disponibilité
- Stratégies de sauvegarde, automatisation des snapshots et procédures de restauration
- Planification de la reprise après sinistre et création de runbooks
Optimisation des coûts et gouvernance
- Visibilité des coûts : facturation, étiquetage et stratégies d'allocation des coûts
- Droitsizing, instances réservées/plans d'économies et contrôles budgétaires
- Gouvernance : politiques, garde-fous et automatisation pour la conformité
Conteneurs, serverless et opérations d'exécution
- Considérations opérationnelles pour ECS, EKS et Lambda
- Découverte de services, mise à l'échelle automatique et limites de ressources
- Journalisation, traçage et débogage des charges de travail conteneurisées
Réponse aux incidents, playbooks et ingénierie du chaos
- Réponse aux incidents guidée par des runbooks et pratiques de retour d'expérience (postmortem)
- Automatisation des corrections et des schémas d'auto-guérison
- Introduction aux expériences de chaos pour valider la résilience
Atelier pratique : exploitation d'une charge de travail exemple
- Déployer une application exemple en utilisant l'IaC et un pipeline CI/CD
- Mettre en œuvre la surveillance, les alertes et un script de correction automatisée
- Simuler des incidents et pratiquer la réponse basée sur les runbooks
Résumé et prochaines étapes
Pré requis
- Une compréhension de base des concepts du cloud et du réseau
- Familiarité avec la ligne de commande Linux et la programmation de scripts
- Expérience avec le contrôle de versions (Git) et les concepts de base de CI/CD
Participants concernés
- Ingénieurs d'exploitation cloud
- Ingénieurs SRE et plateforme
- Ingénieurs DevOps et chefs d'équipe technique
21 Heures
Nos clients témoignent (1)
La convivialité tout en apprenant