Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à Apache Spark
- Rôle de Spark dans le traitement des mégadonnées
- Architecture de Spark et ses composants
Configuration d'Apache Spark
- Exigences matérielles et logicielles
- Procédures d'installation en mode autonome et en mode cluster
- Meilleures pratiques de configuration pour les administrateurs système
Administration des clusters Spark
- Outils et techniques de gestion des clusters
- Surveillance des applications Spark et des ressources du cluster
- Configuration de la sécurité et gestion des utilisateurs
Ajustement des performances et optimisation
- Allocation des ressources et ordonnancement
- Ajustement de Spark pour des performances optimales
- Identification et résolution des goulots d'étranglement courants
Dépannage et résolution de problèmes
- Problèmes courants d'administration de Spark
- Outils et techniques de diagnostic pour le dépannage
- Approche étape par étape pour résoudre les problèmes courants
- Meilleures pratiques pour maintenir un environnement Spark sain
Sujets avancés d'administration
- Intégration avec d'autres outils de mégadonnées
- Garantie de haute disponibilité et reprise après sinistre
- Mise à niveau et mise à l'échelle des clusters Spark
Résumé et prochaines étapes
Pré requis
- Connaissances de base en configuration et gestion des réseaux
- Maîtrise du système d'exploitation Linux et de l'interface en ligne de commande
- Intérêt pour l'apprentissage des systèmes de calcul distribué et de la gestion des mégadonnées (big data)
Public cible
- Administrateurs système
35 Heures
Nos clients témoignent (2)
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique