Plan du cours
Introduction à Apache Spark
- Le rôle de Spark dans le traitement des big data
- L'architecture de Spark et ses composants
Mise en place Apache Spark
- Exigences matérielles et logicielles
- Procédures d'installation en mode autonome et en mode cluster
- Meilleures pratiques de configuration pour les administrateurs système
Administration des clusters Spark
- Outils et techniques de gestion des clusters
- Surveillance des applications Spark et des ressources du cluster
- Configurations de sécurité et gestion des utilisateurs
Optimisation des performances
- Allocation des ressources et planification
- Optimisation des performances de Spark
- Identifier et résoudre les goulots d'étranglement courants
Dépannage et résolution de problèmes
- Défis courants de l'administration de Spark
- Outils de diagnostic et techniques de dépannage
- Approche étape par étape pour résoudre les problèmes courants
- Meilleures pratiques pour maintenir un environnement Spark sain
Sujets relatifs à l'administration avancée
- Intégration avec d'autres outils big data
- Assurer la haute disponibilité et la reprise après sinistre
- Mise à jour et mise à l'échelle des clusters Spark
Résumé et prochaines étapes
Pré requis
- Connaissance de base de la configuration et de la gestion des réseaux
- Familiarité avec le système d'exploitation Linux et l'interface de ligne de commande
- Intérêt pour l'apprentissage des systèmes informatiques distribués et de la gestion des données massives (big data)
Public
- Administrateurs système
Nos clients témoignent (3)
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique