Prenez contact avec nous

Plan du cours

Introduction à Apache Spark

  • Rôle de Spark dans le traitement des mégadonnées
  • Architecture de Spark et ses composants

Configuration d'Apache Spark

  • Exigences matérielles et logicielles
  • Procédures d'installation en mode autonome et en mode cluster
  • Meilleures pratiques de configuration pour les administrateurs système

Administration des clusters Spark

  • Outils et techniques de gestion des clusters
  • Surveillance des applications Spark et des ressources du cluster
  • Configuration de la sécurité et gestion des utilisateurs

Ajustement des performances et optimisation

  • Allocation des ressources et ordonnancement
  • Ajustement de Spark pour des performances optimales
  • Identification et résolution des goulots d'étranglement courants

Dépannage et résolution de problèmes

  • Problèmes courants d'administration de Spark
  • Outils et techniques de diagnostic pour le dépannage
  • Approche étape par étape pour résoudre les problèmes courants
  • Meilleures pratiques pour maintenir un environnement Spark sain

Sujets avancés d'administration

  • Intégration avec d'autres outils de mégadonnées
  • Garantie de haute disponibilité et reprise après sinistre
  • Mise à niveau et mise à l'échelle des clusters Spark

Résumé et prochaines étapes

Pré requis

  • Connaissances de base en configuration et gestion des réseaux
  • Maîtrise du système d'exploitation Linux et de l'interface en ligne de commande
  • Intérêt pour l'apprentissage des systèmes de calcul distribué et de la gestion des mégadonnées (big data)

Public cible

  • Administrateurs système
 35 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires