Plan du cours
Introduction
- Apache Spark vs Hadoop MapReduce
Aperçu des fonctionnalités et de l'architecture d'Apache Spark
Choix d'un langage de programmation
Mise en place d'Apache Spark
Création d'une application d'exemple
Choix de l'ensemble de données
Réalisation d'analyses de données sur les données
Traitement des données structurées avec Spark SQL
Traitement des données en streaming avec Spark Streaming
Intégration d'Apache Spark avec des outils d'apprentissage automatique tiers
Utilisation d'Apache Spark pour le traitement de graphes
Optimisation d'Apache Spark
Dépannage
Résumé et conclusion
Pré requis
- Expérience avec la ligne de commande Linux
- Une compréhension générale du traitement des données
- Une expérience en programmation avec Java, Scala, Python ou R
Public cible
- Développeurs
Nos clients témoignent (2)
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique