Plan du cours
Introduction
- Aperçu des fonctionnalités et de l'architecture de Spark et Hadoop
- Compréhension du Big Data
- Notions de base de la programmation Python
Premiers pas
- Installation de Python, Spark et Hadoop
- Compréhension des structures de données en Python
- Maîtrise de l'API PySpark
- Compréhension de HDFS et MapReduce
Intégration de Spark et Hadoop avec Python
- Implémentation des RDD Spark en Python
- Traitement des données avec MapReduce
- Création de jeux de données distribués dans HDFS
Apprentissage automatique avec Spark MLlib
Traitement du Big Data avec Spark Streaming
Travail avec les systèmes de recommandation
Travail avec Kafka, Sqoop et Flume
Apache Mahout avec Spark et Hadoop
Dépannage
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Expérience en programmation Python
Public cible
- Scientifiques des données
- Développeurs
Nos clients témoignent (3)
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
J'ai aimé qu'il arrive à poser les bases du sujet et à aborder des exercices assez avancés. Il a également fourni des méthodes simples pour écrire et tester le code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique