Prenez contact avec nous

Plan du cours

Introduction

  • Aperçu des fonctionnalités et de l'architecture de Spark et Hadoop
  • Compréhension du Big Data
  • Notions de base de la programmation Python

Premiers pas

  • Installation de Python, Spark et Hadoop
  • Compréhension des structures de données en Python
  • Maîtrise de l'API PySpark
  • Compréhension de HDFS et MapReduce

Intégration de Spark et Hadoop avec Python

  • Implémentation des RDD Spark en Python
  • Traitement des données avec MapReduce
  • Création de jeux de données distribués dans HDFS

Apprentissage automatique avec Spark MLlib

Traitement du Big Data avec Spark Streaming

Travail avec les systèmes de recommandation

Travail avec Kafka, Sqoop et Flume

Apache Mahout avec Spark et Hadoop

Dépannage

Résumé et prochaines étapes

Pré requis

  • Expérience avec Spark et Hadoop
  • Expérience en programmation Python

Public cible

  • Scientifiques des données
  • Développeurs
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires