Plan du cours
Introduction
Aperçu des approches d'accès aux données (Hive, bases de données, etc.)
Aperçu des fonctionnalités et de l'architecture de Spark
Installation et configuration de Spark
Compréhension des DataFrames dans Spark
Définition des tables et importation de jeux de données
Interrogation des DataFrames via SQL
Réalisation d'agrégations, de jointures (JOINs) et de requêtes imbriquées
Téléchargement et accès aux données
Interrogation de différents types de données
- JSON, Parquet, etc.
Interrogation des lacs de données (Data Lakes) avec SQL
Dépannage
Synthèse et conclusion
Pré requis
- Expérience avec les requêtes SQL
- Expérience en programmation dans n'importe quel langage
Public visé
- Analystes de données
- Scientifiques des données
- Ingénieurs de données
Nos clients témoignent (2)
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique