Plan du cours
Introduction aux Google Colab et Apache Spark
- Aperçu de Google Colab
- Introduction à Apache Spark
- Configuration de Spark dans Google Colab
Traitement des données avec Apache Spark
- Travail avec RDDs et DataFrames
- Chargement et traitement de grands ensembles de données
- Utilisation de Spark SQL pour interroger des données structurées
Analyse avancée avec Spark
- Apprentissage automatique avec Spark MLlib
- Réalisation d'analyses de données en temps réel
- Calcul distribué avec Spark
Visualisation et Collaboration dans Google Colab
- Intégration de Colab avec des bibliothèques de visualisation populaires
- Travaux collaboratifs avec les notebooks Colab
- Partage et exportation des résultats
Optimisation des workflows Big Data
- Paramétrage de Spark pour la performance
- Optimisation de l'utilisation de la mémoire et du stockage
- Échelonnement des workflows pour les grands ensembles de données
Big Data dans le Cloud
- Intégration de Google Colab avec des outils basés sur le cloud
- Utilisation du stockage en nuage pour les grands volumes de données
- Travail avec Spark dans des environnements distribués en nuage
Études de cas et meilleures pratiques
- Revue d'applications réelles de grands volumes de données
- Études de cas utilisant Apache Spark et Colab
- Meilleures pratiques pour l'analyse des grands ensembles de données
Résumé et prochaines étapes
Pré requis
- Connaissance de base des concepts en science des données
- Familiarité avec Apache Spark
- Compétences en programmation Python
Public cible
- Scientifiques des données
- Ingénieurs de données
- Chercheurs travaillant avec de grandes masses de données
Nos clients témoignent (3)
Faire de l'exercice
Joe Pang - Lands Department, Hong Kong
Formation - QGIS for Geographic Information System
Traduction automatique
Des exemples pratiques nous ont permis de ressentir concrètement le fonctionnement du programme. De bonnes explications et une intégration efficace des concepts théoriques et de leur rapport aux applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique
J'ai hâte de suivre à nouveau une formation avec Any, il était vraiment excellent. Je ne suis qu'un spécialiste des SIG, mais Any a rendu tout très clair pour moi, il expliquait les processus complexes en termes simples. Continuez comme ça, merci.
Lwazi Qhingana - South African National Roads Agency (SANRAL) SOC Ltd
Formation - Python for Geographic Information System (GIS)
Traduction automatique