Plan du cours
Introduction à la plateforme Stratio
- Aperçu de l'architecture de Stratio et des modules clés
- Rôle de Rocket et Intelligence dans le cycle de vie des données
- Connexion et navigation dans l'interface utilisateur de Stratio
Utilisation du module Rocket
- Ingestion des données et création de pipelines
- Connexion aux sources de données et configuration des transformations
- Utilisation de PySpark pour les tâches de prétraitement dans Rocket
Essentiels de PySpark pour les utilisateurs de Stratio
- Structures de données et opérations PySpark
- Structures de bouclage : utilisation de for, while, if/else
- Écriture de fonctions personnalisées avec def et leur application
Utilisation avancée de Rocket avec PySpark
- Ingestion de flux et transformations en continu
- Utilisation de boucles et de fonctions dans les scénarios par lots et en temps réel
- Bonnes pratiques pour les performances des pipelines PySpark
Exploration du module Intelligence
- Aperçu des fonctionnalités de modélisation et d'analyse des données
- Sélection, transformation et exploration des fonctionnalités
- Rôle de PySpark dans l'analyse personnalisée et la génération d'informations
Construction de flux de travail d'analyse avancés
- Création de fonctions définies par l'utilisateur (UDF) dans Intelligence
- Application de conditions et de boucles pour la logique des données
- Cas d'utilisation : segmentation, agrégation et prédiction
Déploiement et collaboration
- Sauvegarde, exportation et réutilisation des flux de travail
- Collaboration avec d'autres membres de l'équipe sur Stratio
- Examen des résultats et intégration avec les outils aval
Résumé et prochaines étapes
Pré requis
- Expérience en programmation Python
- Compréhension des concepts d'analyse de données ou de traitement du big data
- Connaissance de base d'Apache Spark et du calcul distribué
Audience
- Ingénieurs des données travaillant sur des plateformes basées sur Stratio
- Analyses ou développeurs utilisant les modules Rocket et Intelligence
- Équipes techniques passant aux flux de travail PySpark au sein de Stratio
Nos clients témoignent (2)
Faire de l'exercice
Joe Pang - Lands Department, Hong Kong
Formation - QGIS for Geographic Information System
Traduction automatique
Des exemples pratiques nous ont permis de ressentir concrètement le fonctionnement du programme. De bonnes explications et une intégration efficace des concepts théoriques et de leur rapport aux applications pratiques.
Ian - Archeoworks Inc.
Formation - ArcGIS Fundamentals
Traduction automatique