Plan du cours
Fondements du stockage de données
- Objectifs, composants et architecture du entrepôt de données
- Données de marts, entrepôts d'entreprise et modèles lakehouse
- Fondamentaux OLTP vs OLAP et séparation des charges de travail
Mise en œuvre dimensionnelle
- Faits, dimensions et grain
- Schema étoile vs schema flocon
- Types et gestion de dimensions lentement changeantes
Processus ETL et ELT
- Stratégies d'extraction depuis OLTP et API
- Transformations, nettoyage des données et conformité
- Modes de chargement, orchestration et gestion des dépendances
Gestion de la qualité des données et du métadonnées
- Profiling des données et règles de validation
- Alignement des données maîtres et de référence
- Lignage, catalogues et documentation
Analytique et performance
- Concepts cubiques, agrégations et vues matérialisées
- Définition en partitions, clustering et indexation pour l'analyse
- Gestion des charges de travail, mise en cache et optimisation des requêtes
Sécurité et gouvernance
- Contrôle d'accès, rôles et sécurité au niveau ligne
- Considérations réglementaires et audit
- Pratiques de sauvegarde, récupération et fiabilité
Architectures modernes
- Entrepôts de données cloud et élasticité
- Ingestion en flux et analyse quasi temps réel
- Optimisation des coûts et surveillance
Bloc conclusive : De la source au schéma étoile
- Mise en œuvre d'un processus métier en faits et dimensions
- Conception d'un flux ETL ou ELT bout en bout
- Publication de tableaux de bord et validation des métriques
Récapitulatif et Étapes suivantes
Pré requis
- Une compréhension des bases de données relationnelles et de SQL
- Expérience en analyse ou reporting de données
- Familiarité de base avec les plateformes cloud ou sur site pour la gestion des données
Public cible
- Analystes de données en transition vers le stockage de données
- Développeurs BI et ingénieurs ETL
- Architectes de données et chefs d'équipe
Nos clients témoignent (5)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique