Plan du cours
Introduction à Apache Iceberg
- Aperçu d'Apache Iceberg
- Révision des concepts de base
Plongée approfondie dans l'architecture Iceberg
- Analyse détaillée du format de table Iceberg
- Présentation détaillée de l'architecture, y compris la métadonnées et la disposition des fichiers
- Fonctionnement interne de l'évolution du schéma et de la partition
Installation avancée et configuration
- Configuration d'Iceberg pour une performance optimale dans différents environnements
- Intégration avec divers moteurs de traitement de données
- Configuration avancée : sécurité, chiffrement et contrôles d'accès
- Mise en place d'Iceberg dans un environnement distribué
Opérations et maintenance avancées
- Gestion de tables Iceberg à grande échelle
- Mise en œuvre et gestion de changements de schéma complexes
- Gestion de l'évolution des partitions et partitionnement caché
- Opérations CRUD avancées avec changements de schéma et de partition
Techniques d'optimisation des requêtes
- Techniques pour réduire la latence des requêtes
- Élagage de partitions et de fichiers
- Mise en cache des métadonnées et stratégies d'optimisation
- Mise en œuvre et test de techniques d'optimisation des requêtes
Optimisation des performances pour les grands ensembles de données
- Optimisation des performances pour les ensembles de données à grande échelle
- Utilisation des fonctionnalités intégrées d'Iceberg pour l'optimisation des performances
- Études de cas sur l'optimisation des performances dans des scénarios du monde réel
- Optimisation des performances pour les ensembles de données à grande échelle
Migration et intégration avancées des données
- Migration de structures de données complexes d'autres systèmes
- Intégration d'Iceberg avec des flux de données en temps réel
- Migration de jeux de données complexes et intégration de flux de données en temps réel
Fiabilité et cohérence
- Assurer la cohérence et l'intégrité des données dans les environnements distribués
- Mise en œuvre et gestion des garanties transactionnelles
- Gestion des pannes et mécanismes de récupération
- Mise en œuvre de fonctionnalités de fiabilité et de cohérence
Fonctionnalités avancées et personnalisation
- Implémentations de catalogues personnalisés
- Extension d'Iceberg avec des fonctionnalités personnalisées
- Mise en œuvre de catalogues personnalisés et extension des fonctionnalités d'Iceberg
Gouvernance et conformité des données
- Mise en œuvre de politiques de gouvernance des données
- Conformité aux réglementations sur les données
- Gestion des traînées d'audit et de la généalogie des données
- Mise en œuvre de fonctionnalités de gouvernance et de conformité
Résumé et étapes suivantes
Pré requis
- Connaissance des concepts de base, des opérations élémentaires et de la gestion des tables Iceberg
Public visé
- Ingénieurs de données
- Architectes de données
- Analystes de données
- Développeurs logiciels
Nos clients témoignent (3)
Les exercices et les échanges lors de questions / réponses
Antoine - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
J'ai aimé qu'il soit pratique. J'ai adoré appliquer les connaissances théoriques avec des exemples pratiques.
Aurelia-Adriana - Allianz Services Romania
Formation - Python and Spark for Big Data (PySpark)
Traduction automatique
Le fait que nous ayons pu emporter avec nous la plupart des informations/cours/présentations/exercices effectués, afin de pouvoir les revoir et éventuellement refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avions déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique