Plan du cours
Introduction à Apache Iceberg
- Aperçu d'Apache Iceberg
 - Révision des concepts de base
 
Plongée approfondie dans l'architecture Iceberg
- Analyse détaillée du format de table Iceberg
 - Présentation détaillée de l'architecture, y compris la métadonnées et la disposition des fichiers
 - Fonctionnement interne de l'évolution du schéma et de la partition
 
Installation avancée et configuration
- Configuration d'Iceberg pour une performance optimale dans différents environnements
 - Intégration avec divers moteurs de traitement de données
 - Configuration avancée : sécurité, chiffrement et contrôles d'accès
 - Mise en place d'Iceberg dans un environnement distribué
 
Opérations et maintenance avancées
- Gestion de tables Iceberg à grande échelle
 - Mise en œuvre et gestion de changements de schéma complexes
 - Gestion de l'évolution des partitions et partitionnement caché
 - Opérations CRUD avancées avec changements de schéma et de partition
 
Techniques d'optimisation des requêtes
- Techniques pour réduire la latence des requêtes
 - Élagage de partitions et de fichiers
 - Mise en cache des métadonnées et stratégies d'optimisation
 - Mise en œuvre et test de techniques d'optimisation des requêtes
 
Optimisation des performances pour les grands ensembles de données
- Optimisation des performances pour les ensembles de données à grande échelle
 - Utilisation des fonctionnalités intégrées d'Iceberg pour l'optimisation des performances
 - Études de cas sur l'optimisation des performances dans des scénarios du monde réel
 - Optimisation des performances pour les ensembles de données à grande échelle
 
Migration et intégration avancées des données
- Migration de structures de données complexes d'autres systèmes
 - Intégration d'Iceberg avec des flux de données en temps réel
 - Migration de jeux de données complexes et intégration de flux de données en temps réel
 
Fiabilité et cohérence
- Assurer la cohérence et l'intégrité des données dans les environnements distribués
 - Mise en œuvre et gestion des garanties transactionnelles
 - Gestion des pannes et mécanismes de récupération
 - Mise en œuvre de fonctionnalités de fiabilité et de cohérence
 
Fonctionnalités avancées et personnalisation
- Implémentations de catalogues personnalisés
 - Extension d'Iceberg avec des fonctionnalités personnalisées
 - Mise en œuvre de catalogues personnalisés et extension des fonctionnalités d'Iceberg
 
Gouvernance et conformité des données
- Mise en œuvre de politiques de gouvernance des données
 - Conformité aux réglementations sur les données
 - Gestion des traînées d'audit et de la généalogie des données
 - Mise en œuvre de fonctionnalités de gouvernance et de conformité
 
Résumé et étapes suivantes
Pré requis
- Connaissance des concepts de base, des opérations élémentaires et de la gestion des tables Iceberg
 
Public visé
- Ingénieurs de données
 - Architectes de données
 - Analystes de données
 - Développeurs logiciels
 
Nos clients témoignent (5)
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique