Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Architecture de Greenplum
- Traitement parallèle et traitement multi-processeur symétrique
- Rôles des segments et configuration du cluster
- Évolutivité et déplacement des données
- Architecture de l'entrepôt de données Greenplum
Structures de tables Greenplum
- Tables distribuées vs tables à assignation aléatoire
- Tables heap vs tables en append-only
- Formats de stockage en ligne (row) vs colonnes (columnar)
- Tables partitionnées et groupées (clustered)
Distribution des données et hachage
- Logique de hachage et clés de distribution
- Gestion de l'asymétrie des données (skew) et impact sur la performance
- Cartes de hachage et stratégies de placement des lignes
Indexation et optimisation des performances
- Index groupés et non groupés
- Cas d'utilisation des index B-tree et bitmap
- Comportement des scans d'index et du stockage
Conception physique de la base de données
- Normalisation et conception du modèle logique
- Stratégies d'accès utilisateur et analyse de la distribution
- Démographie des données et décisions d'indexation
Techniques de dénormalisation
- Données dérivées, tables de résumé et jointures pré-calculées
- Tables colonnes comme partitionnement vertical
- Data marts et vues matérialisées
SQL avancé et exécution des requêtes
- Stratégies de jointure et redistribution
- Fonctions OLAP et fenêtres
- Tables temporaires, sous-requêtes et tables dérivées
Plans EXPLAIN et réglage des requêtes
- Lecture et interprétation de la sortie EXPLAIN
- Analyse des coûts et optimisation des plans
- Déplacement des jointures et opérations locales aux segments
Utilitaires Greenplum et bonnes pratiques
- ANALYZE et VACUUM
- Chargement et déplacement des données avec Nexus
- Sécurité, permissions et conseils de performance
Récapitulatif et prochaines étapes
Pré requis
- Connaissance des bases de données relationnelles et de SQL
- Expérience avec les systèmes d'entrepôt de données ou analytiques
- Familiarité avec les commandes du shell Linux
Public cible
- Architectes et ingénieurs en données
- Administrateurs de bases de données et chefs de projet techniques
- Développeurs BI et spécialistes de l'analyse travaillant avec Greenplum
21 Heures
Nos clients témoignent (1)
les pratiques
Liliana Padilla - Hipodromo de Agua Caliente
Formation - Greenplum Architecture and Data Modeling
Traduction automatique