Prenez contact avec nous

Plan du cours

Architecture de Greenplum

  • Traitement parallèle et traitement multi-processeur symétrique
  • Rôles des segments et configuration du cluster
  • Évolutivité et déplacement des données
  • Architecture de l'entrepôt de données Greenplum

Structures de tables Greenplum

  • Tables distribuées vs tables à assignation aléatoire
  • Tables heap vs tables en append-only
  • Formats de stockage en ligne (row) vs colonnes (columnar)
  • Tables partitionnées et groupées (clustered)

Distribution des données et hachage

  • Logique de hachage et clés de distribution
  • Gestion de l'asymétrie des données (skew) et impact sur la performance
  • Cartes de hachage et stratégies de placement des lignes

Indexation et optimisation des performances

  • Index groupés et non groupés
  • Cas d'utilisation des index B-tree et bitmap
  • Comportement des scans d'index et du stockage

Conception physique de la base de données

  • Normalisation et conception du modèle logique
  • Stratégies d'accès utilisateur et analyse de la distribution
  • Démographie des données et décisions d'indexation

Techniques de dénormalisation

  • Données dérivées, tables de résumé et jointures pré-calculées
  • Tables colonnes comme partitionnement vertical
  • Data marts et vues matérialisées

SQL avancé et exécution des requêtes

  • Stratégies de jointure et redistribution
  • Fonctions OLAP et fenêtres
  • Tables temporaires, sous-requêtes et tables dérivées

Plans EXPLAIN et réglage des requêtes

  • Lecture et interprétation de la sortie EXPLAIN
  • Analyse des coûts et optimisation des plans
  • Déplacement des jointures et opérations locales aux segments

Utilitaires Greenplum et bonnes pratiques

  • ANALYZE et VACUUM
  • Chargement et déplacement des données avec Nexus
  • Sécurité, permissions et conseils de performance

Récapitulatif et prochaines étapes

Pré requis

  • Connaissance des bases de données relationnelles et de SQL
  • Expérience avec les systèmes d'entrepôt de données ou analytiques
  • Familiarité avec les commandes du shell Linux

Public cible

  • Architectes et ingénieurs en données
  • Administrateurs de bases de données et chefs de projet techniques
  • Développeurs BI et spécialistes de l'analyse travaillant avec Greenplum
 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires