Prenez contact avec nous

Plan du cours

Introduction à Teradata

Module 1 : Fondamentaux de Teradata et son architecture

  • Qu'est-ce que Teradata et à quoi sert-il ?
  • Architecture parallèle : AMPs, PEs, BYNET
  • Distribution des données et hachage
  • Concepts clés : sessions, spool, verrous
  • Connexion au système : Teradata Studio / BTEQ / SQL Assistant

Module 2 : Introduction au SQL sous Teradata

  • SELECT de base, WHERE, ORDER BY
  • Types de données et cast
  • Fonctions mathématiques et de date
  • Utilisation des ALIAS, expressions CASE
  • Opérateurs spéciaux de Teradata (TOP, QUALIFY, SAMPLE)
  • Pratique guidée : requêtes sur des tables réelles

Module 3 : Joins, sous-requêtes et opérateurs d'ensembles

  • INNER, LEFT, RIGHT, FULL OUTER JOIN
  • Joins sans clause ON (produit cartésien)
  • Sous-requêtes scalaires et corrélées
  • UNION, INTERSECT, MINUS
  • Exercices pratiques d'intégration de données

Module 4 : Fonctions analytiques et OLAP

  • RANK(), ROW_NUMBER(), DENSE_RANK()
  • Partitionnement des données avec PARTITION BY
  • Fenêtres avec OVER() et ORDER BY
  • LAG(), LEAD(), FIRST_VALUE()
  • Cas d'usage : KPIs, tendances, accumulations

Module 5 : Gestion des données et des tables

  • Types de tables : persistantes, volatiles, globales temporaires
  • Création et utilisation d'index secondaires et de join indexes
  • Insertions, mises à jour et suppressions d'enregistrements
  • MERGE, UPSERT et contrôle des doublons
  • Transactions et contrôle des verrous

Module 6 : Optimisation et tuning de performance

  • L'Optimizer de Teradata : comment il décide des plans
  • Utilisation d'EXPLAIN et COLLECT STATISTICS
  • Skew et comment l'éviter
  • Bonnes pratiques de conception des requêtes
  • Identification des goulots d'étranglement (spool, verrous, redistribution)
  • Pratique : comparaison entre requêtes optimisées vs. non optimisées

Module 7 : Partitionnement et compression des données

  • Types de partitionnement : Range, Case, Multi-Level
  • Avantages et utilisation pratique sur de grandes requêtes
  • Block Level Compression (BLC) et Columnar Compression
  • Avantages et limites

Module 8 : Chargement et extraction des données

  • TPT (Teradata Parallel Transporter) vs. FastLoad / MultiLoad
  • Chargement en masse vs. insertion par lots
  • Gestion des erreurs et des réessais
  • Exportation des résultats vers des fichiers ou systèmes externes
  • Automatisation de base avec des scripts et utilitaires

Module 9 : Administration de base pour utilisateurs techniques

  • Rôles et permissions
  • Contrôle des ressources (Query Bands, Priority Scheduler)
  • Surveillance avec DBQLOGTBL, DBC.Tables, ResUsage
  • Bonnes pratiques pour les environnements partagés

Module 10 : Laboratoire final d'intégration

  • Cas pratique de bout en bout :
    • Chargement des données
    • Transformation et agrégation
    • Construction d'indicateurs avec des fonctions OLAP
    • Optimisation et explication
    • Exportation finale
  • Discussion sur les bonnes pratiques et les erreurs courantes

Pré requis

  • Compréhension des bases de données relationnelles et des concepts SQL
  • Expérience dans l'interrogation de grands ensembles de données ou travail dans des environnements de données
  • Familiarité avec les objectifs de l'intelligence économique ou analytique

Audience

  • Analystes de données et professionnels de l'intelligence économique
  • Développeurs SQL et ingénieurs de données
  • Utilisateurs techniques qui gèrent ou optimisent les données dans des environnements Teradata
 35 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires