Prenez contact avec nous

Plan du cours

Introduction

  • Comprendre l'importance de la préparation des données dans l'analyse et l'apprentissage automatique
  • Pipeline de préparation des données et son rôle dans le cycle de vie des données
  • Explorer les défis courants liés aux données brutes et leur impact sur l'analyse

Collecte et acquisition des données

  • Sources de données : bases de données, API, feuilles de calcul, fichiers texte, etc.
  • Techniques de collecte des données et assurance de la qualité des données lors de la collecte
  • Collecte des données à partir de diverses sources

Techniques de nettoyage des données

  • Identification et traitement des valeurs manquantes, des valeurs aberrantes et des incohérences
  • Gestion des doublons et des erreurs dans le jeu de données
  • Nettoyage de jeux de données réels

Transformation et standardisation des données

  • Techniques de normalisation et de standardisation des données
  • Traitement des données catégorielles : codage, binning et ingénierie des fonctionnalités
  • Transformation des données brutes en formats exploitables

Intégration et agrégation des données

  • Fusion et combinaison de jeux de données provenant de différentes sources
  • Résolution des conflits de données et alignement des types de données
  • Techniques d'agrégation et de consolidation des données

Vérification de la qualité des données

  • Méthodes pour garantir la qualité et l'intégrité des données tout au long du processus
  • Mise en œuvre de contrôles de qualité et de procédures de validation
  • Études de cas et applications pratiques de la vérification de la qualité des données

Réduction de la dimensionnalité et sélection des fonctionnalités

  • Comprendre la nécessité de la réduction de la dimensionnalité
  • Techniques telles que l'ACP, la sélection de fonctionnalités et les stratégies de réduction
  • Mise en œuvre des techniques de réduction de la dimensionnalité

Résumé et prochaines étapes

Pré requis

  • Compréhension de base des concepts relatifs aux données

Public cible

  • Analystes de données
  • Administrateurs de bases de données
  • Professionnels de l'informatique
 14 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires