Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction
- Comprendre l'importance de la préparation des données dans l'analyse et l'apprentissage automatique
- Pipeline de préparation des données et son rôle dans le cycle de vie des données
- Explorer les défis courants liés aux données brutes et leur impact sur l'analyse
Collecte et acquisition des données
- Sources de données : bases de données, API, feuilles de calcul, fichiers texte, etc.
- Techniques de collecte des données et assurance de la qualité des données lors de la collecte
- Collecte des données à partir de diverses sources
Techniques de nettoyage des données
- Identification et traitement des valeurs manquantes, des valeurs aberrantes et des incohérences
- Gestion des doublons et des erreurs dans le jeu de données
- Nettoyage de jeux de données réels
Transformation et standardisation des données
- Techniques de normalisation et de standardisation des données
- Traitement des données catégorielles : codage, binning et ingénierie des fonctionnalités
- Transformation des données brutes en formats exploitables
Intégration et agrégation des données
- Fusion et combinaison de jeux de données provenant de différentes sources
- Résolution des conflits de données et alignement des types de données
- Techniques d'agrégation et de consolidation des données
Vérification de la qualité des données
- Méthodes pour garantir la qualité et l'intégrité des données tout au long du processus
- Mise en œuvre de contrôles de qualité et de procédures de validation
- Études de cas et applications pratiques de la vérification de la qualité des données
Réduction de la dimensionnalité et sélection des fonctionnalités
- Comprendre la nécessité de la réduction de la dimensionnalité
- Techniques telles que l'ACP, la sélection de fonctionnalités et les stratégies de réduction
- Mise en œuvre des techniques de réduction de la dimensionnalité
Résumé et prochaines étapes
Pré requis
- Compréhension de base des concepts relatifs aux données
Public cible
- Analystes de données
- Administrateurs de bases de données
- Professionnels de l'informatique
14 Heures
Nos clients témoignent (3)
formateur connait bien son sujet
Pascal - NOOUS pour Atos/Eviden
Formation - EBX5 for Developers
La variété des informations partagées et la clarté pour expliquer les termes en langage simple.
Arisbe Mendoza - Fairtrade International
Formation - GDPR Workshop
Traduction automatique
C'est une session pratique.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Formation - Talend Open Studio for ESB
Traduction automatique