Prenez contact avec nous

Plan du cours

Introduction à l'apprentissage automatique

  • Types d'apprentissage automatique – supervisé vs non supervisé
  • De l'apprentissage statistique à l'apprentissage automatique
  • Flux de travail du data mining : compréhension du besoin métier, préparation des données, modélisation, déploiement
  • Choix de l'algorithme adapté à la tâche
  • Surapprentissage et compromis biais-variance

Vue d'ensemble de Python et des bibliothèques d'apprentissage automatique

  • Pourquoi utiliser des langages de programmation pour le ML
  • Choisir entre R et Python
  • Cours accéléré sur Python et Jupyter Notebooks
  • Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn

Test et évaluation des algorithmes d'apprentissage automatique

  • Généralisation, surapprentissage et validation des modèles
  • Stratégies d'évaluation : validation sur un jeu de test, validation croisée, bootstrap
  • Métriques pour la régression : erreur moyenne (ME), erreur quadratique moyenne (MSE), racine de l'erreur quadratique moyenne (RMSE), erreur absolue moyenne en pourcentage (MAPE)
  • Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
  • Visualisation de la performance des modèles : courbe de profit, courbe ROC, courbe de gain (lift curve)
  • Sélection des modèles et recherche par grille pour le réglage des hyperparamètres

Préparation des données

  • Importation et stockage des données sous Python
  • Analyse exploratoire et statistiques descriptives
  • Gestion des valeurs manquantes et des valeurs aberrantes
  • Standardisation, normalisation et transformations
  • Reformulation des données qualitatives et manipulation des données avec pandas

Algorithmes de classification

  • Classification binaire vs multiclasse
  • Régression logistique et fonctions discriminantes
  • Bayes naïf, k plus proches voisins (k-NN)
  • Arbres de décision : CART, forêts aléatoires, Bagging, Boosting, XGBoost
  • Machines à vecteurs de support (SVM) et fonctions noyau
  • Techniques d'apprentissage ensembliste (ensemble learning)

Régression et prédiction numérique

  • Moindres carrés et sélection des variables
  • Méthodes de régularisation : L1, L2
  • Régression polynomiale et modèles non linéaires
  • Arbres de régression et splines

Réseaux de neurones

  • Introduction aux réseaux de neurones et au deep learning
  • Fonctions d'activation, couches et rétropropagation
  • Perceptrons multicouches (MLP)
  • Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux de neurones
  • Réseaux de neurones pour la classification et la régression

Prévision des ventes et analyse prédictive

  • Prévision par séries temporelles vs prévision basée sur la régression
  • Gestion des données saisonnières et des tendances
  • Construction d'un modèle de prévision des ventes à l'aide de techniques d'apprentissage automatique
  • Évaluation de la précision et de l'incertitude des prévisions
  • Interprétation commerciale et communication des résultats

Apprentissage non supervisé

  • Techniques de clustering : k-means, k-medoids, clustering hiérarchique, Self-Organizing Maps (SOM)
  • Réduction de dimensionnalité : ACP (Analyse en Composantes Principales), analyse factorielle, SVD
  • Mise à l'échelle multidimensionnelle

Data mining textuel (Text Mining)

  • Prétraitement du texte et tokenisation
  • Model bag-of-words, stemming et lemmatization
  • Analyse des sentiments et fréquence des mots
  • Visualisation des données textuelles avec des nuages de mots (word clouds)

Systèmes de recommandation

  • Filtrage collaboratif basé sur les utilisateurs et basé sur les articles
  • Conception et évaluation des moteurs de recommandation

Fouille de motifs d'association

  • Ensembles d'articles fréquents et algorithme Apriori
  • Analyse du panier d'achat et ratio de gain (lift ratio)

Détection de valeurs aberrantes

  • Analyse des valeurs extrêmes
  • Méthodes basées sur la distance et la densité
  • Détection de valeurs aberrantes dans des données de grande dimensionnalité

Étude de cas d'apprentissage automatique

  • Compréhension du problème métier
  • Prétraitement des données et ingénierie des fonctionnalités (feature engineering)
  • Sélection des modèles et réglage des paramètres
  • Évaluation et présentation des conclusions
  • Déploiement

Résumé et prochaines étapes

Pré requis

  • Connaissances de base des concepts d'apprentissage automatique, tels que l'apprentissage supervisé et non supervisé.
  • Maîtrise de la programmation Python (variables, boucles, fonctions).
  • Une certaine expérience avec la manipulation de données à l'aide de bibliothèques telles que pandas ou NumPy est utile mais non exigée.
  • Aucune expérience préalable en modélisation avancée ou avec les réseaux de neurones n'est supposée.

Public cible

  • Data scientists
  • Analystes commerciaux
  • Ingénieurs logiciels et professionnels techniques travaillant avec des données
 28 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (3)

Cours à venir

Catégories Similaires