Plan du cours
Introduction à l'apprentissage automatique
- Types d'apprentissage automatique – supervisé vs non supervisé
- De l'apprentissage statistique à l'apprentissage automatique
- Flux de travail du data mining : compréhension du besoin métier, préparation des données, modélisation, déploiement
- Choix de l'algorithme adapté à la tâche
- Surapprentissage et compromis biais-variance
Vue d'ensemble de Python et des bibliothèques d'apprentissage automatique
- Pourquoi utiliser des langages de programmation pour le ML
- Choisir entre R et Python
- Cours accéléré sur Python et Jupyter Notebooks
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et évaluation des algorithmes d'apprentissage automatique
- Généralisation, surapprentissage et validation des modèles
- Stratégies d'évaluation : validation sur un jeu de test, validation croisée, bootstrap
- Métriques pour la régression : erreur moyenne (ME), erreur quadratique moyenne (MSE), racine de l'erreur quadratique moyenne (RMSE), erreur absolue moyenne en pourcentage (MAPE)
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation de la performance des modèles : courbe de profit, courbe ROC, courbe de gain (lift curve)
- Sélection des modèles et recherche par grille pour le réglage des hyperparamètres
Préparation des données
- Importation et stockage des données sous Python
- Analyse exploratoire et statistiques descriptives
- Gestion des valeurs manquantes et des valeurs aberrantes
- Standardisation, normalisation et transformations
- Reformulation des données qualitatives et manipulation des données avec pandas
Algorithmes de classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Bayes naïf, k plus proches voisins (k-NN)
- Arbres de décision : CART, forêts aléatoires, Bagging, Boosting, XGBoost
- Machines à vecteurs de support (SVM) et fonctions noyau
- Techniques d'apprentissage ensembliste (ensemble learning)
Régression et prédiction numérique
- Moindres carrés et sélection des variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Réseaux de neurones
- Introduction aux réseaux de neurones et au deep learning
- Fonctions d'activation, couches et rétropropagation
- Perceptrons multicouches (MLP)
- Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux de neurones
- Réseaux de neurones pour la classification et la régression
Prévision des ventes et analyse prédictive
- Prévision par séries temporelles vs prévision basée sur la régression
- Gestion des données saisonnières et des tendances
- Construction d'un modèle de prévision des ventes à l'aide de techniques d'apprentissage automatique
- Évaluation de la précision et de l'incertitude des prévisions
- Interprétation commerciale et communication des résultats
Apprentissage non supervisé
- Techniques de clustering : k-means, k-medoids, clustering hiérarchique, Self-Organizing Maps (SOM)
- Réduction de dimensionnalité : ACP (Analyse en Composantes Principales), analyse factorielle, SVD
- Mise à l'échelle multidimensionnelle
Data mining textuel (Text Mining)
- Prétraitement du texte et tokenisation
- Model bag-of-words, stemming et lemmatization
- Analyse des sentiments et fréquence des mots
- Visualisation des données textuelles avec des nuages de mots (word clouds)
Systèmes de recommandation
- Filtrage collaboratif basé sur les utilisateurs et basé sur les articles
- Conception et évaluation des moteurs de recommandation
Fouille de motifs d'association
- Ensembles d'articles fréquents et algorithme Apriori
- Analyse du panier d'achat et ratio de gain (lift ratio)
Détection de valeurs aberrantes
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection de valeurs aberrantes dans des données de grande dimensionnalité
Étude de cas d'apprentissage automatique
- Compréhension du problème métier
- Prétraitement des données et ingénierie des fonctionnalités (feature engineering)
- Sélection des modèles et réglage des paramètres
- Évaluation et présentation des conclusions
- Déploiement
Résumé et prochaines étapes
Pré requis
- Connaissances de base des concepts d'apprentissage automatique, tels que l'apprentissage supervisé et non supervisé.
- Maîtrise de la programmation Python (variables, boucles, fonctions).
- Une certaine expérience avec la manipulation de données à l'aide de bibliothèques telles que pandas ou NumPy est utile mais non exigée.
- Aucune expérience préalable en modélisation avancée ou avec les réseaux de neurones n'est supposée.
Public cible
- Data scientists
- Analystes commerciaux
- Ingénieurs logiciels et professionnels techniques travaillant avec des données
Nos clients témoignent (3)
J'ai vraiment aimé la fin où nous avons pris le temps de jouer avec CHAT GPT. La salle n'était pas très bien organisée pour cela - au lieu d'une grande table, quelques petites tables auraient été préférables afin que nous puissions travailler en petits groupes et brainstormer.
Nola - Laramie County Community College
Formation - Artificial Intelligence (AI) Overview
Traduction automatique
Travailler à partir des principes fondamentaux de manière concentrée, puis passer à l'application d'études de cas le même jour
Maggie Webb - Department of Jobs, Regions, and Precincts
Formation - Artificial Neural Networks, Machine Learning, Deep Thinking
Traduction automatique
Qu'il utilisait des données réelles d'entreprise. Le formateur avait une très bonne approche en faisant participer et concourir les stagiaires
Jimena Esquivel - Zaklad Uslugowy Hakoman Andrzej Cybulski
Formation - Applied AI from Scratch in Python
Traduction automatique