Plan du cours
Machine Learning Introduction
- Types de apprentissage automatique – supervisé vs non supervisé
- D'apprentissage statistique à l'apprentissage automatique
- Le workflow d'exploration de données : compréhension des affaires, préparation des données, modélisation, déploiement
- Choisir le bon algorithme pour la tâche
- Surchauffe et le compromis biais-variance
Python et Aperçu des bibliothèques ML
- Pourquoi utiliser des langages de programmation pour l'IA
- Choisir entre R et Python
- Cours express en Python et Jupyter Notebooks
- Bibliothèques Python : pandas, NumPy, scikit-learn, matplotlib, seaborn
Test et Évaluation des Algorithmes d'IA
- Généralisation, surchauffe et validation du modèle
- Stratégies d'évaluation : holdout, validation croisée, bootstrap
- Métriques pour la régression : ME, MSE, RMSE, MAPE
- Métriques pour la classification : précision, matrice de confusion, classes déséquilibrées
- Visualisation des performances du modèle : courbe de profit, courbe ROC, courbe lift
- Sélection et recherche en grille pour l'ajustement du modèle
Préparation des Données
- Importation et stockage des données dans Python
- Analyse exploratoire et statistiques sommaires
- Gestion des valeurs manquantes et des outliers
- Standardisation, normalisation et transformation
- Réencodage des données qualitatives et manipulation de données avec pandas
Algorithmes de Classification
- Classification binaire vs multiclasse
- Régression logistique et fonctions discriminantes
- Naïve Bayes, k-plus proches voisins
- Arbres de décision : CART, Random Forests, Bagging, Boosting, XGBoost
- Machines à vecteurs de support et noyaux
- Téchniques d'apprentissage en ensemble
Régression et Prédiction Numérique
- Moindres carrés et sélection des variables
- Méthodes de régularisation : L1, L2
- Régression polynomiale et modèles non linéaires
- Arbres de régression et splines
Neural Networks
- Introduction aux réseaux de neurones et à l'apprentissage profond
- Fonctions d'activation, couches et rétropropagation
- Réseaux de perceptron multicouches (MLP)
- Utilisation de TensorFlow ou PyTorch pour la modélisation de base des réseaux de neurones
- Réseaux de neurones pour la classification et la régression
Ventes Forecasting et Predictive Analytics
- Prévision basée sur les séries temporelles vs régression
- Gestion des données saisonnières et basées sur les tendances
- Construction d'un modèle de prévision des ventes en utilisant les techniques d'IA
- Évaluation de l'exactitude et de l'incertitude des prévisions
- Interprétation et communication des résultats Business
Unsupervised Learning
- Téchniques de regroupement : k-means, k-medoids, classification hiérarchique, SOMs
- Réduction de la dimensionnalité : PCA, analyse factorielle, SVD
- Échelonnement multidimensionnel
Mining Textuel
- Prétraitement et tokenisation du texte
- Bag-of-words, racinisation et lemmatisation
- Analyse de sentiment et fréquence des mots
- Visualisation des données textuelles avec des nuages de mots
Systèmes de Recommandation
- Filtrage collaboratif basé sur l'utilisateur vs l'objet
- Conception et évaluation des moteurs de recommandations
Mining de Motifs Associatifs
- Ensembles d'éléments fréquents et algorithme Apriori
- Analyse du panier de marché et ratio lift
Détection des Valeurs Anormales
- Analyse des valeurs extrêmes
- Méthodes basées sur la distance et la densité
- Détection des valeurs anormales dans les données de haute dimensionnalité
Machine Learning Étude de Cas
- Compréhension du problème d'affaires
- Préparation des données et ingénierie des caractéristiques
- Sélection et ajustement des paramètres du modèle
- Évaluation et présentation des résultats
- Déploiement
Résumé et Étapes Suivantes
Pré requis
- Connaissance de base des concepts d'apprentissage automatique tels que l'apprentissage supervisé et non supervisé
- Familiarité avec la programmation Python (variables, boucles, fonctions)
- Une certaine expérience dans la gestion des données à l'aide de bibliothèques comme pandas ou NumPy est un atout mais n'est pas obligatoire
- Aucune expérience préalable en modélisation avancée ou réseaux neuronaux n'est attendue
Public cible
- Scientifiques des données
- Analystes Business
- Ingénieurs logiciel et professionnels techniques travaillant avec les données
Nos clients témoignent (2)
l'écosystème ML comprend non seulement MLFlow mais aussi Optuna, hyperops, docker et docker-compose
Guillaume GAUTIER - OLEA MEDICAL
Formation - MLflow
Traduction automatique
J'ai apprécié de participer à la formation Kubeflow, qui s'est déroulée en ligne. Cette formation m'a permis de consolider mes connaissances sur les services AWS, K8s et tous les outils DevOps associés à Kubeflow, qui sont les bases nécessaires pour aborder correctement le sujet. Je tiens à remercier Malawski Marcin pour sa patience et son professionnalisme dans la formation et ses conseils sur les meilleures pratiques. Malawskiaborde le sujet sous différents angles, avec divers outils de déploiement Ansible, EKS kubectl, Terraform. Maintenant, je suis définitivement convaincu que je m'oriente vers le bon domaine d'application.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Formation - Kubeflow
Traduction automatique