Plan du cours
Module 1 : Python de Base pour les Workflows ML
• Lancement du cours et configuration de l'environnement
Alignez les objectifs et configurez un espace de travail Python ML reproductible
• Essentiels du langage Python (accéléré)
Revue de la syntaxe, des structures de contrôle, des fonctions et des modèles couramment utilisés dans les bases de code ML
• Structures de données pour le ML
Listes, dictionnaires, ensembles et tuples pour les caractéristiques, les labels et les métadonnées
• Compréhensions et outils fonctionnels
Expressions de transformations à l'aide de compréhensions et de fonctions d'ordre supérieur
• Python orienté objet pour les développeurs ML
Classes, méthodes, composition et décisions de conception pratiques
• dataclasses et modélisation légère
Conteneurs typés pour la configuration, les exemples et les résultats
• Décorateurs et gestionnaires de contexte
Timing, caching, logging et modèles d'exécution sécurisés
• Travail avec des fichiers et des chemins
Gestion robuste des jeux de données et formats de sérialisation
• Exceptions et programmation défensive
Écriture de scripts ML qui échouent de manière sûre et transparente
• Modules, packages et structure de projet
Organisation de bases de code ML réutilisables
• Typage et qualité du code
Indications de type, documentation et structure compatible avec les linters
Module 2 : Python Numérique, SciPy et Gestion des Données
• Fondements de NumPy pour le calcul vectoriel
Opérations efficaces sur les tableaux et codage conscient des performances
• Indexation, tronçonnage, diffusion et formes
Manipulation sécurisée des tenseurs et raisonnement sur les formes
• Algèbre linéaire essentielle avec NumPy et SciPy
Opérations stables de matrice et décompositions utilisées en ML
• Plongée approfondie dans SciPy
Statistiques, optimisation, ajustement de courbes et matrices creuses
• Pandas pour les données tabulaires ML
Nettoyage, jointure, agrégation et préparation de jeux de données
• Plongée approfondie dans scikit-learn
Interface d'estimateur, pipelines et workflows reproductibles
• Essentiels de la visualisation
Tracés diagnostiques pour l'exploration des données et le comportement des modèles
Module 3 : Modèles de Programmation pour la Construction d'Applications ML
• Du notebook à un projet maintenable
Réorganisation du code exploratoire en packages structurés
• Gestion de la configuration
Paramètres externes et validation de démarrage
• Logging, avertissements et observabilité
Logging structuré pour des systèmes ML debuggable
• Composants réutilisables avec OOP et composition
Conception de transformateurs et de prédicteurs extensibles
• Modèles de conception pratiques
Pipeline, Factory ou Registry, Strategy et Adapter patterns
• Validation des données et vérification des schémas
Prévention des problèmes de données silencieux
• Performance et profiling
Identification des goulets d'étranglement et application de techniques d'optimisation
• Entrées/sorties de modèle et interfaces d'inférence
Persistance sûre et interfaces de prédiction propres
• Mini construction de bout en bout
Pipeline ML de production avec configuration et logging
Module 4 : Apprentissage Statistique pour les Données Tabulaires, Textuelles et d'Image
• Fondements de l'évaluation
Divisions d'entraînement et de validation, validation croisée honnête et métriques alignées sur l'entreprise
• Apprentissage tabulaire avancé
GLMs régularisés, ensembles d'arbres et prétraitement sans fuite
• Calibration et incertitude
Échelonnage de Platt, régression isotonique, bootstrap et prédiction conforme
• Méthodes NLP classiques
Compromis de tokenisation, TF-IDF, modèles linéaires et Naive Bayes
• Modélisation de sujets
Fondements de LDA et limitations pratiques
• Vision informatique classique
HOG, PCA et pipelines basés sur les caractéristiques
• Analyse des erreurs
Détection de biais, bruit de label et corrélations spéculatives
• Laboratoires pratiques
Pipeline tabulaire sans fuite
Comparaison et interprétation de base de texte
Baseline classique de vision avec analyse de défaillance structurée
Module 5 : Réseaux Neuronaux pour les Données Tabulaires, Textuelles et d'Image
• Maîtrise de la boucle d'entraînement
Boucles PyTorch propres avec AMP, clipping et reproductibilité
• Optimisation et régularisation
Initialisation, normalisation, optimiseurs et planificateurs
• Précision mixte et mise à l'échelle
Accumulation de gradient et stratégies de checkpointing
• Réseaux neuronaux tabulaires
Embeddings catégoriels, croisements de caractéristiques et études d'ablation
• Réseaux neuronaux textuels
Embeddings, CNNs, BiLSTM ou GRU et gestion des séquences
• Réseaux neuronaux de vision
Fondamentaux des CNN et architectures de style ResNet
• Laboratoires pratiques
Cadre d'entraînement réutilisable
Comparaison de NN tabulaire vs boosting
CNN avec augmentation et expériences de planification
Module 6 : Architectures Neuronales Avancées
• Stratégies de transfert d'apprentissage
Modèles de congélation et décongélation, taux d'apprentissage discriminatifs
• Architectures de transformers pour le texte
Internes de l'auto-attention et approches de fine-tuning
• Backbones de vision et prédiction dense
ResNet, EfficientNet, Transformers de vision et concepts de U-Net
• Architectures tabulaires avancées
TabTransformer, FT-Transformer et réseaux profonds et croisés
• Considérations sur les séries temporelles
Divisions temporelles et détection de décalage de covariates
• Techniques PEFT et d'efficacité
Compromis de LoRA, distillation et quantification
• Laboratoires pratiques
Fine-tuning de transformer de texte pré-entraîné
Fine-tuning de modèle de vision pré-entraîné
Comparaison de TabTransformer vs GBDT
Module 7 : Systèmes d'IA Génératifs
• Fondements de l'incitation
Incitation structurée et génération contrôlée
• Fondements des LLM
Tokenisation, ajustement d'instructions et atténuation des hallucinations
• Génération Augmentée par la Récupération
Fragmentation, embeddings, recherche hybride et métriques d'évaluation
• Stratégies de fine-tuning
LoRA et QLoRA avec contrôles de qualité des données
• Modèles de diffusion
Intuition de diffusion latente et adaptation pratique
• Données tabulaires synthétiques
CTGAN et considérations de confidentialité
• Laboratoires pratiques
Mini-application de production de RAG
Validation de sortie structurée avec application de schéma
Expérimentation de diffusion optionnelle
Module 8 : Agents d'IA et MCP
• Conception de la boucle d'agent
Observe, planifie, agit, réfléchit et persiste
• Architectures d'agents
ReAct, plan-and-execute et coordination multi-agent
• Gestion de la mémoire
Approches épisodiques, sémantiques et de scratchpad
• Intégration d'outils et sécurité
Contrats d'outils, sandboxing et défenses contre l'injection de prompts
• Cadres d'évaluation
Traces reproductibles, suites de tâches et tests de régression
• MCP et interopérabilité basée sur les protocoles
Conception de serveurs MCP avec exposition d'outils sécurisée
• Laboratoires pratiques
Construire un agent à partir de zéro
Exposer des outils via un serveur de style MCP
Créer un harnais d'évaluation avec des contraintes de sécurité
Pré requis
Les participants doivent avoir une connaissance opérationnelle de la programmation Python.
Ce programme est destiné aux professionnels techniques intermédiaires à avancés.
Nos clients témoignent (3)
l'écosystème ML ne concerne pas seulement MLFlow, mais également Optuna, Hyperopt, Docker et Docker-Compose
Guillaume GAUTIER - OLEA MEDICAL
Formation - MLflow
Traduction automatique
La qualité des explications, et le nombre important de sujets abordés
Hugo SECHIER - Expleo France
Formation - Kubeflow on AWS
J'ai beaucoup apprécié de participer à la formation Kubeflow, qui s'est déroulée à distance. Cette formation m'a permis de consolider mes connaissances sur les services AWS, K8s et tous les outils DevOps autour de Kubeflow, qui sont les bases nécessaires pour aborder le sujet correctement. Je tiens à remercier Malawski Marcin pour sa patience et son professionnalisme lors de la formation et pour ses conseils sur les bonnes pratiques. Malawski aborde le sujet sous différents angles, en utilisant divers outils de déploiement comme Ansible, EKS kubectl et Terraform. Je suis maintenant définitivement convaincu que je me dirige vers le bon domaine d'application.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Formation - Kubeflow
Traduction automatique