Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Introduction à AlphaFold et son impact sur la recherche biologique
- Évolution de la prédiction des structures protéiques : de la modélisation par homologie aux avancées majeures de l'apprentissage profond.
- Rôle d'AlphaFold dans l'accélération de la biologie structurale, la découverte de médicaments et l'annotation fonctionnelle.
- Définir les attentes : capacités, limites et points d'intégration expérimentale.
- Exercice pratique : Exploration de l'interface de la Base de données des structures protéiques AlphaFold (AFDB) et réalisation de recherches séquentielles initiales.
Comment AlphaFold fonctionne-t-il ? Architecture et composants principaux
- Architecture du réseau neuronal : Evoformer, module de structure et modélisation de séquence par attention.
- Génération de l'Alignement Multiple de Séquences (MSA) et appariement de modèles (PDB, UniRef, BFD).
- Métriques de confiance : explication du pLDDT (confiance par résidu) et du PAE (erreur alignée prédite).
- Exercice pratique : Cartographie des étapes du workflow d'AlphaFold à l'aide d'une séquence protéique exemple et traçage des entrées MSA/modèles.
Accès à AlphaFold : plateformes, notebooks et déploiement
- Options de déploiement officielles : AlphaFold DB, API publique, notebooks Colab et environnements locaux/GPU.
- Configuration d'un environnement Colab reproductible : installation des dépendances, allocation du GPU et formatage des entrées.
- Préparation des séquences protéiques : structure FASTA, gestion des chaînes et considérations liées aux multi-domaines.
- Labo pratique : Déploiement du notebook Colab officiel d'AlphaFold, téléchargement d'un FASTA personnalisé et lancement de la première prédiction.
Base de données des structures protéiques AlphaFold et ressources publiques
- Navigation dans l'AFDB : couverture des organismes, qualité des structures, formats de téléchargement (PDB/mmCIF, fichiers non-relaxés/pLDDT).
- Croisement des données de l'AFDB avec UniProt, PDB et les bases de données fonctionnelles (GO, KEGG, CATH).
- Gestion des jeux de données à grande échelle : limites de prédiction par lots, consignes de citation et licences des données.
- Exercice pratique : Extraction de modèles AFDB à haute confiance pour une voie métabolique cible et préparation des fichiers pour l'analyse en aval.
Interprétation des prédictions d'AlphaFold et des métriques de confiance
- Lecture des cartes thermiques pLDDT : identification des cœurs structuraux, des régions désordonnées et des domaines de faible confiance.
- Décodage des matrices PAE : détection des limites de domaines, des interactions intra/inter-chaînes et des zones potentielles de mauvais repliement.
- Lorsque les prédictions sont fiables : couverture des séquences, profondeur évolutive et homologues structurels connus.
- Exercice pratique : Évaluation des sorties pLDDT/PAE pour une protéine multi-domaine, signalement des régions de faible confiance et planification des cibles de mutagenèse/ validation.
Code source ouvert d'AlphaFold et voies de personnalisation
- Structure du dépôt : modules centraux, pipelines de données et fichiers de configuration.
- Modification des entrées : MSAs personnalisées, remplacement des modèles et ajustement des seuils de confiance.
- Optimisation des performances : réduction du temps d'exécution, gestion de la mémoire et sauvegarde des points de contrôle.
- Labo pratique : Exécution d'un pipeline AlphaFold modifié dans Colab avec une contrainte de modèle personnalisée et exportation des fichiers PDB affinés.
Cas d'utilisation d'AlphaFold dans la recherche biologique et intégration expérimentale
- Guidage de la mutagenèse, de la cristallisation et de la planification des grilles de cryo-ME à l'aide des modèles prédits.
- Annotation fonctionnelle : cartographie du site actif, préparation de l'ancrage des ligands et prédiction des interfaces.
- Limites et vérification : quand faire confiance aux prédictions, quand valider expérimentalement et pièges courants.
- Atelier : Conception d'un flux de travail de validation expérimentale pour une structure prédite et mappage des sorties de l'IA sur les assays en laboratoire.
Résumé, projet final et prochaines étapes
- Consolidation des concepts clés : architecture, interprétation et déploiement pratique.
- Projet final : Les participants sélectionnent une protéine d'intérêt, lancent/extraient une prédiction, interprètent les métriques de confiance et ébauchent un plan d'application de recherche.
- Questions/réponses ouvertes, dépannage des erreurs courantes et distribution des ressources.
- Prochaines étapes : intégration avancée d'AlphaFold3, RoseTTAFold, trRosetta et outils communautaires en cours de développement.
Pré requis
- Connaissances et compréhension des structures des protéines.
- Une familiarité avec les concepts de base de la biologie moléculaire (séquences d'acides aminés, principes de repliement, formats PDB/mmCIF) est recommandée.
- Aisance dans la navigation sur les notebooks web et l'exécution de cellules de code dans un navigateur.
Public cible
- Biologistes, chercheurs en biologie moléculaire et investigateurs en biologie structurale.
- Scientifiques expérimentaux recherchant des prédictions de structure computationnelles pour guider leurs flux de travail en laboratoire (wet-lab).
- Professionnels des sciences de la vie intégrant la modélisation pilotée par l'IA dans la génération d'hypothèses et la conception expérimentale.
7 Heures