Plan du cours
Introduction
- Définir le "Traitement Automatique du Langage Naturel de Qualité Industrielle"
Installation de spaCy
Composants de spaCy
- Étiqueteur morphosyntaxique (Part-of-speech tagger)
- Extracteur d'entités nommées (Named entity recognizer)
- Analyseur syntaxique de dépendances (Dependency parser)
Aperçu des fonctionnalités et de la syntaxe de spaCy
Comprendre la modélisation spaCy
- Modélisation statistique et prédiction
Utilisation de l'interface de ligne de commande (CLI) de SpaCy
- Commandes de base
Création d'une application simple pour prédire le comportement
Entraînement d'un nouveau modèle statistique
- Données (pour l'entraînement)
- Étiquettes (tags, entités nommées, etc.)
Chargement du modèle
- Mélange et itération
Sauvegarde du modèle
Fournir un retour d'information au modèle
- Gradient d'erreur
Mise à jour du modèle
- Mise à jour de l'extracteur d'entités
- Extraction de tokens avec un comparateur basé sur des règles
Élaboration d'une théorie généralisée des résultats attendus
Étude de cas
- Distinction des noms de produits des noms d'entreprises
Affiner les données de formation
- Sélection de données représentatives
- Définition du taux d'abandon (dropout rate)
Autres styles de formation
- Passage de textes bruts
- Passage de dictionnaires d'annotations
Utiliser spaCy pour prétraiter le texte pour Deep Learning
Intégrer spaCy aux applications existantes
Test et débogage du modèle spaCy
- L'importance de l'itération
Déployer le modèle en production
Surveillance et ajustement du modèle
Résolution des problèmes
Résumé et conclusion
Pré requis
- Une expérience de programmation en Python.
- Une compréhension de base des statistiques.
- Une expérience de la ligne de commande.
Public cible
- Développeurs
- Scientifiques des données
Nos clients témoignent (3)
Le fait d'avoir plus d'exercices pratiques utilisant des données plus similaires à celles que nous utilisons dans nos projets (images satellites au format raster)
Matthieu - CS Group
Formation - Scaling Data Analysis with Python and Dask
Traduction automatique
Très bonne préparation et expertise de l'animateur, communication parfaite en anglais. Le cours était pratique (exercices + partage d'exemples d'usage).
Monika - Procter & Gamble Polska Sp. z o.o.
Formation - Developing APIs with Python and FastAPI
Traduction automatique
Le formateur développe la formation en fonction du rythme des participants
Farris Chua
Formation - Data Analysis in Python using Pandas and Numpy
Traduction automatique