Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
Programme de formation détaillé
- Introduction au NLP
- Compréhension du NLP
- Cadres de référence du NLP
- Applications commerciales du NLP
- Récupération de données depuis le web
- Utilisation de diverses API pour récupérer des données textuelles
- Gestion et stockage de corpus de texte, sauvegarde du contenu et des métadonnées pertinentes
- Avantages de l'utilisation de Python et cours accéléré sur NLTK
- Compréhension pratique d'un corpus et d'un ensemble de données
- Pourquoi avons-nous besoin d'un corpus ?
- Analyse de corpus
- Types d'attributs de données
- Différents formats de fichiers pour les corpus
- Préparation d'un ensemble de données pour les applications NLP
- Compréhension de la structure des phrases
- Composants du NLP
- Compréhension du langage naturel
- Analyse morphologique - racine, mot, token, balises grammaticales
- Analyse syntaxique
- Analyse sémantique
- Gestion de l'ambiguïté
- Prétraitement des données textuelles
- Corpus - texte brut
- Tokenisation des phrases
- Racinement (stemming) pour le texte brut
- Lemmatisation du texte brut
- Suppression des mots vides
- Corpus - phrases brutes
- Tokenisation des mots
- Lemmatisation des mots
- Travail avec les matrices Terme-Document / Document-Terme
- Tokenisation du texte en n-grammes et phrases
- Prétraitement pratique et personnalisé
- Corpus - texte brut
- Analyse des données textuelles
- Caractéristiques de base du NLP
- Analyseurs et analyse syntaxique
- Étiquetage grammatical (POS tagging) et étiqueteurs
- Reconnaissance d'entités nommées
- N-grammes
- Sac de mots (Bag of words)
- Caractéristiques statistiques du NLP
- Concepts d'algèbre linéaire pour le NLP
- Théorie probabiliste pour le NLP
- TF-IDF
- Vectorisation
- Encodeurs et décodeurs
- Normalisation
- Modèles probabilistes
- Ingénierie avancée des caractéristiques et NLP
- Principes de word2vec
- Composants du modèle word2vec
- Logique du modèle word2vec
- Extension du concept de word2vec
- Application du modèle word2vec
- Étude de cas : Application du sac de mots : résumé automatique de texte en utilisant les algorithmes simplifiés et véritables de Luhn
- Caractéristiques de base du NLP
- Regroupement de documents, classification et modélisation thématique
- Regroupement de documents et extraction de motifs (regroupement hiérarchique, k-moyens, clustering, etc.)
- Comparaison et classification de documents en utilisant les mesures de distance TFIDF, Jaccard et cosinus
- Classification de documents en utilisant Bayes naïf et l'entropie maximale
- Identification des éléments textuels importants
- Réduction de la dimensionnalité : Analyse en composantes principales, Décomposition en valeurs singulières, factorisation matricielle non négative
- Modélisation thématique et récupération d'information en utilisant l'Analyse Sémantique Latente
- Extraction d'entités, analyse des sentiments et modélisation thématique avancée
- Positif vs négatif : degré de sentiment
- Théorie de la réponse aux items
- Étiquetage grammatical et son application : identification des personnes, lieux et organisations mentionnés dans le texte
- Modélisation thématique avancée : Allocation de Dirichlet Latente
- Études de cas
- Extraction d'avis non structurés des utilisateurs
- Classification des sentiments et visualisation des données d'avis produits
- Extraction de journaux de recherche pour les motifs d'utilisation
- Classification de texte
- Modélisation thématique
Pré requis
Connaissance et conscience des principes du NLP et appréciation de l'application de l'IA dans les entreprises
21 Heures
Nos clients témoignent (1)
Soutien individuel
Simon the 2nd - Cboost
Formation - ROS: Programming for Robotics
Traduction automatique