Plan du cours

Aperçu détaillé de la formation

  1. Introduction à l'IAUL (Intelligence Artificielle pour le Traitement du Langage Naturel)
    • Comprendre l'IAUL
    • Frameworks IAUL
    • Applications commerciales de l'IAUL
    • Récupération de données depuis la toile
    • Travail avec diverses API pour récupérer des données textuelles
    • Gestion et stockage de corpus textuels en sauvegardant le contenu et les métadonnées pertinentes
    • Avantages de l'utilisation du cours intensif Python et NLTK
  2. Compréhension pratique d'un corpus et d'un jeu de données
    • Pourquoi avons-nous besoin d'un corpus?
    • Analyse de corpus
    • Types d'attributs de données
    • Différents formats de fichiers pour les corpus
    • Préparation d'un jeu de données pour des applications IAUL
  3. Compréhension de la structure des phrases
    • Composants de l'IAUL
    • Compréhension du langage naturel
    • Analyse morphologique - racine, mot, token, étiquettes de parole
    • Analyse syntaxique
    • Analyse sémantique
    • Gestion des ambiguïtés
  4. Prétraitement des données textuelles
    • Corpus - texte brut
      • Segmentation en phrases
      • Racinement pour le texte brut
      • Lemmatisation du texte brut
      • Suppression des mots vides
    • Corpus - phrases brutes
      • Word tokenization
      • Word lemmatisation
    • Travail avec des matrices terme-document/document-terme
    • Segmentation textuelle en n-grammes et phrases
    • Prétraitement pratique et personnalisé
  5. Analyse de données textuelles
    • Fonctionnalités de base de l'IAUL
      • Analyseurs et analyse
      • Étiquetage POS et étiqueteurs
      • Détection d'entités nommées
      • N-grammes
      • Bag of words
    • Fonctionnalités statistiques de l'IAUL
      • Concepts d'algèbre linéaire pour l'IAUL
      • Théorie probabiliste pour l'IAUL
      • TF-IDF
      • Vecteurisation
      • Encodeurs et décodeurs
      • Normalisation
      • Modèles probabilistes
    • Génie des caractéristiques avancées et IAUL
      • Bases de word2vec
      • Composants du modèle word2vec
      • Raisonnement du modèle word2vec
      • Extension du concept word2vec
      • Application du modèle word2vec
    • Cas d'étude : Application de bag of words : résumé automatique de texte en utilisant les algorithmes simplifiés et véritables de Luhn
  6. Regroupement, classification et modélisation de sujets des documents
    • Regroupement de documents et recherche de motifs (regroupement hiérarchique, k-means, etc.)
    • Comparaison et classification de documents en utilisant TFIDF, Jaccard et mesures de distance cosinus
    • Classification documentaire avec Naïve Bayes et Maximum Entropie
  7. Identification des éléments textuels importants Element
    • Réduction de la dimensionnalité : Analyse en composantes principales, Décomposition en valeurs singulières, factorisation matricielle non négative
    • Modélisation de sujets et récupération d'informations avec l'Analyse Sémantique Latente
  8. Extraction d'entités, Sentiment Analysis et modélisation de sujets avancée
    • Positif vs. négatif : degré du sentiment
    • Theorie de la réponse aux items (IRT)
    • Étiquetage POS et son application : trouver des personnes, des lieux et des organisations mentionnés dans le texte
    • Modélisation de sujets avancée : Allocation Dirichlet Latente
  9. Cas d'étude
    • Extraction de commentaires utilisateurs non structurés
    • Classification et visualisation des sentiments sur les données de revues de produits
    • Extraction de journaux de recherche pour identifier des modèles d'utilisation
    • Classification textuelle
    • Modélisation de sujets

Pré requis

Connaissance et awareness des principes de l'IA linguistique (NLP) et appréciation des applications de l'intelligence artificielle dans les affaires

(Note: "awareness" is kept as-is because it doesn't have a direct translation that would make sense in this context without altering the meaning.)
 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (1)

Cours à venir

Catégories Similaires