Cursusaanbod

Gedetailleerd trainingsoverzicht

  1. Inleiding tot NLP
    • NLP begrijpen
    • NLP-framewerken
    • Commerciële toepassingen van NLP
    • Gegevens scrappen van het web
    • Werking met verschillende APIs om tekstgegevens op te halen
    • Werking met en opslaan van tekstcorpora, opslaan van inhoud en relevante metadata
    • Voordelen van het gebruik van Python en NLTK crash course
  2. Pratische begrip van een corpus en dataset
    • Waarom hebben we een corpus nodig?
    • Corpusanalyse
    • Soorten datakenmerken
    • Verschillende bestandsindelingen voor corpora
    • Het voorbereiden van een dataset voor NLP-toepassingen
  3. Het begrijpen van de structuur van zinnen
    • Componenten van NLP
    • Natuurlijke taalbegrip
    • Morfologische analyse - stam, woord, token, spraaketiketten
    • Syntaxanalyse
    • Semantische analyse
    • Oplossen van ambiguiditeit
  4. Voorbereiding van tekstgegevens
    • Corpus- ruwe tekst
      • Zin tokenisatie
      • Stemming voor ruwe tekst
      • Lemmatisatie van ruwe tekst
      • Verwijderen van stopwoorden
    • Corpus- ruwe zinnen
      • Word tokenisatie
      • Word lemmatisatie
    • Werking met Term-Document/Document-Term matrices
    • Tokenisatie van tekst in n-grammen en zinnen
    • Pratische en aangepaste voorbereiding
  5. Analyse van tekstgegevens
    • Basiskenmerken van NLP
      • Parsers en parsings
      • POS-tagging en taggers
      • Naam-entiteit herkenning
      • N-grammen
      • Bag of words
    • Statistische kenmerken van NLP
      • Begrippen van lineaire algebra voor NLP
      • Probabilistische theorie voor NLP
      • TF-IDF
      • Vectorisatie
      • Encoders en decoders
      • Normalisatie
      • Probabilistische modellen
    • Geavanceerde feature engineering en NLP
      • Basissen van word2vec
      • Componenten van het word2vec-model
      • Logica van het word2vec-model
      • Uitbreiding van het word2vec-concept
      • Toepassing van het word2vec-model
    • Casusstudie: Toepassing van bag of words: automatische samenvatting van tekst met behulp van vereenvoudigde en echte Luhn's algoritmen
  6. Document clustering, classificatie en topic modeling
    • Documentclustering en patroonmining (hiërarchisch clustering, k-means, clustering, enz.)
    • Vergelijken en classificeren van documenten met behulp van TFIDF, Jaccard en cosinusafstandsmetingen
    • Documentclassificatie met behulp van Naïve Bayes en Maximum Entropy
  7. Belangrijke tekst identificeren Elements
    • Dimensievermindering: Principal Component Analysis, Singular Value Decomposition non-negative matrix factorization
    • Topic modeling en informatieophaal met behulp van Latent Semantic Analysis
  8. Entity Extraction, Sentiment Analysis en geavanceerd topic modeling
    • Positief vs. negatief: graad van sentiment
    • Item Response Theory
    • Part-of-speech tagging en toepassing: mensen, plaatsen en organisaties vinden die in de tekst worden genoemd
    • Geavanceerd topic modeling: Latent Dirichlet Allocation
  9. Casusstudies
    • Ongestructureerde gebruikersrecensies minen
    • Sentiment classificatie en visualisatie van productrecensies
    • Zoeklogboeken minen voor gebruikspatronen
    • Tekstclassificatie
    • Topic modeling

Vereisten

Kennis en bewustzijn van NLP-principes en een waardering voor de toepassing van AI in bedrijven

 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (1)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën