Cursusaanbod

Detailed training outline

  1. Inleiding tot NLP
    • NLP begrijpen
    • NLP frameworks
    • Commerciële toepassingen van NLP
    • Data scrapen van het web
    • Werken met verschillende API's om tekstdata op te halen
    • Werken en opslaan van tekstcorpora, inhoud en relevante metadata bewaren
    • Voordeel van Python en NLTK crash course gebruiken
  2. Praktische begrip van een corpus en dataset
    • Waarom hebben we een corpus nodig?
    • Corpusanalyse
    • Soorten dataattributen
    • Verschillende bestandsindelingen voor corpora
    • Een dataset voorbereiden voor NLP-toepassingen
  3. Begrijpen van de structuur van zinnen
    • Onderdelen van NLP
    • Natuurlijke taalbegrip
    • Morfologische analyse - stam, woord, token, spraaktags
    • Syntactische analyse
    • Semantische analyse
    • Vagheid hanteren
  4. Preprocessing van tekstdata
    • Corpus- rauwe tekst
      • Zinsontbinding
      • Stemming voor rauwe tekst
      • Lemmatisering van rauwe tekst
      • Stopwoorden verwijderen
    • Corpus-rauwe zinnen
      • Woordontbinding
      • Woordlemmatisering
    • Werken met Term-Dokument/Document-Term matrices
    • Tekstontbinding in n-grams en zinnen
    • Praktische en aangepaste preprocessing
  5. Tekstdata analyseren
    • Basisfunctie van NLP
      • Parsers en parsing
      • POS tagging en taggers
      • Name entity recognition
      • N-grams
      • Zak van woorden
    • Statistische functies van NLP
      • Begrippen van lineaire algebra voor NLP
      • Kansrekening voor NLP
      • TF-IDF
      • Vectorisatie
      • Encoders en decoders
      • Normalisering
      • Kansmodellen
    • Gevorderde feature engineering en NLP
      • Basis van word2vec
      • Onderdelen van het word2vec model
      • Logica van het word2vec model
      • Uitbreiding van het word2vec concept
      • Toepassing van het word2vec model
    • Casestudy: Toepassing van zak van woorden: automatische tekstsamenvatting met vereenvoudigde en echte Luhn-algoritmen
  6. Documentclustering, classificatie en themamodellering
    • Documentclustering en patroonzoeken (hiërarchische clustering, k-means, etc.)
    • Documents vergelijken en classificeren met behulp van TFIDF, Jaccard- en cosine afstandsmaatstaven
    • Documentclassificatie met Naïve Bayes en Maximum Entropy
  7. Belangrijke tekstelementen identificeren
    • Dimesionaliteit verminderen: hoofdcomponentanalyse, singuliere waardenontbinding, niet-negatieve matrixfactorisering
    • Thema's modelleren en informatie ophalen met Latent Semantic Analysis
  8. Entiteitsextractie, sentimentanalyse en geavanceerde themamodellering
    • Positief vs. negatief: mate van sentiment
    • Item Response Theory
    • Part of speech tagging en zijn toepassing: mensen, plaatsen en organisaties vinden die in tekst worden genoemd
    • Gevorderde themamodellering: Latent Dirichlet Allocation
  9. Casestudies
    • Ongestructureerde gebruikersrecensies winnen
    • Gevoelsclassificatie en visualisatie van Product Review Data
    • Zoeklogs analyseren voor gebruikspatronen
    • Tekstclassificatie
    • Themamodellering

Vereisten

Kennis en bewustzijn van NLP-principes en een waardering voor de toepassing van AI in het bedrijfsleven

 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (1)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën