Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Detailed training outline
- Inleiding tot NLP
- NLP begrijpen
- NLP frameworks
- Commerciële toepassingen van NLP
- Data scrapen van het web
- Werken met verschillende API's om tekstdata op te halen
- Werken en opslaan van tekstcorpora, inhoud en relevante metadata bewaren
- Voordeel van Python en NLTK crash course gebruiken
- Praktische begrip van een corpus en dataset
- Waarom hebben we een corpus nodig?
- Corpusanalyse
- Soorten dataattributen
- Verschillende bestandsindelingen voor corpora
- Een dataset voorbereiden voor NLP-toepassingen
- Begrijpen van de structuur van zinnen
- Onderdelen van NLP
- Natuurlijke taalbegrip
- Morfologische analyse - stam, woord, token, spraaktags
- Syntactische analyse
- Semantische analyse
- Vagheid hanteren
- Preprocessing van tekstdata
- Corpus- rauwe tekst
- Zinsontbinding
- Stemming voor rauwe tekst
- Lemmatisering van rauwe tekst
- Stopwoorden verwijderen
- Corpus-rauwe zinnen
- Woordontbinding
- Woordlemmatisering
- Werken met Term-Dokument/Document-Term matrices
- Tekstontbinding in n-grams en zinnen
- Praktische en aangepaste preprocessing
- Corpus- rauwe tekst
- Tekstdata analyseren
- Basisfunctie van NLP
- Parsers en parsing
- POS tagging en taggers
- Name entity recognition
- N-grams
- Zak van woorden
- Statistische functies van NLP
- Begrippen van lineaire algebra voor NLP
- Kansrekening voor NLP
- TF-IDF
- Vectorisatie
- Encoders en decoders
- Normalisering
- Kansmodellen
- Gevorderde feature engineering en NLP
- Basis van word2vec
- Onderdelen van het word2vec model
- Logica van het word2vec model
- Uitbreiding van het word2vec concept
- Toepassing van het word2vec model
- Casestudy: Toepassing van zak van woorden: automatische tekstsamenvatting met vereenvoudigde en echte Luhn-algoritmen
- Basisfunctie van NLP
- Documentclustering, classificatie en themamodellering
- Documentclustering en patroonzoeken (hiërarchische clustering, k-means, etc.)
- Documents vergelijken en classificeren met behulp van TFIDF, Jaccard- en cosine afstandsmaatstaven
- Documentclassificatie met Naïve Bayes en Maximum Entropy
- Belangrijke tekstelementen identificeren
- Dimesionaliteit verminderen: hoofdcomponentanalyse, singuliere waardenontbinding, niet-negatieve matrixfactorisering
- Thema's modelleren en informatie ophalen met Latent Semantic Analysis
- Entiteitsextractie, sentimentanalyse en geavanceerde themamodellering
- Positief vs. negatief: mate van sentiment
- Item Response Theory
- Part of speech tagging en zijn toepassing: mensen, plaatsen en organisaties vinden die in tekst worden genoemd
- Gevorderde themamodellering: Latent Dirichlet Allocation
- Casestudies
- Ongestructureerde gebruikersrecensies winnen
- Gevoelsclassificatie en visualisatie van Product Review Data
- Zoeklogs analyseren voor gebruikspatronen
- Tekstclassificatie
- Themamodellering
Vereisten
Kennis en bewustzijn van NLP-principes en een waardering voor de toepassing van AI in het bedrijfsleven
21 Uren
Getuigenissen (1)
Ik denk dat ik de kernvaardigheden bekom die ik nodig heb om te begrijpen hoe de ROS samenhangt, en hoe ik projecten erin moet structureren.
Dan Goldsmith - Coventry University
Cursus - ROS: Programming for Robotics
Automatisch vertaald