Course Outline
Overzicht van Python pakketten gerelateerd aan NLP
Inleiding tot NLP (voorbeelden in Python natuurlijk)
Eenvoudige tekstmanipulatie Tekst zoeken Tellen Words Teksten opsplitsen in Words Lexicale spreiding
Complexe structuren verwerken Tekst weergeven in lijsten
Lijsten indexerenCollocatiesBigramenFrequentieverdelingVoorwaardelijke waarden met WordsVergelijken van Words (begintmet, eindigtmet, islager, isalpha, enz...)Begrijpen van natuurlijke taal Word Ondubbelzinnig maken van zintuigenVoornaamwoord Resolutie
Machinevertalingen (statistisch, op regels gebaseerd, letterlijk, enz...)OpdrachtenNLP in Python in voorbeelden
Toegang krijgen tot tekstcorpora en lexicale bronnen Algemene bronnen voor corpora Voorwaardelijke frequentieverdelingen Tellen Words per genre Creëren van een eigen corpus Uitspreken Woordenboek Schoenendoos en gereedschapskist Lexicons Zintuigen en synoniemen Hiërarchieën Lexicale relaties: Meroniemen, Holoniemen Semantische gelijkenisVerwerken van onbewerkte tekstStruncheren
Delen van een touwtje extraheren
Accessing van individuele karakters
Searchdelen, vervangen, splitsen, samenvoegen, indexeren, enz...Reguliere expressies gebruikenWoordpatronen detecterenStammenTokenisatieNormalisatie van tekstWord Segmentatie (vooral in het Chinees)Categoriseren en taggen van Word getagde corporaGetagde tokensTagset voor deel-van-spraakPython WoordenboekenWords naar Propertyis-toewijzing
Automatische taggingDe categorie van een bepalen Word (morfologisch, syntactisch, semantisch)Tekstclassificatie (Machine Learning) Onder toezicht staande classificatieZinssegmentatieKruisvalidatieBeslissingsbomenInformatie extraheren uit tekstchunkingChinken
Tags versus bomenZinsstructuur analyseren Contextvrije grammaticaParsersOp kenmerken gebaseerde grammatica's opbouwen Grammaticale kenmerkenFunctiestructuren verwerken
Analyse van de betekenis van zinnen, semantiek en logicaPropositionele LogicaLogica van de eerste ordeDiscours-semantiek
Taalkundige gegevens beheren Gegevensformaten (Lexicon versus tekst)Metagegevens