Course Outline

    Introductie van machinaal leren Soorten machinaal leren – begeleid versus onbewaakt leren Van statistisch leren tot machinaal leren De datamining-workflow: zakelijk inzicht Gegevens begrijpen Gegevensvoorbereiding Modellering Evaluatie Implementatie Machine learning-algoritmen Het juiste algoritme voor het probleem kiezen Overfitting en bias-variantie-afweging in ML ML bibliotheken en programmeertalen Waarom een programmeertaal gebruiken Kiezen tussen R en Python Spoedcursus voor Python Python-bronnen Python-bibliotheken voor machinaal leren Jupyter-notebooks en interactieve codering ML-algoritmen testen Generalisatie en overfitting Overfitting vermijden Holdout-methode Cross-Validation Bootstrapping Numerieke voorspellingen evalueren Nauwkeurigheidsmetingen: ME, MSE, RMSE, MAPE Parameter- en voorspellingsstabiliteit Evaluatie van classificatie-algoritmen Nauwkeurigheid en de problemen ervan De verwarringsmatrix Ongebalanceerde klassenprobleem Visualisatie van modelprestaties Winstcurve ROC-curve Liftcurve Modelselectie Modelafstemming – rasterzoekstrategieën Voorbeelden in Python Gegevensvoorbereiding Gegevensimport en -opslag Begrijp de data – basisverkenningen Datamanipulaties met panda’s-bibliotheek Datatransformaties – Dataruzie Verkennende analyse Ontbrekende observaties – detectie en oplossingen Uitschieters – detectie en strategieën Standaardisatie, normalisatie, binarisatie Kwalitatieve datahercodering Voorbeelden in Python Classificatie Binaire versus multiklasse classificatie Classificatie via wiskundige functies Lineair discriminantfuncties Kwadratische discriminantfuncties Logistieke regressie en waarschijnlijkheidsbenadering k-dichtstbijzijnde buren Naïeve Bayes Beslissingsbomen CART Bagging Random Forests Boosting Xgboost Ondersteuning Vectormachines en kernels Maximale marge Classifier Ondersteuning Vector Machine Ensemble leren Voorbeelden in Python Regressie en numerieke voorspelling Schatting van kleinste kwadraten Variabelen selectietechnieken Regularisatie en stabiliteit - L1, L2 Niet-lineariteiten en gegeneraliseerde kleinste kwadraten Polynomiale regressie Regressiesplines Regressiebomen Voorbeelden in Python Leren zonder toezicht Clustering Centroid-gebaseerde clustering – k-means, k-medoids, PAM, CLARA Hiërarchische clustering – Diana, Agnes Model- gebaseerde clustering - EM Zelforganiserende kaarten Clusters evaluatie en beoordeling Dimensionaliteitsreductie Hoofdcomponentenanalyse en factoranalyse Singuliere waarde-ontleding Multidimensionaal schalen Voorbeelden in Python Tekstmining Gegevens voorbewerken Het 'bag-of-words'-model Stemming en lemmisatie Analyseren van woordfrequenties Sentimentanalyse Creëren van woordwolken Voorbeelden in Python Aanbevelingsengines en collaboratief filteren Aanbevelingsgegevens Gebruikersgebaseerd collaboratief filteren Item-gebaseerd collaboratief filteren Voorbeelden in Python Associatiepatroonmining Frequent itemets-algoritme Marktmandanalyse Voorbeelden in Python Uitbijteranalyse Analyse van extreme waarden Op afstand gebaseerde uitbijterdetectie Op dichtheid gebaseerde methoden Hoog detectie van dimensionale uitschieters Voorbeelden in Python Machine Learning casestudy Begrip van bedrijfsproblemen Voorverwerking van gegevens Algoritmeselectie en afstemming Evaluatie van bevindingen Implementatie

 

 

Requirements

Kennis en bewustzijn van Machine Learning grondbeginselen

 21 Hours

Number of participants



Price per participant

Getuigenissen (3)

Related Courses

Related Categories