Course Outline
- Introductie van machinaal leren Soorten machinaal leren – begeleid versus onbewaakt leren Van statistisch leren tot machinaal leren De datamining-workflow: zakelijk inzicht Gegevens begrijpen Gegevensvoorbereiding Modellering Evaluatie Implementatie Machine learning-algoritmen Het juiste algoritme voor het probleem kiezen Overfitting en bias-variantie-afweging in ML ML bibliotheken en programmeertalen Waarom een programmeertaal gebruiken Kiezen tussen R en Python Spoedcursus voor Python Python-bronnen Python-bibliotheken voor machinaal leren Jupyter-notebooks en interactieve codering ML-algoritmen testen Generalisatie en overfitting Overfitting vermijden Holdout-methode Cross-Validation Bootstrapping Numerieke voorspellingen evalueren Nauwkeurigheidsmetingen: ME, MSE, RMSE, MAPE Parameter- en voorspellingsstabiliteit Evaluatie van classificatie-algoritmen Nauwkeurigheid en de problemen ervan De verwarringsmatrix Ongebalanceerde klassenprobleem Visualisatie van modelprestaties Winstcurve ROC-curve Liftcurve Modelselectie Modelafstemming – rasterzoekstrategieën Voorbeelden in Python Gegevensvoorbereiding Gegevensimport en -opslag Begrijp de data – basisverkenningen Datamanipulaties met panda’s-bibliotheek Datatransformaties – Dataruzie Verkennende analyse Ontbrekende observaties – detectie en oplossingen Uitschieters – detectie en strategieën Standaardisatie, normalisatie, binarisatie Kwalitatieve datahercodering Voorbeelden in Python Classificatie Binaire versus multiklasse classificatie Classificatie via wiskundige functies Lineair discriminantfuncties Kwadratische discriminantfuncties Logistieke regressie en waarschijnlijkheidsbenadering k-dichtstbijzijnde buren Naïeve Bayes Beslissingsbomen CART Bagging Random Forests Boosting Xgboost Ondersteuning Vectormachines en kernels Maximale marge Classifier Ondersteuning Vector Machine Ensemble leren Voorbeelden in Python Regressie en numerieke voorspelling Schatting van kleinste kwadraten Variabelen selectietechnieken Regularisatie en stabiliteit - L1, L2 Niet-lineariteiten en gegeneraliseerde kleinste kwadraten Polynomiale regressie Regressiesplines Regressiebomen Voorbeelden in Python Leren zonder toezicht Clustering Centroid-gebaseerde clustering – k-means, k-medoids, PAM, CLARA Hiërarchische clustering – Diana, Agnes Model- gebaseerde clustering - EM Zelforganiserende kaarten Clusters evaluatie en beoordeling Dimensionaliteitsreductie Hoofdcomponentenanalyse en factoranalyse Singuliere waarde-ontleding Multidimensionaal schalen Voorbeelden in Python Tekstmining Gegevens voorbewerken Het 'bag-of-words'-model Stemming en lemmisatie Analyseren van woordfrequenties Sentimentanalyse Creëren van woordwolken Voorbeelden in Python Aanbevelingsengines en collaboratief filteren Aanbevelingsgegevens Gebruikersgebaseerd collaboratief filteren Item-gebaseerd collaboratief filteren Voorbeelden in Python Associatiepatroonmining Frequent itemets-algoritme Marktmandanalyse Voorbeelden in Python Uitbijteranalyse Analyse van extreme waarden Op afstand gebaseerde uitbijterdetectie Op dichtheid gebaseerde methoden Hoog detectie van dimensionale uitschieters Voorbeelden in Python Machine Learning casestudy Begrip van bedrijfsproblemen Voorverwerking van gegevens Algoritmeselectie en afstemming Evaluatie van bevindingen Implementatie
Requirements
Kennis en bewustzijn van Machine Learning grondbeginselen
Getuigenissen (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Cursus - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback