Cursusaanbod

Machine Learning Inleiding

  • Typen machine learning – begeleid vs. onbegeleid
  • Van statistische leerlingen naar machine learning
  • De data-miningworkflow: begrijpen van bedrijf, gegevens voorbereiden, modelleren, implementeren
  • Het juiste algoritme kiezen voor de taak
  • Overfitting en de bias-variance tradeoff

Python en overzicht van ML-bibliotheken

  • Waarom programmeertalen gebruiken voor ML
  • Kiezen tussen R en Python
  • Python crash course en Jupyter Notebooks
  • Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testen en evalueren van ML-algoritmen

  • Generalisatie, overfitting en modelvalidatie
  • Evaluatiestrategieën: holdout, kruisvalidatie, bootstrapping
  • Metrieken voor regressie: ME, MSE, RMSE, MAPE
  • Metrieken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongelijk verdeelde klassen
  • Modelprestatievisualisatie: winstcurve, ROC-curve, liftcurve
  • Modelselectie en grid search voor afstemming

Gegevens voorbereiding

  • Gegevens importeren en opslaan in Python
  • Exploratie en samenvattende statistieken
  • Omgaan met ontbrekende waarden en outliers
  • Standaardisatie, normalisatie en transformatie
  • Kwalitatieve gegevensrecodering en data wrangling met pandas

Classificatiealgoritmen

  • Binair vs. multiclass classificatie
  • Logistische regressie en discriminantiefuncties
  • Naïve Bayes, k-nearest neighbors
  • Beslissingstress: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines en kernels
  • Ensemble-learningtechnieken

Regressie en numerieke voorspelling

  • Kwadraten van kleinste en variabeleselectie
  • Regularisatiemethoden: L1, L2
  • Polynomial regressie en niet-lineaire modellen
  • Regressieboom en splines

Neural Networks

  • Inleiding tot neurale netwerken en diepgaand leren
  • Activeringsfuncties, lagen en terugpropagatie
  • Multilayer perceptrons (MLP)
  • Gebruik van TensorFlow of PyTorch voor basisneurale netwerkmodellering
  • Neurale netwerken voor classificatie en regressie

Verkoop Forecasting en Predictive Analytics

  • Tijdreeks vs. regressie-gebaseerde voorspelling
  • Omgaan met seizoens- en trendgebaseerde gegevens
  • Een verkoopvoorspellingmodel bouwen met ML-technieken
  • Voorspeld nauwkeurigheid en onzekerheid evalueren
  • Business interpretatie en communicatie van resultaten

Unsupervised Learning

  • Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
  • Dimensionaliteit reductie: PCA, factoranalyse, SVD
  • Multidimensionale schaling

Text Mining

  • Tekstverwerking en tokenisering
  • Bag-of-words, stemming en lemmatisatie
  • Sentimentanalyse en woordfrequentie
  • Tekstgegevens visualiseren met woordwolken

Aanbevolingssystemen

  • Gebruikersgebaseerde en objectgebaseerde samenwerkende filteren
  • Aanbevolingsmachines ontwerpen en evalueren

Patroonmining voor associatie

  • Veelvoorkomende itemsets en Apriori-algoritme
  • Marktbasketanalyse en lift-verhouding

Outlier Detectie

  • Analyse van extreme waarden
  • Afstandsgebaseerde en dichtheidsgebaseerde methoden
  • Outlierdetectie in hoogdimensionale gegevens

Machine Learning Casusstudie

  • Het bedrijfsprobleem begrijpen
  • Gegevensverwerking en feature engineering
  • Modelselectie en parameterafstemming
  • Evaluatie en presentatie van bevindingen
  • Implementatie

Samenvatting en volgende stappen

Vereisten

  • Basisbegrip van machine learning concepten zoals supervised en unsupervised learning
  • Kennis van Python programmeren (variabelen, lussen, functies)
  • Ervaring met gegevensverwerking met behulp van bibliotheken zoals pandas of NumPy is nuttig maar niet verplicht
  • Er is geen ervaring met geavanceerde modellering of neurale netwerken vereist

Publiek

  • Datawetenschappers
  • Business analysts
  • Softwareontwikkelaars en technische professionals die met gegevens werken
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (2)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën