Cursusaanbod

Inleiding tot Machine Learning

  • Types of machine learning – supervised vs unsupervised
  • Van statistische learning naar machine learning
  • Het data-mining werkproces: business begrip, data voorbereiding, modeling, implementatie
  • Het kiezen van de juiste algoritme voor de taak
  • Overfitting en de bias-variance tradeoff

Overzicht van Python en ML Bibliotheken

  • Waarom programmeren voor ML
  • Het kiezen tussen R en Python
  • Python crash course en Jupyter Notebooks
  • Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testen en Evaluatie van ML Algorithmen

  • Generalisatie, overfitting en model validatie
  • Evaluatiestrategieën: holdout, cross-validation, bootstrapping
  • Metriken voor regressie: ME, MSE, RMSE, MAPE
  • Metriken voor classificatie: nauwkeurigheid, verwarringmatrix, onevenwichtige klassen
  • Visualisatie van modelprestaties: winstcurve, ROC-curve, liftcurve
  • Modelselectie en grid search voor afstemming

Data Voorbereiding

  • Data import en opslag in Python
  • Exploratoire analyse en samenvattende statistieken
  • Omgaan met ontbrekende waarden en uitlijners
  • Standaardisatie, normalisatie en transformatie
  • Kwantitatieve data recodering en data wrangling met pandas

Classificatie Algoritmen

  • Binair vs multiclass classificatie
  • Logistische regressie en discriminant functies
  • Naïve Bayes, k-nearest neighbors
  • Beslissingsbomen: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines en kernels
  • Ensemble learning technieken

Regressie en Numerieke Voorspelling

  • Kleinste kwadraten en variabele selectie
  • Regularisatiemethoden: L1, L2
  • Polynomiale regressie en niet-lineaire modellen
  • Regressie bomen en splines

Neurale Netwerken

  • Inleiding tot neurale netwerken en diepe learning
  • Activeringsfuncties, lagen en backpropagation
  • Multilayer perceptrons (MLP)
  • Het gebruik van TensorFlow of PyTorch voor basis neurale netwerk modeling
  • Neurale netwerken voor classificatie en regressie

Verkoop Voorspelling en Predictieve Analytics

  • Time series vs regressiegebaseerde voorspelling
  • Omgaan met seizoensgebonden en trendgebonden data
  • Het bouwen van een verkoopvoorspellingsmodel met behulp van ML-technieken
  • Evaluatie van voorspelnauwkeurigheid en onzekerheid
  • Zakeninterpretatie en communicatie van resultaten

Onbeheerd Leren

  • Clustertechnieken: k-means, k-medoids, hierarchisch clusteren, SOMs
  • Dimensionaliteit reductie: PCA, factor analyse, SVD
  • Multidimensionale schaalverandering

Text Mining

  • Text voorbereiding en tokenisatie
  • Bag-of-words, stemming en lemmatisering
  • Sentiment analyse en woordfrequentie
  • Visualiseren van tekstgegevens met woordwolken

Aanbevelingssystemen

  • Gebruikersgebaseerde en itemgebaseerde collaboratieve filtering
  • Ontwerpen en evalueren van aanbevelingsmotoren

Associatiepatroon Mining

  • Veelvoorkomende itemsets en Apriori-algoritme
  • Marktmandanalyse en lift ratio

Uitlijnerdetectie

  • Extreme value analyse
  • Afstandsgebaseerde en dichtheidsgebaseerde methoden
  • Uitlijnerdetectie in hoge-dimensionale data

Machine Learning Case Study

  • Het begrijpen van het bedrijfsprobleem
  • Data voorbereiding en feature engineering
  • Modelselectie en parameter afstemming
  • Evaluatie en presentatie van bevindingen
  • Implementatie

Samenvatting en Volgende Stappen

Vereisten

  • Basiskennis van machine learning-concepten zoals supervised en unsupervised learning
  • Kennis van Python-programmeren (variabelen, lussen, functies)
  • Ervaring met gegevensbeheer met bibliotheken zoals pandas of NumPy is nuttig maar niet verplicht
  • Ervaring met geavanceerde modellering of neurale netwerken is niet vereist

Doelgroep

  • Datawetenschappers
  • Bedrijfsanalisten
  • Software-ingenieurs en technische professionals die werken met gegevens
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (2)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën