Cursusaanbod

Machine Learning Inleiding

  • Soorten machine learning – begeleid vs onbegeleid
  • Van statistische leer naar machine learning
  • Het data-miningproces: bedrijfsbegrip, gegevensvoorbereiding, modelleren, implementatie
  • Het kiezen van de juiste algoritme voor de taak
  • Overfitting en de bias-variantiecompromis

Python en overzicht van ML-bibliotheken

  • Waarom programmeertalen gebruiken voor ML
  • Kiezen tussen R en Python
  • Python snelle cursus en Jupyter Notebooks
  • Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn

Testen en evalueren van ML-algoritmen

  • Generalisatie, overfitting en modelvalidatie
  • Evaluatiestrategieën: holdout, cross-validatie, bootstrapping
  • Metriken voor regressie: ME, MSE, RMSE, MAPE
  • Metriken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongebalanceerde klassen
  • Visualisatie van modelprestaties: winstcurve, ROC-curve, lift-curve
  • Modelselectie en grid search voor afstemming

Gegevensvoorbereiding

  • Importeren en opslaan van gegevens in Python
  • Exploratieve analyse en samenvattende statistieken
  • Omgaan met ontbrekende waarden en uitbijters
  • Standaardisatie, normalisatie en transformatie
  • Qualitatieve gegevensrecodering en gegevensmanipulatie met pandas

Classificatie-algoritmen

  • Binaire vs multiclass classificatie
  • Logistische regressie en discriminerende functies
  • Naïve Bayes, k-nearest neighbors
  • Beslissingsbomen: CART, Random Forests, Bagging, Boosting, XGBoost
  • Support Vector Machines en kernels
  • Ensemble learning technieken

Regressie en numerieke voorspelling

  • Kwadratenmethode en variabeleselectie
  • Regularisatiemethoden: L1, L2
  • Polynomiale regressie en niet-lineaire modellen
  • Regressiebomen en splines

Unsupervised Learning

  • Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
  • Dimensionaliteitreductie: PCA, factoranalyse, SVD
  • Multidimensionale schaling

Tekstmijnbouw

  • Tekstvoorbewerking en tokenisatie
  • Bag-of-words, stemming en lemmatisering
  • Sentimentanalyse en woordfrequentie
  • Visualiseren van tekstgegevens met woordwolken

Aanbevelingssystemen

  • Gebruikergebaseerde en itemgebaseerde samenwerkende filteren
  • Ontwerpen en evalueren van aanbevelingsmotoren

Patroonmijnbouw voor associaties

  • Veilige itemsets en Apriori-algoritme
  • Market basket analyse en lift-verhouding

Afwijkingsdetectie

  • Extreme waardeanalyse
  • Afstandsgebaseerde en dichtheidsgebaseerde methoden
  • Afwijkingsdetectie in hoog-dimensionale gegevens

Machine Learning Casusstudie

  • Begrijpen van het bedrijfsprobleem
  • Gegevensvoorbewerking en feature engineering
  • Modelselectie en parameterafstemming
  • Evaluatie en presentatie van bevindingen
  • Implementatie

Samenvatting en volgende stappen

Vereisten

  • Basisbegrip van statistiek en lineaire algebra
  • Kennis van data-analyse of business intelligence concepten
  • Enige ervaring met programmeren (vooral Python of R) is aanbevolen
  • Interesse in het leren van toegepaste machine learning voor data-gestuurde projecten

Publiek

  • Data-analyse en wetenschappers
  • Statistici en onderzoekers
  • Ontwikkelaars en IT-professionals die machine learning tools verkennen
  • Iedereen betrokken bij data science of voorspellende analytische projecten
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën