Cursusaanbod
Machine Learning Inleiding
- Typen machine learning – begeleid vs. onbegeleid
- Van statistische leerlingen naar machine learning
- De data-miningworkflow: begrijpen van bedrijf, gegevens voorbereiden, modelleren, implementeren
- Het juiste algoritme kiezen voor de taak
- Overfitting en de bias-variance tradeoff
Python en overzicht van ML-bibliotheken
- Waarom programmeertalen gebruiken voor ML
- Kiezen tussen R en Python
- Python crash course en Jupyter Notebooks
- Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen en evalueren van ML-algoritmen
- Generalisatie, overfitting en modelvalidatie
- Evaluatiestrategieën: holdout, kruisvalidatie, bootstrapping
- Metrieken voor regressie: ME, MSE, RMSE, MAPE
- Metrieken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongelijk verdeelde klassen
- Modelprestatievisualisatie: winstcurve, ROC-curve, liftcurve
- Modelselectie en grid search voor afstemming
Gegevens voorbereiding
- Gegevens importeren en opslaan in Python
- Exploratie en samenvattende statistieken
- Omgaan met ontbrekende waarden en outliers
- Standaardisatie, normalisatie en transformatie
- Kwalitatieve gegevensrecodering en data wrangling met pandas
Classificatiealgoritmen
- Binair vs. multiclass classificatie
- Logistische regressie en discriminantiefuncties
- Naïve Bayes, k-nearest neighbors
- Beslissingstress: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines en kernels
- Ensemble-learningtechnieken
Regressie en numerieke voorspelling
- Kwadraten van kleinste en variabeleselectie
- Regularisatiemethoden: L1, L2
- Polynomial regressie en niet-lineaire modellen
- Regressieboom en splines
Neural Networks
- Inleiding tot neurale netwerken en diepgaand leren
- Activeringsfuncties, lagen en terugpropagatie
- Multilayer perceptrons (MLP)
- Gebruik van TensorFlow of PyTorch voor basisneurale netwerkmodellering
- Neurale netwerken voor classificatie en regressie
Verkoop Forecasting en Predictive Analytics
- Tijdreeks vs. regressie-gebaseerde voorspelling
- Omgaan met seizoens- en trendgebaseerde gegevens
- Een verkoopvoorspellingmodel bouwen met ML-technieken
- Voorspeld nauwkeurigheid en onzekerheid evalueren
- Business interpretatie en communicatie van resultaten
Unsupervised Learning
- Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
- Dimensionaliteit reductie: PCA, factoranalyse, SVD
- Multidimensionale schaling
Text Mining
- Tekstverwerking en tokenisering
- Bag-of-words, stemming en lemmatisatie
- Sentimentanalyse en woordfrequentie
- Tekstgegevens visualiseren met woordwolken
Aanbevolingssystemen
- Gebruikersgebaseerde en objectgebaseerde samenwerkende filteren
- Aanbevolingsmachines ontwerpen en evalueren
Patroonmining voor associatie
- Veelvoorkomende itemsets en Apriori-algoritme
- Marktbasketanalyse en lift-verhouding
Outlier Detectie
- Analyse van extreme waarden
- Afstandsgebaseerde en dichtheidsgebaseerde methoden
- Outlierdetectie in hoogdimensionale gegevens
Machine Learning Casusstudie
- Het bedrijfsprobleem begrijpen
- Gegevensverwerking en feature engineering
- Modelselectie en parameterafstemming
- Evaluatie en presentatie van bevindingen
- Implementatie
Samenvatting en volgende stappen
Vereisten
- Basisbegrip van machine learning concepten zoals supervised en unsupervised learning
- Kennis van Python programmeren (variabelen, lussen, functies)
- Ervaring met gegevensverwerking met behulp van bibliotheken zoals pandas of NumPy is nuttig maar niet verplicht
- Er is geen ervaring met geavanceerde modellering of neurale netwerken vereist
Publiek
- Datawetenschappers
- Business analysts
- Softwareontwikkelaars en technische professionals die met gegevens werken
Testimonials (2)
De ML-ecosysteem omvat niet alleen MLFlow maar ook Optuna, hyperops, docker en docker-compose.
Guillaume GAUTIER - OLEA MEDICAL
Cursus - MLflow
Automatisch vertaald
Ik heb genoten van het meedoen aan de Kubeflow training, die op afstand werd gehouden. Deze training stelde me in staat om mijn kennis van AWS-diensten, K8s en alle DevOps-tools rondom Kubeflow te versterken, wat de noodzakelijke basis is om het onderwerp adequaat aan te pakken. Ik wil Malawski Marcin bedanken voor zijn geduld en professionalisme tijdens de training en het advies over beste praktijken. Malawski benadert het onderwerp vanuit verschillende invalswinkels, verschillende implementatiegereedschappen Ansible, EKS kubectl, Terraform. Nu ben ik definitief overtuigd dat ik in het juiste toepassingsgebied ben.
Guillaume Gautier - OLEA MEDICAL | Improved diagnosis for life TM
Cursus - Kubeflow
Automatisch vertaald