Cursusaanbod
Machine Learning Inleiding
- Soorten machine learning – begeleid vs onbegeleid
- Van statistische leer naar machine learning
- Het data-miningproces: bedrijfsbegrip, gegevensvoorbereiding, modelleren, implementatie
- Het kiezen van de juiste algoritme voor de taak
- Overfitting en de bias-variantiecompromis
Python en overzicht van ML-bibliotheken
- Waarom programmeertalen gebruiken voor ML
- Kiezen tussen R en Python
- Python snelle cursus en Jupyter Notebooks
- Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen en evalueren van ML-algoritmen
- Generalisatie, overfitting en modelvalidatie
- Evaluatiestrategieën: holdout, cross-validatie, bootstrapping
- Metriken voor regressie: ME, MSE, RMSE, MAPE
- Metriken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongebalanceerde klassen
- Visualisatie van modelprestaties: winstcurve, ROC-curve, lift-curve
- Modelselectie en grid search voor afstemming
Gegevensvoorbereiding
- Importeren en opslaan van gegevens in Python
- Exploratieve analyse en samenvattende statistieken
- Omgaan met ontbrekende waarden en uitbijters
- Standaardisatie, normalisatie en transformatie
- Qualitatieve gegevensrecodering en gegevensmanipulatie met pandas
Classificatie-algoritmen
- Binaire vs multiclass classificatie
- Logistische regressie en discriminerende functies
- Naïve Bayes, k-nearest neighbors
- Beslissingsbomen: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines en kernels
- Ensemble learning technieken
Regressie en numerieke voorspelling
- Kwadratenmethode en variabeleselectie
- Regularisatiemethoden: L1, L2
- Polynomiale regressie en niet-lineaire modellen
- Regressiebomen en splines
Unsupervised Learning
- Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
- Dimensionaliteitreductie: PCA, factoranalyse, SVD
- Multidimensionale schaling
Tekstmijnbouw
- Tekstvoorbewerking en tokenisatie
- Bag-of-words, stemming en lemmatisering
- Sentimentanalyse en woordfrequentie
- Visualiseren van tekstgegevens met woordwolken
Aanbevelingssystemen
- Gebruikergebaseerde en itemgebaseerde samenwerkende filteren
- Ontwerpen en evalueren van aanbevelingsmotoren
Patroonmijnbouw voor associaties
- Veilige itemsets en Apriori-algoritme
- Market basket analyse en lift-verhouding
Afwijkingsdetectie
- Extreme waardeanalyse
- Afstandsgebaseerde en dichtheidsgebaseerde methoden
- Afwijkingsdetectie in hoog-dimensionale gegevens
Machine Learning Casusstudie
- Begrijpen van het bedrijfsprobleem
- Gegevensvoorbewerking en feature engineering
- Modelselectie en parameterafstemming
- Evaluatie en presentatie van bevindingen
- Implementatie
Samenvatting en volgende stappen
Vereisten
- Basisbegrip van statistiek en lineaire algebra
- Kennis van data-analyse of business intelligence concepten
- Enige ervaring met programmeren (vooral Python of R) is aanbevolen
- Interesse in het leren van toegepaste machine learning voor data-gestuurde projecten
Publiek
- Data-analyse en wetenschappers
- Statistici en onderzoekers
- Ontwikkelaars en IT-professionals die machine learning tools verkennen
- Iedereen betrokken bij data science of voorspellende analytische projecten
Testimonials (3)
Mede door het missen van een dag vanwege klantbijwonen, voel ik dat ik een veel duidelijker begrip heb van de processen en technieken die in Machine Learning worden gebruikt en wanneer ik een bepaalde aanpak zou gebruiken boven een andere. Onze uitdaging is nu om wat we hebben geleerd in praktijk te brengen en te beginnen met het toepassen op onze probleemdomein.
Richard Blewett - Rock Solid Knowledge Ltd
Cursus - Machine Learning – Data science
Automatisch vertaald
Ik vond het leuk dat de training zich richtte op voorbeelden en coderen. Ik dacht dat het onmogelijk was om zoveel inhoud in drie dagen training te stoppen, maar ik had onrecht. De training dekte veel onderwerpen en alles werd op een zeer gedetailleerde manier gedaan (vooral het afstellen van de parameters van het model - ik had niet verwacht dat er tijd voor zou zijn en ik was aangenaam verrast).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
Automatisch vertaald
Het toont vele methoden met vooraf bereide scripts- zeer goed bereide materialen en gemakkelijk terug te traceren
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
Automatisch vertaald