Cursusaanbod
Machine Learning Inleiding
- Soorten machine learning – begeleid vs onbegeleid
- Van statistische leer naar machine learning
- Het data-miningproces: bedrijfsbegrip, gegevensvoorbereiding, modelleren, implementatie
- Het kiezen van de juiste algoritme voor de taak
- Overfitting en de bias-variantiecompromis
Python en overzicht van ML-bibliotheken
- Waarom programmeertalen gebruiken voor ML
- Kiezen tussen R en Python
- Python snelle cursus en Jupyter Notebooks
- Python bibliotheken: pandas, NumPy, scikit-learn, matplotlib, seaborn
Testen en evalueren van ML-algoritmen
- Generalisatie, overfitting en modelvalidatie
- Evaluatiestrategieën: holdout, cross-validatie, bootstrapping
- Metriken voor regressie: ME, MSE, RMSE, MAPE
- Metriken voor classificatie: nauwkeurigheid, verwarringsmatrix, ongebalanceerde klassen
- Visualisatie van modelprestaties: winstcurve, ROC-curve, lift-curve
- Modelselectie en grid search voor afstemming
Gegevensvoorbereiding
- Importeren en opslaan van gegevens in Python
- Exploratieve analyse en samenvattende statistieken
- Omgaan met ontbrekende waarden en uitbijters
- Standaardisatie, normalisatie en transformatie
- Qualitatieve gegevensrecodering en gegevensmanipulatie met pandas
Classificatie-algoritmen
- Binaire vs multiclass classificatie
- Logistische regressie en discriminerende functies
- Naïve Bayes, k-nearest neighbors
- Beslissingsbomen: CART, Random Forests, Bagging, Boosting, XGBoost
- Support Vector Machines en kernels
- Ensemble learning technieken
Regressie en numerieke voorspelling
- Kwadratenmethode en variabeleselectie
- Regularisatiemethoden: L1, L2
- Polynomiale regressie en niet-lineaire modellen
- Regressiebomen en splines
Unsupervised Learning
- Clustertechnieken: k-means, k-medoids, hiërarchisch clustering, SOMs
- Dimensionaliteitreductie: PCA, factoranalyse, SVD
- Multidimensionale schaling
Tekstmijnbouw
- Tekstvoorbewerking en tokenisatie
- Bag-of-words, stemming en lemmatisering
- Sentimentanalyse en woordfrequentie
- Visualiseren van tekstgegevens met woordwolken
Aanbevelingssystemen
- Gebruikergebaseerde en itemgebaseerde samenwerkende filteren
- Ontwerpen en evalueren van aanbevelingsmotoren
Patroonmijnbouw voor associaties
- Veilige itemsets en Apriori-algoritme
- Market basket analyse en lift-verhouding
Afwijkingsdetectie
- Extreme waardeanalyse
- Afstandsgebaseerde en dichtheidsgebaseerde methoden
- Afwijkingsdetectie in hoog-dimensionale gegevens
Machine Learning Casusstudie
- Begrijpen van het bedrijfsprobleem
- Gegevensvoorbewerking en feature engineering
- Modelselectie en parameterafstemming
- Evaluatie en presentatie van bevindingen
- Implementatie
Samenvatting en volgende stappen
Vereisten
- Basisbegrip van statistiek en lineaire algebra
- Kennis van data-analyse of business intelligence concepten
- Enige ervaring met programmeren (vooral Python of R) is aanbevolen
- Interesse in het leren van toegepaste machine learning voor data-gestuurde projecten
Publiek
- Data-analyse en wetenschappers
- Statistici en onderzoekers
- Ontwikkelaars en IT-professionals die machine learning tools verkennen
- Iedereen betrokken bij data science of voorspellende analytische projecten
Getuigenissen (3)
Ook al moest ik een dag missen vanwege klantgesprekken, voel ik dat ik een veel duidelijker begrip heb gekregen van de processen en technieken die worden gebruikt in Machine Learning en wanneer ik het een benadering boven een andere zou kiezen. Onze uitdaging is nu om wat we hebben geleerd te oefenen en het te beginnen toe te passen in onze probleemdomein.
Richard Blewett - Rock Solid Knowledge Ltd
Cursus - Machine Learning – Data science
Automatisch vertaald
Ik vond het fijn dat de training gericht was op voorbeelden en programmeren. Ik dacht dat het onmogelijk zou zijn om zoveel inhoud in drie dagen training te verpakken, maar ik had het mis. De training behandelde veel onderwerpen en alles werd zeer gedetailleerd behandeld (vooral de afstelling van modelparameters - ik verwachtte niet dat er tijd voor dit zou zijn en was aangenaam verrast).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
Automatisch vertaald
Het laat veel methoden zien met vooraf bereide scripts - zeer goed voorbereide materialen en gemakkelijk te traceren.
Kamila Begej - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
Automatisch vertaald