Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
Inleiding
- Begrijpen van het belang van data voorbereiding in analytics en machine learning
- Data voorbereidingspijplijn en de rol ervan in de data levenscyclus
- Verkennen van algemene uitdagingen in ruwe data en het effect daarvan op analyse
Data-inwinning en -verwerving
- Bronnen van data: databases, APIs, spreadsheets, tekstbestanden en meer
- Technieken voor data-inwinning en waarborgen van de kwaliteit van data tijdens de inwinning
- Data-inwinning uit verschillende bronnen
Data reinigingstechnieken
- Identificeren en afhandelen van ontbrekende waarden, uitschieters en inconsistenties
- Afkomen met duplicaten en fouten in de dataset
- Reinigen van echte datasets
Data transformatie en standaardisering
- Data normaliserings- en standaardisatietechnieken
- Afhankelijke dataverwerking: codering, inbakken en feature engineering
- Transformatie van ruwe data naar bruikbare formaten
Data integratie en aggregatie
- Samenvoegen en combineren van datasets uit verschillende bronnen
- Afhandelen van dataconflicten en aligneren van datatypes
- Technieken voor dataaggregatie en -consolidatie
Datakwaliteitsborging
- Methode om de kwaliteit en integriteit van data gedurende het proces te waarborgen
- Implementeren van kwaliteitscontroles en validatieprocedures
- Casestudies en praktische toepassingen van datakwaliteitsborging
Dimensiereductie en feature selectie
- Begrijpen van het belang van dimensiereductie
- Technieken zoals PCA, feature selectie en reductiestrategieën
- Implementeren van dimensiereductietechnieken
Samenvatting en volgende stappen
Vereisten
- Basisbegrip van dataconcepten
Publiek
- Data-analisten
- Databasemanagers
- IT-professionals
14 Uren
Getuigenissen (3)
Het hebben van de oefeningencode maakt het mogelijk om je beter te richten op de belangrijke punten die begrepen en onthouden moeten worden, omdat je beschikbaar bent om vragen te stellen.
Carole Roux - INRAE
Cursus - EBX5 for Developers
Automatisch vertaald
Het is een praktijkles.
Vorraluck Sarechuer - Total Access Communication Public Company Limited (dtac)
Cursus - Talend Open Studio for ESB
Automatisch vertaald
I generally enjoyed the knowledge of the trainer.
Eddyfi Technologies
Cursus - GDPR Workshop
Automatisch vertaald