Cursusaanbod

Inleiding

  • Begrijpen van het belang van data voorbereiding in analytics en machine learning
  • Data voorbereidingspijplijn en de rol ervan in de data levenscyclus
  • Verkennen van algemene uitdagingen in ruwe data en het effect daarvan op analyse

Data-inwinning en -verwerving

  • Bronnen van data: databases, APIs, spreadsheets, tekstbestanden en meer
  • Technieken voor data-inwinning en waarborgen van de kwaliteit van data tijdens de inwinning
  • Data-inwinning uit verschillende bronnen

Data reinigingstechnieken

  • Identificeren en afhandelen van ontbrekende waarden, uitschieters en inconsistenties
  • Afkomen met duplicaten en fouten in de dataset
  • Reinigen van echte datasets

Data transformatie en standaardisering

  • Data normaliserings- en standaardisatietechnieken
  • Afhankelijke dataverwerking: codering, inbakken en feature engineering
  • Transformatie van ruwe data naar bruikbare formaten

Data integratie en aggregatie

  • Samenvoegen en combineren van datasets uit verschillende bronnen
  • Afhandelen van dataconflicten en aligneren van datatypes
  • Technieken voor dataaggregatie en -consolidatie

Datakwaliteitsborging

  • Methode om de kwaliteit en integriteit van data gedurende het proces te waarborgen
  • Implementeren van kwaliteitscontroles en validatieprocedures
  • Casestudies en praktische toepassingen van datakwaliteitsborging

Dimensiereductie en feature selectie

  • Begrijpen van het belang van dimensiereductie
  • Technieken zoals PCA, feature selectie en reductiestrategieën
  • Implementeren van dimensiereductietechnieken

Samenvatting en volgende stappen

Vereisten

  • Basisbegrip van dataconcepten

Publiek

  • Data-analisten
  • Databasemanagers
  • IT-professionals
 14 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën