Cursusaanbod

Inleiding

  • Het Data Science-proces
  • Rollen en verantwoordelijkheden van een Data Scientist

Voorbereiden van de Ontwikkelomgeving

  • Bibliotheken, frameworks, talen en tools
  • Lokale ontwikkeling
  • Samenwerkende webgebaseerde ontwikkeling

Data-inname

  • Verschillende Soorten Data
    • Gestuctureerd
      • Lokale databases
      • Databaseconnectors
      • Gewone formaten: xlxs, XML, Json, csv, ...
    • Ongestructueerd
      • Clicks, sensoren, smartphones
      • APIs
      • Internet of Things (IoT)
      • Documenten, afbeeldingen, video's, geluiden
  • Casestudy: continu inname van grote hoeveelheden ongestructureerde data

Dataopslag

  • Relationele databases
  • Niet-relationele databases
  • Hadoop: Distributed File System (HDFS)
  • Spark: Resilient Distributed Dataset (RDD)
  • Cloudopslag

Data-voorbereiding

  • Inname, selectie, reiniging en transformatie
  • Garanderen van datakwaliteit - correctheid, betekenisvolheid en veiligheid
  • Uitzonderingsrapporten

Talen gebruikt voor Voorbereiding, Verwerking en Analyse

  • R-taal
    • Inleiding tot R
    • Data-manipulatie, berekening en grafische weergave
  • Python
    • Inleiding tot Python
    • Manipuleren, verwerken, reinigen en analyseren van data

Data-analyse

  • Exploratieve analyse
    • Basisstatistiek
    • Conceptuele visualisaties
    • Inzicht krijgen in data
  • Oorzakelijkheid
  • Features en transformaties
  • Machine Learning
    • Gesuperviseerd vs ongesuperviseerd
    • Wanneer welk model gebruiken
  • Natuurlijke Taalverwerking (NLP)

Data-visualisatie

  • Best practices
  • Het juiste diagram voor de juiste data kiezen
  • Kleurenpaletten
  • Naar een hoger niveau gaan
    • Dashboards
    • Interactieve visualisaties
  • Storytelling met data

Samenvatting en Conclusie

Vereisten

  • Een algemeen begrip van databaseconcepten
  • Een basisbegrip van statistiek
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën