Cursusaanbod

Inleiding tot Gegevensanalyse en Big Data

  • Wat maakt Big Data 'groot'?
    • Snelheid, Volume, Variëteit, Betrouwbaarheid (VVVV)
  • Limieten van traditionele gegevensverwerking
  • Gedistribueerde verwerking
  • Statistische analyse
  • Type Machine Learning-analyse
  • Data visualisatie

Rollen en verantwoordelijkheden in Big Data

  • Beheerders
  • Ontwikkelaars
  • Dataanalisten

Talen die worden gebruikt voor gegevensanalyse

  • R-taal
    • Waarom R voor gegevensanalyse?
    • Gegevensmanipulatie, berekening en grafische weergave
  • Python
    • Waarom Python voor gegevensanalyse?
    • Manipuleren, verwerken, reinigen en samenvatten van gegevens

Benaderingen voor gegevensanalyse

  • Statistische analyse
    • Tijdreeksanalyse
    • Vooruitblik met correlatie- en regressiemodellen
    • Inferentiële statistiek (schatting)
    • Descriptieve statistiek in Big Data-sets (bijv. het berekenen van het gemiddelde)
  • Machine Learning
    • Toezichthoudend vs niet-toezichthoudend leren
    • Classificatie en clustering
    • Schatting van kosten voor specifieke methoden
    • Filtering
  • Natuurlijke taalverwerking
    • Tekstverwerking
    • Begrijpen van de betekenis van tekst
    • Automatische tekstgeneratie
    • Sentiment- en themaanalyse
  • Computer Vision
    • Afbeeldingen verkrijgen, verwerken, analyseren en begrijpen
    • 3D-scènes reconstrueren, interpreteren en begrijpen
    • Afbeeldingsgegevens gebruiken om beslissingen te nemen

Big Data-infrastructuur

  • Gegevensopslag
    • Gestructureerde databases (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Niet-gestructureerde databases (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4j
    • Inzicht in nuances
      • Hierarchische databases
      • Objectgeoriënteerde databases
      • Documentgeoriënteerde databases
      • Grafgeoriënteerde databases
      • Andere
  • Gedistribueerde verwerking
    • Hadoop
      • HDFS als gedistribueerd bestandssysteem
      • MapReduce voor gedistribueerde verwerking
    • Spark
      • All-in-one in-memory cluster computing framework voor grote gegevensverwerking
      • Gestructureerde streaming
      • Spark SQL
      • Machine Learning-bibliotheken: MLlib
      • Grafische verwerking met GraphX
  • Schaalbaarheid
    • Publieke cloud
      • AWS, Google, Aliyun, etc.
    • Prive-cloud
      • OpenStack, Cloud Foundry, etc.
    • Automatische schaalbaarheid

Het juiste oplossing kiezen voor het probleem

De toekomst van Big Data

Samenvatting en volgende stappen

Vereisten

  • Een algemeen begrip van wiskunde
  • Een algemeen begrip van programmeren
  • Een algemeen begrip van databases

Doelgroep

  • Ontwikkelaars / programmeurs
  • IT consultants
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (7)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën