Course Outline

Inleiding tot Data Analysis en Big Data

    Wat maakt Big Data "groot"? Snelheid, volume, variëteit, waarheidsgetrouwheid (VVVV)
Grenzen aan traditionele gegevensverwerking
  • Gedistribueerde verwerking
  • Statistische analyse
  • Soorten Machine Learning analyses
  • Data Visualization
  • Big Data Rollen en verantwoordelijkheden
  • Beheerders Ontwikkelaars Data-analisten

      Languages Gebruikt voor gegevensanalyse

    R Language Waarom R voor data-analyse? Gegevensmanipulatie, berekening en grafische weergave

      Python Waarom Python voor data-analyse?
    Gegevens manipuleren, verwerken, opschonen en verwerken
  • Benaderingen van Data Analysis
  • Statistische analyse Tijdreeksanalyse Prognoses met correlatie- en regressiemodellen Inferentieel Statistics (schatten) Beschrijvend Statistics in Big Data-sets (bijv. gemiddelde berekenen)
  • Machine Learning Begeleid versus onbewaakt leren

      Classificatie en clustering
    Het schatten van de kosten van specifieke methoden
  • Filteren
  • Natuurlijke taalverwerking Tekst verwerken
  • Betekenis van de tekst begrijpen
  • Automatische tekstgeneratie
  • Sentimentanalyse / topicanalyse
  • Computer Vision Beelden verwerven, verwerken, analyseren en begrijpen
  • Reconstrueren, interpreteren en begrijpen van 3D-scènes
  • Beeldgegevens gebruiken om beslissingen te nemen
  • Big Data Infrastructuur
  • Gegevensopslag Relationele databases (SQL) MijnSQL Postgres Oracle
  • Niet-relationele databases (NeeSQL) Cassandra
  • MongoDB
  • Neo4js
  • De nuances begrijpen Hiërarchische databases

      Objectgeoriënteerde databases
    Documentgeoriënteerde databases
  • Grafiekgeoriënteerde databases
  • Ander
  • Gedistribueerde verwerking Hadoop HDFS als gedistribueerd bestandssysteem
  • MapReduce voor gedistribueerde verwerking
  • Spark Alles-in-één in-memory cluster computing-framework voor grootschalige gegevensverwerking
  • Gestructureerde streaming
  • Vonk SQL
  • Machine Learning bibliotheken: MLlib
  • Grafiekverwerking met GraphX
  • Scalamogelijkheid Publieke cloud AWS, Google, Aliyun, enz.Privécloud OpenStack, Cloud Foundry, enz.
  • Automatische schaalbaarheid
  • Het kiezen van de juiste oplossing voor het probleem
  • De toekomst van Big Data
  • Samenvatting en conclusie
  • Requirements

    • Een algemeen begrip van wiskunde.
    • Een algemeen begrip van programmeren.
    • Een algemeen begrip van databases.

    Publiek

    • Ontwikkelaars / programmeurs
    • IT-consultants
     35 Hours

    Number of participants



    Price per participant

    Getuigenissen (5)

    Related Courses

    ArcGIS for Spatial Analysis

    14 Hours

    ArcMap in ArcGIS

    14 Hours

    ArcGIS Pro for Spatial Analysis

    14 Hours

    ArcGIS with Python Scripting

    14 Hours

    QGIS for Geographic Information System

    21 Hours

    Advanced Data Analysis with TIBCO Spotfire

    14 Hours

    Introduction to Spotfire

    14 Hours

    AI-Driven Data Analysis with TIBCO Spotfire X

    14 Hours

    Data Analysis with SQL, Python and Spotfire

    14 Hours

    Sensu: Beginner to Advanced

    14 Hours

    Monitoring Your Resources with Munin

    7 Hours

    Automated Monitoring with Zabbix

    14 Hours

    Fluentd for Log Data Unification

    14 Hours

    Nagios Certified Administrator Preparation

    21 Hours

    Advanced Nagios

    21 Hours

    Related Categories

    1