Course Outline

Snel overzicht

  • Gegevensbronnen
  • Gegevens in de gaten houden
  • Aanbevelingssystemen
  • Doel Marketing

Datatypes

  • Gestructureerd versus ongestructureerd
  • Statisch versus gestreamd
  • Attitude-, gedrags- en demografische gegevens
  • Datagestuurde versus gebruikersgestuurde analyses
  • Geldigheid van de gegevens
  • Volume, snelheid en verscheidenheid aan gegevens

Modellen

  • Modellen bouwen
  • Statistische modellen
  • Machinaal leren

Classificatie van gegevens

  • Clustering
  • kGroepen, k-betekent, de naaste buren
  • Mierenkolonies, vogels die massaal toestromen

Voorspellende modellen

  • Beslisbomen
  • Ondersteuning vectormachine
  • Naïeve Bayes-classificatie
  • Neurale netwerken
  • Markov Model
  • Regressie
  • Ensemble methoden

ROI

  • Kosten-batenverhouding
  • Kosten van software
  • Kosten van ontwikkeling
  • Potentiële voordelen

Modellen bouwen

  • Voorbereiding van gegevens (MapReduce)
  • Gegevens opschonen
  • Methoden kiezen
  • Model ontwikkelen
  • Model testen
  • Evaluatie van het model
  • Implementatie en integratie van modellen

Overzicht van Open Source en commerciële software

  • Selectie R-projectpakket
  • Python Bibliotheken
  • Hadoop en Mahout
  • Geselecteerde Apache-projecten met betrekking tot Big Data en Analytics
  • Geselecteerde commerciële oplossing
  • Integratie met bestaande software en databronnen

Requirements

Inzicht in traditionele databeheer- en analysemethoden zoals SQL, datawarehouses, business intelligence, OLAP, enz... Inzicht in basisstatistieken en waarschijnlijkheid (gemiddelde, variantie, waarschijnlijkheid, voorwaardelijke waarschijnlijkheid, enz...)

 21 Hours

Number of participants



Price per participant

Getuigenissen (1)

Related Courses

Data Vault: Building a Scalable Data Warehouse

28 Hours

Spark Streaming with Python and Kafka

7 Hours

Confluent KSQL

7 Hours

Apache Ignite for Developers

14 Hours

Unified Batch and Stream Processing with Apache Beam

14 Hours

Apache Apex: Processing Big Data-in-Motion

21 Hours

Apache Storm

28 Hours

Apache NiFi for Administrators

21 Hours

Apache NiFi for Developers

7 Hours

Apache Flink Fundamentals

28 Hours

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Knowledge Discovery in Databases (KDD)

21 Hours

Related Categories

1