Cursusaanbod

Introductie

  • Overzicht van de functies en architectuur van Spark en Hadoop
  • Inzicht in big data
  • Python Basisprincipes van programmeren

Slag

  • Python, Spark en Hadoop instellen
  • Inzicht in gegevensstructuren in Python
  • Inzicht in PySpark API
  • Inzicht in HDFS en MapReduce

Integratie van Spark en Hadoop met Python

  • Implementatie van Spark RDD in Python
  • Gegevens verwerken met behulp van MapReduce
  • Gedistribueerde datasets maken in HDFS

Machine Learning met Spark MLlib

Verwerking Big Data met Spark Streaming

Werken met aanbevelingssystemen

Werken met Kafka, Sqoop, Kafka en Flume

Apache Mahout met Spark en Hadoop

Probleemoplossing

Samenvatting en volgende stappen

Vereisten

  • Ervaring met Spark en Hadoop
  • Python Ervaring met programmeren

Audiëntie

  • Datawetenschappers
  • Ontwikkelaars
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën