Course Outline

Invoering

  • Apache Spark versus Hadoop MapReduce

Overzicht van Apache Spark functies en architectuur

Een Programming taal kiezen

Instellen Apache Spark

Een voorbeeldtoepassing maken

De dataset kiezen

Uitvoeren van Data Analysis op de gegevens

Verwerking van gestructureerde gegevens met Spark SQL

Streaminggegevens verwerken met Spark Streaming

Integratie van Apache Spark met tools van derde deel Machine Learning.

Apache Spark gebruiken voor grafiekverwerking

Optimaliseren Apache Spark

Probleemoplossen

Samenvatting en conclusie

Requirements

  • Ervaring met de Linux-opdrachtregel
  • Een algemeen begrip van gegevensverwerking
  • Programmeerervaring met Java, Scala, Python of R

Publiek

  • Ontwikkelaars
 21 Hours

Number of participants



Price per participant

Getuigenissen (2)

Related Courses

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Hortonworks Data Platform (HDP) for Administrators

21 Hours

A Practical Introduction to Stream Processing

21 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Apache Spark for .NET Developers

21 Hours

SMACK Stack for Data Science

14 Hours

Administration of Apache Spark

35 Hours

Apache Spark in the Cloud

21 Hours

Spark for Developers

21 Hours

Scaling Data Pipelines with Spark NLP

14 Hours

Related Categories

1