Cursusaanbod
-
Inleiding tot Scala
- Een snelle introductie tot Scala
- Labo's: Kennismaking met Scala
-
Basisprincipes van Spark
- Achtergrond en geschiedenis
- Spark en Hadoop
- Spark-concepten en architectuur
- Spark-ecosysteem (core, Spark SQL, MLlib, streaming)
- Labo's: Installatie en uitvoeren van Spark
-
Eerste blik op Spark
- Spark uitvoeren in lokale modus
- Spark web-UI
- Spark-shell
- Analyse van dataset - deel 1
- Inspectie van RDD's
- Labo's: Verkennen van Spark-shell
-
RDD's (Resilient Distributed Datasets)
- Concepten van RDD's
- Partities
- Operaties en transformaties op RDD's
- RDD-typen
- Sleutel-waardepaar RDD's
- MapReduce op RDD's
- Caching en persistatie
- Labo's: Creëren & inspecteren van RDD's; Cachen van RDD's
-
Spark API-programmering
- Inleiding tot Spark API / RDD API
- Aanbieden van het eerste programma aan Spark
- Debuggeren / loggeren
- Configuratie-eigenschappen
- Labo's: Programmeren in Spark API, Aanbieden van taken
-
Spark SQL
- SQL-ondersteuning in Spark
- Dataframes
- Tabeldefinities en importeren van datasets
- Dataframes queryën met SQL
- Opslagformaten: JSON / Parquet
- Labo's: Creëren en queryën van dataframes; Evaluatie van gegevensformaten
-
MLlib (Machine Learning Library)
- Inleiding tot MLlib
- MLlib-algoritmen
- Labo's: Schrijven van MLib-toepassingen
-
GraphX (Grafiekverwerkingsbibliotheek)
- Overzicht van GraphX-bibliotheek
- API's van GraphX
- Labo's: Verwerken van grafische gegevens met Spark
-
Spark Streaming (Streaming-gegevensverwerking)
- Overzicht van streaming
- Evaluatie van streaming-platforms
- Streaming-operaties
- Glijdende vensteroperaties
- Labo's: Schrijven van Spark-streamingtoepassingen
-
Spark en Hadoop
- Inleiding tot Hadoop (HDFS / YARN)
- Hadoop + Spark-architectuur
- Uitvoeren van Spark op Hadoop YARN
- Bewerking van HDFS-bestanden met Spark
-
Spark-prestaties en afstelling
- Broadcast-variabelen
- Accumulators
- Geheerbeheer & caching
-
Spark-operaties
- Implementeren van Spark in productieomgevingen
- Voorbeeldimplementatiemodellen
- Configuraties
- Monitoring
- Foutopsporing
Vereisten
VORENDE REQUIREMENTEN
vertrouwdheid met Java / Scala / Python (onze labo's in Scala en Python)
basisbegrip van de Linux-ontwikkelingsomgeving (command line navigatie / bestanden bewerken met VI of nano)
Getuigenissen (6)
Doen van vergelijkbare oefeningen op verschillende manieren helpt echt om te begrijpen wat elke component (Hadoop/Spark, standalone/cluster) apart en samen kan doen. Het gaf me ideeën over hoe ik mijn applicatie op mijn lokale machine zou moeten testen tijdens de ontwikkeling versus wanneer het is gedeployd op een cluster.
Thomas Carcaud - IT Frankfurt GmbH
Cursus - Spark for Developers
Automatisch vertaald
Ajay was erg vriendelijk, behulpzaam en ook deskundig over het onderwerp dat hij besprak.
Biniam Guulay - ICE International Copyright Enterprise Germany GmbH
Cursus - Spark for Developers
Automatisch vertaald
Ernesto did a great job explaining the high level concepts of using Spark and its various modules.
Michael Nemerouf
Cursus - Spark for Developers
Automatisch vertaald
The trainer made the class interesting and entertaining which helps quite a bit with all day training.
Ryan Speelman
Cursus - Spark for Developers
Automatisch vertaald
We know a lot more about the whole environment.
John Kidd
Cursus - Spark for Developers
Automatisch vertaald
Richard is very calm and methodical, with an analytic insight - exactly the qualities needed to present this sort of course.
Kieran Mac Kenna
Cursus - Spark for Developers
Automatisch vertaald