Course Outline

Introductie

Scala Programming Diepgaand onderzoek

  • Syntaxis en structuur
  • Debietregeling en functies

Spark-internals

  • Veerkrachtige gedistribueerde datasets (RDD)
  • Spark-script naar grafiek naar cluster

Overzicht van Spark Streaming

  • Streaming architectuur
  • Intervallen in streaming
  • Fouttolerantie

Voorbereiding van de ontwikkelingsomgeving

  • Installeren en configureren Apache Spark
  • De Scala IDE installeren en configureren
  • JDK installeren en configureren

Spark Streaming Beginner tot gevorderd

  • Werken met sleutel/waarde RDD's
  • RDD's filteren
  • Spark-scripts verbeteren met reguliere expressies
  • Gegevens delen op een cluster
  • Werken met netwerkdatasets
  • Implementatie van BFS-algoritmen
  • Scripts voor Spark-stuurprogramma's maken
  • Tracking in real-time met scripts
  • Schrijven van doorlopende applicaties
  • Lineaire regressie streamen
  • Spark Machine Learning Library gebruiken

Vonk en clusters

  • Afhankelijkheden en Spark-scripts bundelen met behulp van het SBT-hulpprogramma
  • EPD gebruiken voor het illustreren van clusters
  • Optimaliseren door RDD's te partitioneren
  • Spark-logboeken gebruiken

Integratie in Spark Streaming

  • Integreren Apache Kafka en werken met Kafka-onderwerpen
  • Integratie van Apache Fume en werken met pull-based/push-based Flume-configuraties
  • Het schrijven van een aangepaste ontvangerklasse
  • Integratie Cassandra en ontsluiting van gegevens als real-time services

In productie

  • Een applicatie verpakken en uitvoeren met Spark-Submit
  • Problemen oplossen, afstemmen en fouten opsporen in Spark Jobs en clusters

Samenvatting en conclusie

Requirements

  • Programming en scriptervaring

Publiek

  • Software-ingenieurs
 21 Hours

Number of participants



Price per participant

Getuigenissen (5)

Related Courses

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Akka - from Beginner to Intermediate

21 Hours

Machine Learning Fundamentals with Scala and Apache Spark

14 Hours

Scala: Advanced Object-Functional Programming

14 Hours

Scala: Advanced Functional Programming

14 Hours

Programming in Scala

14 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Hortonworks Data Platform (HDP) for Administrators

21 Hours

A Practical Introduction to Stream Processing

21 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Apache Spark for .NET Developers

21 Hours

Related Categories

1