Course Outline

Inleiding tot Apache Spark

  • De rol van Spark in de verwerking van big data
  • Spark-architectuur en zijn componenten

Instellen Apache Spark

  • Hardware- en softwarevereisten
  • Installatieprocedures voor standalone- en clustermodi
  • Best practices voor configuratie voor systeembeheerders

Spark-clusters beheren

  • Tools en technieken voor clusterbeheer
  • Spark-toepassingen en clusterresources bewaken
  • Beveiligingsconfiguraties en gebruikersbeheer

Prestaties afstemmen en optimaliseren

  • Toewijzing en planning van middelen
  • Tuning Spark voor optimale prestaties
  • Identificeren en oplossen van veelvoorkomende knelpunten

Problemen oplossen en problemen oplossen

  • Veelvoorkomende uitdagingen voor Spark-beheer
  • Diagnostische hulpmiddelen en technieken voor het oplossen van problemen
  • Stapsgewijze aanpak voor het oplossen van veelvoorkomende problemen
  • Praktische tips voor het handhaven van een gezonde Spark-omgeving

Onderwerpen over geavanceerd beheer

  • Integratie met andere big data-tools
  • Zorgen voor hoge beschikbaarheid en disaster recovery
  • Spark-clusters upgraden en schalen

Samenvatting en volgende stappen

Requirements

  • Basiskennis van netwerkconfiguratie en -beheer
  • Bekendheid met Linux besturingssysteem en opdrachtregelinterface
  • Interesse in het leren over gedistribueerde computersystemen en big data-beheer

Audiëntie

  • Systeembeheerders
 35 Hours

Number of participants



Price per participant

Getuigenissen (5)

Related Courses

Python and Spark for Big Data (PySpark)

21 Hours

Introduction to Graph Computing

28 Hours

Artificial Intelligence - the most applied stuff - Data Analysis + Distributed AI + NLP

21 Hours

Apache Spark MLlib

35 Hours

Big Data Analytics in Health

21 Hours

Hadoop and Spark for Administrators

35 Hours

Hortonworks Data Platform (HDP) for Administrators

21 Hours

A Practical Introduction to Stream Processing

21 Hours

Magellan: Geospatial Analytics on Spark

14 Hours

Apache Spark for .NET Developers

21 Hours

SMACK Stack for Data Science

14 Hours

Apache Spark Fundamentals

21 Hours

Apache Spark in the Cloud

21 Hours

Spark for Developers

21 Hours

Scaling Data Pipelines with Spark NLP

14 Hours

Related Categories

1