Cursusaanbod

1: HDFS (17%)

  • Beschrijf de functie van HDFS Daemons
  • Beschrijf de normale werking van een Apache Hadoop-cluster, zowel voor gegevensopslag als voor gegevensverwerking.
  • Identificeer huidige kenmerken van computersystemen die een systeem zoals Apache Hadoop motiveren.
  • Classificeer de belangrijkste doelen van HDFS-ontwerp
  • Gegeven een scenario, identificeer de juiste toepassingsgeval voor HDFS Federatie
  • Identificeer de componenten en daemon van een HDFS HA-Quorum-cluster
  • Analyseer de rol van HDFS-beveiliging (Kerberos)
  • Bepaal de beste keuze voor gegevensserialisatie voor een gegeven scenario
  • Beschrijf lees- en schrijfroutes voor bestanden
  • Identificeer de opdrachten om bestanden te manipuleren in de Hadoop File System Shell

2: YARN en MapReduce versie 2 (MRv2) (17%)

  • Begrijp hoe het upgraden van een cluster van Hadoop 1 naar Hadoop 2 clusterinstellingen beïnvloedt
  • Begrijp hoe MapReduce v2 (MRv2 / YARN) te implementeren, inclusief alle YARN daemons
  • Begrijp de basisontwerpstrategie voor MapReduce v2 (MRv2)
  • Bepaal hoe YARN bronnen toewijst
  • Identificeer de workflow van een MapReduce-job die op YARN draait
  • Bepaal welke bestanden je moet wijzigen en hoe je een cluster moet migreren van MapReduce versie 1 (MRv1) naar MapReduce versie 2 (MRv2) dat op YARN draait

3: Hadoop Cluster Planning (16%)

  • Belangrijke punten om te overwegen bij het kiezen van hardware en besturingssystemen voor een Apache Hadoop-cluster
  • Analyseer de keuzes bij het selecteren van een besturingssysteem
  • Begrijp kernel-aanpassingen en schijfruil
  • Gegeven een scenario en een werkbelastingspatroon, identificeer een hardwareconfiguratie die past bij het scenario
  • Gegeven een scenario, bepaal de ecosysteemcomponenten die uw cluster nodig heeft om de SLA te vervullen
  • Clustergrootte: gegeven een scenario en frequentie van uitvoering, identificeer de specifieke werkbelastingdetails, inclusief CPU, geheugen, opslag en schijf I/O
  • Schijfgrootte en -configuratie, inclusief JBOD versus RAID, SANs, virtualisatie en schijfgroottevereisten in een cluster
  • Netwerktopologieën: begrijp netwerkgebruik in Hadoop (voor zowel HDFS als MapReduce) en stel of identificeer belangrijke netwerkontwerpelementen voor een gegeven scenario

4: Hadoop Cluster Installatie en Beheer (25%)

  • Gegeven een scenario, identificeer hoe de cluster omgaat met schijf- en machinestoringen
  • Analyseer een logconfiguratie en logconfiguratiebestandsformaat
  • Begrijp de basis van Hadoop-metrieken en clustergezondheidsmonitoring
  • Identificeer de functie en het doel van beschikbare hulpmiddelen voor clusterbeheer
  • Zorg voor de installatie van alle ecosysteemcomponenten in CDH 5, inclusief (maar niet beperkt tot): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive en Pig
  • Identificeer de functie en het doel van beschikbare hulpmiddelen voor het beheren van het Apache Hadoop-bestandssysteem

5: Resource Management (10%)

  • Begrijp de algemene ontwerpdoelen van elke Hadoop-planner
  • Gegeven een scenario, bepaal hoe de FIFO-planner clusterbronnen toewijst
  • Gegeven een scenario, bepaal hoe de Fair-planner clusterbronnen toewijst onder YARN
  • Gegeven een scenario, bepaal hoe de Capacity-planner clusterbronnen toewijst

6: Monitoring en Logboeken (15%)

  • Begrijp de functies en kenmerken van de metriekverzamelingscapaciteiten van Hadoop
  • Analyseer de NameNode- en JobTracker-webgebruikersinterfaces
  • Begrijp hoe je clusterdaemons kunt monitoren
  • Identificeer en monitor CPU-gebruik op masterknooppunten
  • Beschrijf hoe je swap en geheugenallocatie op alle knooppunten kunt monitoren
  • Identificeer hoe je de logbestanden van Hadoop kunt bekijken en beheren
  • Interpreteer een logbestand

Vereisten

  • Basisbewerkingen voor Linux beheer
  • Basisbewerkingen voor programmeren
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën