Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
1: HDFS (17%)
- Beschrijf de functie van HDFS Daemons
- Beschrijf de normale werking van een Apache Hadoop-cluster, zowel voor gegevensopslag als voor gegevensverwerking.
- Identificeer huidige kenmerken van computersystemen die een systeem zoals Apache Hadoop motiveren.
- Classificeer de belangrijkste doelen van HDFS-ontwerp
- Gegeven een scenario, identificeer de juiste toepassingsgeval voor HDFS Federatie
- Identificeer de componenten en daemon van een HDFS HA-Quorum-cluster
- Analyseer de rol van HDFS-beveiliging (Kerberos)
- Bepaal de beste keuze voor gegevensserialisatie voor een gegeven scenario
- Beschrijf lees- en schrijfroutes voor bestanden
- Identificeer de opdrachten om bestanden te manipuleren in de Hadoop File System Shell
2: YARN en MapReduce versie 2 (MRv2) (17%)
- Begrijp hoe het upgraden van een cluster van Hadoop 1 naar Hadoop 2 clusterinstellingen beïnvloedt
- Begrijp hoe MapReduce v2 (MRv2 / YARN) te implementeren, inclusief alle YARN daemons
- Begrijp de basisontwerpstrategie voor MapReduce v2 (MRv2)
- Bepaal hoe YARN bronnen toewijst
- Identificeer de workflow van een MapReduce-job die op YARN draait
- Bepaal welke bestanden je moet wijzigen en hoe je een cluster moet migreren van MapReduce versie 1 (MRv1) naar MapReduce versie 2 (MRv2) dat op YARN draait
3: Hadoop Cluster Planning (16%)
- Belangrijke punten om te overwegen bij het kiezen van hardware en besturingssystemen voor een Apache Hadoop-cluster
- Analyseer de keuzes bij het selecteren van een besturingssysteem
- Begrijp kernel-aanpassingen en schijfruil
- Gegeven een scenario en een werkbelastingspatroon, identificeer een hardwareconfiguratie die past bij het scenario
- Gegeven een scenario, bepaal de ecosysteemcomponenten die uw cluster nodig heeft om de SLA te vervullen
- Clustergrootte: gegeven een scenario en frequentie van uitvoering, identificeer de specifieke werkbelastingdetails, inclusief CPU, geheugen, opslag en schijf I/O
- Schijfgrootte en -configuratie, inclusief JBOD versus RAID, SANs, virtualisatie en schijfgroottevereisten in een cluster
- Netwerktopologieën: begrijp netwerkgebruik in Hadoop (voor zowel HDFS als MapReduce) en stel of identificeer belangrijke netwerkontwerpelementen voor een gegeven scenario
4: Hadoop Cluster Installatie en Beheer (25%)
- Gegeven een scenario, identificeer hoe de cluster omgaat met schijf- en machinestoringen
- Analyseer een logconfiguratie en logconfiguratiebestandsformaat
- Begrijp de basis van Hadoop-metrieken en clustergezondheidsmonitoring
- Identificeer de functie en het doel van beschikbare hulpmiddelen voor clusterbeheer
- Zorg voor de installatie van alle ecosysteemcomponenten in CDH 5, inclusief (maar niet beperkt tot): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive en Pig
- Identificeer de functie en het doel van beschikbare hulpmiddelen voor het beheren van het Apache Hadoop-bestandssysteem
5: Resource Management (10%)
- Begrijp de algemene ontwerpdoelen van elke Hadoop-planner
- Gegeven een scenario, bepaal hoe de FIFO-planner clusterbronnen toewijst
- Gegeven een scenario, bepaal hoe de Fair-planner clusterbronnen toewijst onder YARN
- Gegeven een scenario, bepaal hoe de Capacity-planner clusterbronnen toewijst
6: Monitoring en Logboeken (15%)
- Begrijp de functies en kenmerken van de metriekverzamelingscapaciteiten van Hadoop
- Analyseer de NameNode- en JobTracker-webgebruikersinterfaces
- Begrijp hoe je clusterdaemons kunt monitoren
- Identificeer en monitor CPU-gebruik op masterknooppunten
- Beschrijf hoe je swap en geheugenallocatie op alle knooppunten kunt monitoren
- Identificeer hoe je de logbestanden van Hadoop kunt bekijken en beheren
- Interpreteer een logbestand
Vereisten
- Basisbewerkingen voor Linux beheer
- Basisbewerkingen voor programmeren
35 Uren
Getuigenissen (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald
I mostly liked the trainer giving real live Examples.
Simon Hahn
Cursus - Administrator Training for Apache Hadoop
Automatisch vertaald