Cursusaanbod
Inleiding
- Inleiding tot Cloud Computing en Big Data-oplossingen
- Overzicht van de functies en architectuur van Apache Hadoop
- Een Hadoop-cluster plannen (on-premise, cloud, etc.)
- Het besturingssysteem en de Hadoop-distributie selecteren
- Resources inrichten (hardware, netwerk, etc.)
- Software downloaden en installeren
- Het cluster voor flexibiliteit dimensioneren
- Hadoop Distributed File System (HDFS) begrijpen
- Overzicht van de HDFS Command Reference
- Toegang tot HDFS krijgen
- Basisbestandsoperaties uitvoeren op HDFS
- S3 gebruiken als aanvulling op HDFS
- Dataflow in het MapReduce-framework begrijpen
- Map, Shuffle, Sort en Reduce
- Demo: Top salarissen berekenen
- Resourcebeheer in Hadoop begrijpen
- Werken met ResourceManager, NodeManager en Application Master
- Taken plannen onder YARN
- Taken plannen voor grote aantallen knooppunten en clusters
- Demo: Taakplanning
- Opslag voor Spark inrichten (HDFS, Amazon S3, NoSQL, etc.)
- Resilient Distributed Datasets (RDDs) begrijpen
- Een RDD maken
- RDD-transformaties implementeren
- Demo: Een tekstzoekprogramma voor filmtitels implementeren
- Hadoop monitoreren
- Een Hadoop-cluster beveiligen
- Knooppunten toevoegen en verwijderen
- Een prestatietest uitvoeren
- Een Hadoop-cluster afstellen om de prestaties te optimaliseren
- Back-up, herstel en business continuity plannen
- Hoge beschikbaarheid (HA) garanderen
- Workloadvereisten beoordelen
- Hadoop upgraden
- Van on-premise naar cloud en vice versa verhuizen
- Herstellen van uitval
Hadoop instellen
Meten met HDFS
Overzicht van MapReduce
Meten met YARN
Hadoop integreren met Spark
Een Hadoop-cluster beheren
Een Hadoop-cluster upgraden en migreren
Problemen oplossen
Samenvatting en conclusie
Vereisten
- Systeembronbeheerders ervaring
- Erfaring met Linux command line
- Inzicht in big data concepten
Doelgroep
- Systeembeheerders
- DBAs
Getuigenissen (3)
De oefeningen en de uitwisseling tijdens de vragen- en antwoorden sessies
Antoine - Physiobotic
Cursus - Scaling Data Pipelines with Spark NLP
Automatisch vertaald
Ik vond het fijn dat het praktisch was. Ik hield ervan om de theoretische kennis toe te passen met praktijkvoorbeelden.
Aurelia-Adriana - Allianz Services Romania
Cursus - Python and Spark for Big Data (PySpark)
Automatisch vertaald
Het feit dat we de meeste informatie, cursussen, presentaties en oefeningen mee konden nemen, zodat we ze kunnen doornemen en eventueel herhalen wat we het eerste keer niet begrepen of verbeteren wat we al gedaan hebben.
Raul Mihail Rat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald