Cursusaanbod
Inleiding
- Inleiding tot Cloud Computing en Big Data-oplossingen
- Overzicht van de functies en architectuur van Apache Hadoop
- Een Hadoop-cluster plannen (on-premise, cloud, etc.)
- Het besturingssysteem en de Hadoop-distributie selecteren
- Resources inrichten (hardware, netwerk, etc.)
- Software downloaden en installeren
- Het cluster voor flexibiliteit dimensioneren
- Hadoop Distributed File System (HDFS) begrijpen
- Overzicht van de HDFS Command Reference
- Toegang tot HDFS krijgen
- Basisbestandsoperaties uitvoeren op HDFS
- S3 gebruiken als aanvulling op HDFS
- Dataflow in het MapReduce-framework begrijpen
- Map, Shuffle, Sort en Reduce
- Demo: Top salarissen berekenen
- Resourcebeheer in Hadoop begrijpen
- Werken met ResourceManager, NodeManager en Application Master
- Taken plannen onder YARN
- Taken plannen voor grote aantallen knooppunten en clusters
- Demo: Taakplanning
- Opslag voor Spark inrichten (HDFS, Amazon S3, NoSQL, etc.)
- Resilient Distributed Datasets (RDDs) begrijpen
- Een RDD maken
- RDD-transformaties implementeren
- Demo: Een tekstzoekprogramma voor filmtitels implementeren
- Hadoop monitoreren
- Een Hadoop-cluster beveiligen
- Knooppunten toevoegen en verwijderen
- Een prestatietest uitvoeren
- Een Hadoop-cluster afstellen om de prestaties te optimaliseren
- Back-up, herstel en business continuity plannen
- Hoge beschikbaarheid (HA) garanderen
- Workloadvereisten beoordelen
- Hadoop upgraden
- Van on-premise naar cloud en vice versa verhuizen
- Herstellen van uitval
Hadoop instellen
Meten met HDFS
Overzicht van MapReduce
Meten met YARN
Hadoop integreren met Spark
Een Hadoop-cluster beheren
Een Hadoop-cluster upgraden en migreren
Problemen oplossen
Samenvatting en conclusie
Vereisten
- Systeembronbeheerders ervaring
- Erfaring met Linux command line
- Inzicht in big data concepten
Doelgroep
- Systeembeheerders
- DBAs
Getuigenissen (5)
Het goede humeur, de ondersteuning en de vaardigheden van de trainer.
Oumayma - Physiobotic
Cursus - Scaling Data Pipelines with Spark NLP
Automatisch vertaald
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Heel interactief...
Richard Langford
Cursus - SMACK Stack for Data Science
Automatisch vertaald
Voldoende hands-on ervaring, trainer is deskundig
Chris Tan
Cursus - A Practical Introduction to Stream Processing
Automatisch vertaald
Leer spark streaming, databricks en aws redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Cursus - Apache Spark in the Cloud
Automatisch vertaald