Cursusaanbod
Inleiding
- Inleiding tot Cloud Computing en Big Data-oplossingen
- Overzicht van de functies en architectuur van Apache Hadoop
- Een Hadoop-cluster plannen (on-premise, cloud, etc.)
- Het besturingssysteem en de Hadoop-distributie selecteren
- Resources inrichten (hardware, netwerk, etc.)
- Software downloaden en installeren
- Het cluster voor flexibiliteit dimensioneren
- Hadoop Distributed File System (HDFS) begrijpen
- Overzicht van de HDFS Command Reference
- Toegang tot HDFS krijgen
- Basisbestandsoperaties uitvoeren op HDFS
- S3 gebruiken als aanvulling op HDFS
- Dataflow in het MapReduce-framework begrijpen
- Map, Shuffle, Sort en Reduce
- Demo: Top salarissen berekenen
- Resourcebeheer in Hadoop begrijpen
- Werken met ResourceManager, NodeManager en Application Master
- Taken plannen onder YARN
- Taken plannen voor grote aantallen knooppunten en clusters
- Demo: Taakplanning
- Opslag voor Spark inrichten (HDFS, Amazon S3, NoSQL, etc.)
- Resilient Distributed Datasets (RDDs) begrijpen
- Een RDD maken
- RDD-transformaties implementeren
- Demo: Een tekstzoekprogramma voor filmtitels implementeren
- Hadoop monitoreren
- Een Hadoop-cluster beveiligen
- Knooppunten toevoegen en verwijderen
- Een prestatietest uitvoeren
- Een Hadoop-cluster afstellen om de prestaties te optimaliseren
- Back-up, herstel en business continuity plannen
- Hoge beschikbaarheid (HA) garanderen
- Workloadvereisten beoordelen
- Hadoop upgraden
- Van on-premise naar cloud en vice versa verhuizen
- Herstellen van uitval
Hadoop instellen
Meten met HDFS
Overzicht van MapReduce
Meten met YARN
Hadoop integreren met Spark
Een Hadoop-cluster beheren
Een Hadoop-cluster upgraden en migreren
Problemen oplossen
Samenvatting en conclusie
Vereisten
- Systeembronbeheerders ervaring
- Erfaring met Linux command line
- Inzicht in big data concepten
Doelgroep
- Systeembeheerders
- DBAs
Getuigenissen (5)
De goede humeur, het begeleiden en de vaardigheden van de trainer.
Oumayma - Physiobotic
Cursus - Scaling Data Pipelines with Spark NLP
Automatisch vertaald
Het feit dat we de meeste informatie, cursussen, presentaties en oefeningen mee konden nemen, zodat we ze kunnen doornemen en eventueel herhalen wat we het eerste keer niet begrepen of verbeteren wat we al gedaan hebben.
Raul Mihail Rat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
zeer interactief...
Richard Langford
Cursus - SMACK Stack for Data Science
Automatisch vertaald
Voldoende praktijkervaring, de docent is zeer deskundig
Chris Tan
Cursus - A Practical Introduction to Stream Processing
Automatisch vertaald
Leer Spark Streaming, Databricks en AWS Redshift kennen
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Cursus - Apache Spark in the Cloud
Automatisch vertaald