Cursusaanbod

Big Data Overzicht:

  • Wat is Big Data
  • Waarom Big Data aan populariteit wint
  • Big Data Casestudies
  • Big Data Kenmerken
  • Oplossingen om aan de slag te gaan met Big Data.

Hadoop & Zijn componenten:

  • Wat is Hadoop en welke componenten heeft het.
  • Hadoop Architectuur en kenmerken van de data die het kan verwerken/behandelen.
  • Kort overzicht van de geschiedenis van Hadoop, bedrijven die het gebruiken en waarom ze zijn begonnen met het gebruiken.
  • Hadoop Framework & zijn componenten - gedetailleerd uitgelegd.
  • Wat is HDFS en lezen - schrijven naar het Hadoop Distributed File System.
  • Hoe een Hadoop cluster op te zetten in verschillende modi - Stand-alone/Pseudo/Multi Node cluster.

(Dit omvat het opzetten van een Hadoop cluster in VirtualBox/KVM/VMware, netwerkconfiguraties die zorgvuldig moeten worden bekeken, het uitvoeren van Hadoop Daemons en het testen van de cluster).

  • Wat is de Map Reduce framework en hoe werkt het.
  • Map Reduce-jobs uitvoeren op een Hadoop cluster.
  • Replicatie, mirroring en rack-bewustzijn begrijpen in de context van Hadoop clusters.

Hadoop Cluster Planning:

  • Hoe je een hadoop cluster moet plannen.
  • Hardware-software begrijpen om je hadoop cluster te plannen.
  • Workloads begrijpen en het cluster plannen om fouten te voorkomen en optimaal te presteren.

Wat is MapR en waarom MapR:

  • Overzicht van MapR en zijn architectuur.
  • MapR Control System, MapR Volumes, snapshots & Mirrors begrijpen en gebruiken.
  • Een cluster plannen in de context van MapR.
  • Vergelijking van MapR met andere distributies en Apache Hadoop.
  • MapR installatie en cluster-deployement.

Cluster Setup & Beheer:

  • Services, nodes, snapshots, mirror volumes en remote clusters beheren.
  • Nodes begrijpen en beheren.
  • Hadoop componenten begrijpen, Hadoop componenten installeren naast MapR Services.
  • Data op cluster beheren, inclusief via NFS Services & Nodes beheren.
  • Data beheren door volumes te gebruiken, gebruikers en groepen beheren, rollen toewijzen aan nodes, nodes in/uit dienst stellen, clusterbeheer en prestatiemonitoring, metingen configureren/analyseren en monitoren om prestaties te monitoren, MapR-beveiliging configureren en beheren.
  • M7 begrijpen en gebruiken - Native storage voor MapR-tabelen.
  • Clusterconfiguratie en tuning voor optimale prestaties.

Cluster upgrade en integratie met andere setups:

  • Softwareversie van MapR upgraden en soorten upgrade.
  • MapR cluster configureren om toegang te krijgen tot HDFS cluster.
  • MapR cluster instellen op Amazon Elastic Mapreduce.

Alle bovengenoemde onderwerpen omvatten demonstraties en praktijkbeoefeningen zodat de deelnemers handson-ervaring krijgen met de technologie.

Vereisten

  • Basis kennis van Linux FS
  • Basis Java
  • Kennis van Apache Hadoop (aanbevolen)
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (1)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën