Course Outline

[1. Overzicht:

  • Wat is Big Data
  • Waarom Big Data aan populariteit wint
  • Big Data Casestudies
  • Big Data Kenmerken
  • Oplossingen om aan te werken Big Data.

Hadoop & Zijn componenten:

  • Wat is Hadoop en wat zijn de componenten ervan.
  • Hadoop Architectuur en de kenmerken ervan van de gegevens die het kan verwerken/verwerken.
  • Kort over Hadoop Geschiedenis, bedrijven die het gebruiken en waarom ze het zijn gaan gebruiken.
  • Hadoop Framewerk en de componenten ervan - in detail uitgelegd.
  • Wat is HDFS en leest en schrijft naar Hadoop gedistribueerd bestandssysteem.
  • Hoe in te stellen Hadoop Cluster in verschillende modi - Stand-alone/Pseudo/Multi Node-cluster.

(Dit omvat het opzetten van een Hadoop cluster in VirtualBox/KVM/VMware, netwerkconfiguraties waar zorgvuldig naar moet worden gekeken, het uitvoeren van Hadoop Daemons en het testen van het cluster).

  • Wat is Map Reduce frame work en hoe het werkt.
  • Kaart uitvoeren Verminder taken op cluster Hadoop.
  • Inzicht in replicatie, mirroring en rackbewustzijn in de context van Hadoop clusters.

Hadoop Clusterplanning:

  • Hoe u uw hadoop-cluster plant.
  • Hardware-software begrijpen om uw hadoop-cluster te plannen.
  • Inzicht in werklasten en planningscluster om fouten te voorkomen en optimaal te presteren.

Wat is MapR en waarom MapR:

  • Overzicht van MapR en zijn architectuur.
  • Begrip en werking van MapR Control System, MapR Volumes, snapshots & Mirrors.
  • Een cluster plannen in de context van MapR.
  • Vergelijking van MapR met andere distributies en Apache Hadoop.
  • MapR-installatie en clusterimplementatie.

Clusterconfiguratie en -beheer:

  • Beheer van services, knooppunten, momentopnamen, spiegelvolumes en externe clusters.
  • Knooppunten begrijpen en beheren.
  • Inzicht in Hadoop componenten, installatie van Hadoop componenten naast MapR Services.
  • Accessing Gegevens op cluster, inclusief via NFS-beheerservices en knooppunten.
  • Gegevens beheren door volumes te gebruiken, gebruikers en groepen beheren, rollen beheren en toewijzen aan knooppunten, de buitengebruikstelling van knooppunten in bedrijf stellen, clusterbeheer en prestatiemonitoring, statistieken configureren/analyseren en monitoren om de prestaties te monitoren, MapR-beveiliging configureren en beheren.
  • M7 begrijpen en ermee werken - Native opslag voor MapR-tabellen.
  • Clusterconfiguratie en afstemming voor optimale prestaties.

Clusterupgrade en integratie met andere opstellingen:

  • Softwareversie van MapR upgraden en soorten upgrades.
  • Mapr-cluster configureren voor toegang tot het HDFS-cluster.
  • MapR-cluster instellen op Amazon Elastic Mapreduce.

Alle bovenstaande onderwerpen omvatten demonstraties en oefensessies zodat leerlingen praktijkervaring met de technologie kunnen opdoen.

Requirements

  • Basiskennis van Linux FS
  • Basis Java
  • Kennis van Apache Hadoop (aanbevolen)
 28 Hours

Number of participants



Price per participant

Getuigenissen (1)

Related Courses

Hortonworks Data Platform (HDP) for Administrators

21 Hours

Apache Ambari: Efficiently Manage Hadoop Clusters

21 Hours

Impala for Business Intelligence

21 Hours

Data Analysis with Hive/HiveQL

7 Hours

Administrator Training for Apache Hadoop

35 Hours

Big Data Analytics in Health

21 Hours

Datameer for Data Analysts

14 Hours

Hadoop Administration

21 Hours

Hadoop For Administrators

21 Hours

Hadoop for Developers (4 days)

28 Hours

Advanced Hadoop for Developers

21 Hours

Hadoop for Developers and Administrators

21 Hours

Hadoop for Project Managers

14 Hours

Hadoop with Python

28 Hours

Hadoop and Spark for Administrators

35 Hours

Related Categories