Cursusaanbod

Afdeling 1: Datamanagement in HDFS

  • Verschillende Dataformaten (JSON / Avro / Parquet)
  • Compressieschema's
  • Data Maskeren
  • Labs : Analyseren van verschillende dataformaten; inschakelen van compressie

Afdeling 2: Geavanceerde Pig

  • Gebruiker-gedefinieerde functies
  • Inleiding tot Pig-bibliotheken (ElephantBird / Data-Fu)
  • Laden van complex gestructureerde data met Pig
  • Pig-fijnafstemming
  • Labs : geavanceerd pig-scripting, parseren van complexe datatypes

Afdeling 3: Geavanceerde Hive

  • Gebruiker-gedefinieerde functies
  • Gecomprimeerde tabellen
  • Hive-prestatiefijnafstemming
  • Labs : maken van gecomprimeerde tabellen, evalueren van tafelformaten en configuratie

Afdeling 4: Geavanceerd HBase

  • Geavanceerde schema-modellering
  • Compressie
  • Bulk Data Ingest
  • Vergelijking van breed-tafels en lang-tafels
  • HBase en Pig
  • HBase en Hive
  • HBase-prestatiefijnafstemming
  • Labs : fijnafstellen van HBase; toegang tot HBase-gegevens met Pig & Hive; Gebruik maken van Phoenix voor datamodels

Vereisten

  • vertrouwd met de Java-programmeertaal (de meeste programmeringsoefeningen zijn in Java)
  • vertrouwd met het Linux-omgeving (in staat om te navigeren in de Linux-commandoregel, bestanden te bewerken met vi / nano)
  • een werkende kennis van Hadoop.

Labomgeving

Nul Installatie: Het is niet nodig om hadoop-software te installeren op de machines van de studenten! Er wordt een werkende Hadoop-cluster beschikbaar gesteld voor de studenten.

Studenten zullen het volgende nodig hebben

 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Getuigenissen (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën