Cursusaanbod

Sectie 1: Data Management in HDFS

  • Verschillende Dataformaten (JSON / Avro / Parquet)
  • Compressieschema's
  • Data Maskering
  • Labs : Analyse van verschillende dataformaten; compressie inschakelen

Sectie 2: Geavanceerde Pig

  • Gebruiksdefinities van functies
  • Inleiding tot Pig-bibliotheken (ElephantBird / Data-Fu)
  • Laden van complexe gestructureerde gegevens met behulp van Pig
  • Pig aanpassen
  • Labs : geavanceerde Pig-scripting, analyseren van complexe datatypen

Sectie 3 : Geavanceerde Hive

  • Gebruiksdefinities van functies
  • Gecomprimeerde tabellen
  • Hive Prestaat aanpassen
  • Labs : gecomprimeerde tabellen maken, evaluatie van tafelformaten en configuratie

Sectie 4 : Geavanceerde HBase

  • Geavanceerde schema-modellering
  • Compressie
  • Ingestie van grote hoeveelheden gegevens
  • Vergeleken van brede tabellen en lange tabellen
  • HBase en Pig
  • HBase en Hive
  • Prestaties van HBase aanpassen
  • Labs : HBase aanpassen; toegang krijgen tot HBase-gegevens vanuit Pig & Hive; Phoenix gebruiken voor datamodellering

Vereisten

  • vertrouwd met Java programmeertaal (meeste programmeeroefeningen zijn in java)
  • vertrouwd in Linux omgeving (in staat om Linux command line te navigeren, bestanden bewerken met vi / nano)
  • een werkende kennis van Hadoop.

Labomgeving

Zero Install: Er is geen noodzaak om hadoop software op de machines van studenten te installeren! Er wordt een werkende hadoop cluster voor studenten geleverd.

Studenten moeten het volgende hebben

 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën