Cursusaanbod
Deel 1: Data Management in HDFS
- Verschillende gegevensformaten (JSON / Avro / Parquet)
- Compressie schema's
- Gegevens maskeren
- Labs : Analyseren van verschillende dataformaten; Compressie inschakelen
Deel 2: Geavanceerd varken
- Door de gebruiker gedefinieerde functies
- Inleiding tot varkensbibliotheken (ElephantBird / Data-Fu)
- Laden van complexe gestructureerde gegevens met behulp van Pig
- Varken Tuning
- Labs : geavanceerde pig scripting, het ontleden van complexe datatypes
Deel 3 : Gevorderden Hive
- Door de gebruiker gedefinieerde functies
- Gecomprimeerde tabellen
- Hive Prestaties afstemmen
- Labs : maken van gecomprimeerde tabellen, evalueren van tabelformaten en configuratie
Deel 4 : Gevorderd HBase
- Geavanceerde schemamodellering
- Compressie
- Bulksgewijs gegevens opnemen
- Vergelijking van brede tafel / hoge tafel
- HBase en varken
- HBase en Hive
- HBase Prestaties Tuning
- Labs : HBase afstemmen; toegang tot HBase-gegevens van Pig & Hive; Phoenix gebruiken voor gegevensmodellering
Vereisten
- Vertrouwd met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
- Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)
- een praktische kennis van Hadoop.
Lab-omgeving
Zero Install: Het is niet nodig om Hadoop-software te installeren op de computers van studenten! Voor de studenten wordt een werkende hadoop-cluster voorzien.
Studenten hebben het volgende nodig
- een SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
- een browser om toegang te krijgen tot het cluster. We raden de Firefox-browser aan
Testimonials (5)
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Tijdens de oefeningen legde James mij elke stap in detail uit waar ik vast liep. Ik was helemaal nieuw met NIFI. Hij legde het daadwerkelijke doel van NIFI uit, zelfs de basis zoals open source. Hij dekte elk concept van Nifi vanaf het Beginner Niveau tot het Developer Niveau.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Trainer's voorbereiding en organisatie, en kwaliteit van de materialen op github geleverd.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Automatisch vertaald
Dat ik het in eerste instantie had.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Automatisch vertaald
praktische dingen van doen, ook de theorie werd goed verzorgd door Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Automatisch vertaald