Cursusaanbod
Sectie 1: Data Management in HDFS
- Verschillende Dataformaten (JSON / Avro / Parquet)
- Compressieschema's
- Data Maskering
- Labs : Analyse van verschillende dataformaten; compressie inschakelen
Sectie 2: Geavanceerde Pig
- Gebruiksdefinities van functies
- Inleiding tot Pig-bibliotheken (ElephantBird / Data-Fu)
- Laden van complexe gestructureerde gegevens met behulp van Pig
- Pig aanpassen
- Labs : geavanceerde Pig-scripting, analyseren van complexe datatypen
Sectie 3 : Geavanceerde Hive
- Gebruiksdefinities van functies
- Gecomprimeerde tabellen
- Hive Prestaat aanpassen
- Labs : gecomprimeerde tabellen maken, evaluatie van tafelformaten en configuratie
Sectie 4 : Geavanceerde HBase
- Geavanceerde schema-modellering
- Compressie
- Ingestie van grote hoeveelheden gegevens
- Vergeleken van brede tabellen en lange tabellen
- HBase en Pig
- HBase en Hive
- Prestaties van HBase aanpassen
- Labs : HBase aanpassen; toegang krijgen tot HBase-gegevens vanuit Pig & Hive; Phoenix gebruiken voor datamodellering
Vereisten
- vertrouwd met Java programmeertaal (meeste programmeeroefeningen zijn in java)
- vertrouwd in Linux omgeving (in staat om Linux command line te navigeren, bestanden bewerken met vi / nano)
- een werkende kennis van Hadoop.
Labomgeving
Zero Install: Er is geen noodzaak om hadoop software op de machines van studenten te installeren! Er wordt een werkende hadoop cluster voor studenten geleverd.
Studenten moeten het volgende hebben
Testimonials (5)
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Tijdens de oefeningen legde James mij elke stap in detail uit waar ik vast liep. Ik was helemaal nieuw met NIFI. Hij legde het daadwerkelijke doel van NIFI uit, zelfs de basis zoals open source. Hij dekte elk concept van Nifi vanaf het Beginner Niveau tot het Developer Niveau.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Trainer's voorbereiding en organisatie, en kwaliteit van de materialen op github geleverd.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Automatisch vertaald
Dat ik het in eerste instantie had.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Automatisch vertaald
praktische dingen van doen, ook de theorie werd goed verzorgd door Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Automatisch vertaald