Cursusaanbod
Deel 1: Inleiding tot Hadoop
- Geschiedenis en concepten van Hadoop
- Ecosysteem
- Distributies
- Hoge-niveau architectuur
- Hadoop mythen
- Hadoop uitdagingen
- Hardware / software
- lab : eerste kijk op Hadoop
Deel 2: HDFS
- Ontwerp en architectuur
- Concepten (horizontale schaling, replicatie, data-localiteit, rack-awareness)
- Daemons : Namenode, Secondary namenode, Data node
- Communicaties / heart-beats
- Data-integriteit
- Lees- en schrijfpad
- Namenode High Availability (HA), Federatie
- labs : Interactie met HDFS
Deel 3 : Map Reduce
- Concepten en architectuur
- daemons (MRV1) : jobtracker / tasktracker
- Fasen : driver, mapper, shuffle/sort, reducer
- Map Reduce Versie 1 en Versie 2 (YARN)
- Interne onderdelen van Map Reduce
- Inleiding tot het Java Map Reduce-programma
- labs : Een voorbeeld van een MapReduce-programma uitvoeren
Deel 4 : Varken
- Varken versus Java-kaart verminderen
- De Stroom van de Taak van het varken
- varken Latijnse taal
- ETL met varken
- Transformaties en joins
- Door de gebruiker gedefinieerde functies (UDF)
- labs : schrijven van Pig scripts om data te analyseren
Deel 5: Hive
- Architectuur en design
- Gegevenstypen
- SQL Ondersteuning in Hive
- Tabellen maken Hive en query's uitvoeren
- Partities
- Joins
- Tekstverwerking
- labs : diverse labo's over het verwerken van data met Hive
Deel 6: HBase
- Concepten en architectuur
- HBase vs RDBMS vs Cassandra
- HBase Java API
- Tijdreeksdata op HBase
- Schemadesign
- labs : Interactie met HBase via shell; programmeren in HBase Java API ; oefening schemadesign
Vereisten
- Comfortabel met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
- Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)
Lab-omgeving
Zero Install : Er is geen behoefte om Hadoop software te installeren op de machines van de studenten! Er wordt een werkende Hadoop cluster voor de studenten beschikbaar gesteld.
Studenten hebben het volgende nodig
- einen SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
- einen browser om toegang te krijgen tot de cluster, Firefox wordt aanbevolen
Testimonials (5)
De live voorbeelden
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
Automatisch vertaald
Tijdens de oefeningen legde James mij elke stap in detail uit waar ik vast liep. Ik was helemaal nieuw met NIFI. Hij legde het daadwerkelijke doel van NIFI uit, zelfs de basis zoals open source. Hij dekte elk concept van Nifi vanaf het Beginner Niveau tot het Developer Niveau.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Automatisch vertaald
Trainer's voorbereiding en organisatie, en kwaliteit van de materialen op github geleverd.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Automatisch vertaald
Dat ik het in eerste instantie had.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
Automatisch vertaald
praktische dingen van doen, ook de theorie werd goed verzorgd door Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Cursus - Hadoop Administration on MapR
Automatisch vertaald