Home
big data opleiding
hadoop opleiding

Hadoop for Developers and Administrators Training Cursus

(1 Getuigenissen)

Hadoop is het meest populaire framework voor Big Data-verwerking .

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Course Outline

Module 1. Inleiding tot Hadoop

Het Hadoop gedistribueerde bestandssysteem (HDFS)
Het leespad en het schrijfpad
Metagegevens van bestandssysteem beheren
De Namenode en de Datanode
De Namenode hoge beschikbaarheid
Naamknoop Federatie
De opdrachtregelhulpmiddelen
REST-ondersteuning begrijpen

Module 2. Inleiding tot MapReduce

De gegevens analyseren met Hadoop
Patroon in kaart brengen en verminderen
Java MapReduce
Uitschalen
Informatiestroom
Combinerfuncties ontwikkelen
Een gedistribueerde MapReduce-taak uitvoeren

Module 3. Een Hadoop cluster plannen

Een distributie en versie kiezen van Hadoop
Versies en functies
Hardwareselectie
Hardwareselectie van meester en werknemer
Clustergrootte
Selectie en voorbereiding van besturingssystemen
Implementatie-indeling
Gebruikers, groepen en rechten instellen
Schijfconfiguratie
Netwerk ontwerp

Module 4. Installatie en configuratie

Installeren Hadoop
Configuratie: een overzicht
De Hadoop XML configuratiebestanden
Omgevingsvariabelen en shell-scripts
Logboekconfiguratie
HDFS beheren
Optimalisatie en afstemming
Het naamknooppunt formatteren
Een /tmp-map maken
Denken Namenode Hoge beschikbaarheid
De hekopties
Automatische failoverconfiguratie
Format en Bootstrap de Namenodes
Naamknoop Federatie

Module 5. I/O Hadoop begrijpen

Gegevensintegriteit in HDFS
Codecs begrijpen
Compressie en invoersplitsingen
Compressie gebruiken in MapReduce
Het serialisatiemechanisme
Op bestanden gebaseerde gegevensstructuren
Het SequenceFile-formaat
Andere bestandsformaten en kolomgeoriënteerde formaten

Module 6. Een MapReduce-applicatie ontwikkelen

De configuratie-API
Het opzetten van de ontwikkelomgeving
Configuratie beheren
Generieke OptiesParser, Tool en ToolRunner
Een unittest schrijven met MRUnit
De Mapper en Reducer
Lokaal uitgevoerd op testgegevens
Het testen van de bestuurder
Draait op een cluster
Een baan verpakken en lanceren
De MapReduce-webinterface
Een taak afstemmen

Module 7. Identiteit, authenticatie en autorisatie

Identiteit beheren
Kerberos en Hadoop
Autorisatie begrijpen

Module 8. Hulpbron Management

Wat is hulpbron Management?
HDFS-quota
MapReduce-planners
Anatomie van een YARN-toepassingsrun
Bronverzoeken
Levensduur van toepassing
GAREN Vergeleken met MapReduce 1
Planning in YARN
Planner-opties
Configuratie van capaciteitsplanner
Eerlijke Scheduler-configuratie
Vertraging planning
Dominante eerlijkheid van hulpbronnen

Module 9. MapReduce-typen en formaten

MapReduce-typen
De standaard MapReduce-taak
De invoerformaten definiëren
Invoersplitsingen en records beheren
Tekstinvoer en binaire invoer
Meerdere ingangen beheren
Database Ingang (en uitgang)
Uitvoerformaten
Tekstuitvoer en binaire uitvoer
Meerdere uitgangen beheren
De Database-uitvoer

Module 10. MapReduce-functies gebruiken

Tellers gebruiken
Ingebouwde tellers lezen
Door de gebruiker gedefinieerde Java tellers
Sorteren begrijpen
De gedistribueerde cache gebruiken

Module 11. Clusteronderhoud en probleemoplossing

Beheren van Hadoop Processen
Processen starten en stoppen met init-scripts
Processen handmatig starten en stoppen
HDFS-onderhoudstaken
Een Datanode toevoegen
Een Datanode buiten gebruik stellen
Bestandssysteemintegriteit controleren met fsck
Balanceren van HDFS-blokgegevens
Omgaan met een defecte schijf
MapReduce onderhoudstaken
Een MapReduce-taak beëindigen
Een MapReduce-taak beëindigen
Beheer van de uitputting van hulpbronnen

Module 12. Toezicht

De beschikbare Hadoop statistieken
De rol van SNMP
Gezondheidsbewaking
Controles op hostniveau
HDFS-controles
KaartVerminder controles

Module 13. Back-up en herstel

Reservekopie van gegevens
Gedistribueerde kopie (distcp)
Parallelle gegevensopname
Metagegevens van naamknooppunt

21 Hours

Number of participants

Online

Classroom

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Hadoop for Developers and Administrators Training Cursus - Booking

Full name *

Phone *

Email *

Job Title

Company Name

Address 1 *

Address 2

City *

State / Province

Country *

Postcode *

Tax ID

Start Date

End Date

Dates are subject to availability and take place between 09:30 and 16:30.

Payment Method *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Additional Information

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Algemene Voorwaarden *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop for Developers and Administrators Training Cursus - Enquiry

Full name *

Phone *

Preferred

Email *

Preferred

Company Name

Company Address

Preferred

Number of participants

Date

How do you want to take the course?

Client Premises

Online

Classroom

Course Name

Duration, hours

Suitable Time

Preferred language

Suggested Venue Address

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop for Developers and Administrators - Consultancy Enquiry

Full name *

Phone *

Email *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Suitable Date

Who will the consultant work with?

Consultancy Urgency *

Course Name

Duration, hours

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Getuigenissen (1)

The fact that all the data and software was ready to use on an already prepared VM, provided by the trainer in external disks.

vyzVoice

Cursus - Hadoop for Developers and Administrators

Related Courses

Hortonworks Data Platform (HDP) for Administrators

21 Hours

Deze door een instructeur geleide, live training in België (op locatie of op afstand) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.

Aan het einde van deze training kunnen deelnemers:

Gebruik Hortonworks om Hadoop betrouwbaar op grote schaal uit te voeren. Verenig de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark. Gebruik Hortonworks om elk onderdeel van een Spark-project te onderzoeken, valideren, certificeren en ondersteunen. Verwerk verschillende soorten gegevens, waaronder gestructureerd, ongestructureerd, in beweging en in rust.

Apache Ambari: Efficiently Manage Hadoop Clusters

21 Hours

Apache Ambari is een open-source beheerplatform voor het Apache Ambari , beheren, bewaken en beveiligen van Apache Hadoop clusters.

In deze door een instructeur geleide live training leren deelnemers de managementtools en -praktijken die Ambari biedt om met succes Hadoop clusters te beheren.

Aan het einde van deze training kunnen deelnemers:

Zet een live Big Data cluster op met Ambari
Pas de geavanceerde functies en functionaliteiten van Ambari toe op verschillende gebruikssituaties
Voeg indien nodig naadloos knooppunten toe en verwijder deze
Verbeter de prestaties van een Hadoop cluster door afstemmen en tweaken

Publiek

DevOps
Systeembeheerders
DBA
Hadoop testprofessionals

Formaat van de cursus

Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen

Impala for Business Intelligence

21 Hours

Cloudera Impala is een open source MPP-query-engine (Massively Parallel Processing) SQL voor Apache Hadoop-clusters.

Impala stelt gebruikers in staat query's met lage latentie SQL uit te voeren naar gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevensverplaatsing of -transformatie nodig is.

Publiek

Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.

Na deze cursus zullen afgevaardigden in staat zijn om

Haal zinvolle informatie uit Hadoop-clusters met Impala. Schrijf specifieke programma's om Business Intelligence in Impala SQL Dialect te vergemakkelijken. Problemen met Impala oplossen.

Data Analysis with Hive/HiveQL

7 Hours

Deze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive

Administrator Training for Apache Hadoop

35 Hours

Publiek:

De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Go al:

Diepe kennis van Hadoop clusterbeheer.

Big Data Analytics in Health

21 Hours

Big data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken.

De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving.

In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen.

Aan het einde van deze training kunnen deelnemers:

Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
Begrijp de kenmerken van medische gegevens
Pas big data-technieken toe om met medische gegevens om te gaan
Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen

Publiek

ontwikkelaars
Data Scientists

Indeling van de cursus

Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.

Notitie

Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.

Datameer for Data Analysts

14 Hours

Datameer is een business intelligence en analytics-platform gebouwd op Hadoop Het stelt eindgebruikers in staat om op grote schaal gemakkelijk toegang te krijgen tot grootschalige, gestructureerde, semigestructureerde en ongestructureerde gegevens, deze te verkennen en te correleren Tijdens deze live training met instructeur leren deelnemers Datameer te gebruiken om de steile leercurve van Hadoop te overwinnen terwijl ze de opstelling en analyse van een reeks big data-bronnen doorlopen Aan het einde van deze training kunnen deelnemers: Creëer, ontwikkel en exploreer interactief een datameer voor bedrijven Toegang tot datawarehouses voor business intelligence, transactiedatabases en andere analytische winkels Gebruik een spreadsheetgebruikersinterface om endtoend gegevensverwerkingspijplijnen te ontwerpen Toegang tot vooraf gebouwde functies om complexe gegevensrelaties te verkennen Gebruik draganddrop-wizards om gegevens te visualiseren en dashboards te maken Gebruik tabellen, grafieken, grafieken en kaarten om queryresultaten te analyseren Publiek Data-analisten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .

Hadoop Administration

21 Hours

De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Doel van de cursus:

Kennis verkrijgen over Hadoop clusterbeheer

Hadoop For Administrators

21 Hours

Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. In deze drie (eventueel vier) dagen cursus, zullen de deelnemers leren over de zakelijke voordelen en use cases voor Hadoop en zijn ecosysteem, hoe cluster inzet en groei plannen, hoe te installeren, onderhouden, monitor, problemen oplossen en optimaliseren van Hadoop . Ze zullen ook oefenen met het bulksgewijs laden van gegevens, vertrouwd Hadoop met verschillende Hadoop distributies en oefenen met het installeren en beheren van Hadoop ecosysteemtools. De cursus eindigt met een bespreking van het beveiligen van cluster met Kerberos.

“… De materialen waren zeer goed voorbereid en grondig bedekt. Het lab was erg behulpzaam en goed georganiseerd ”
- Andrew Nguyen, hoofdintegratie DW Engineer, Microsoft Online Advertising

Publiek

Hadoop beheerders

Formaat

Lezingen en hands-on labs, bij benadering evenwicht 60% lezingen, 40% labs.

Hadoop for Developers (4 days)

28 Hours

Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. Deze cursus zal een ontwikkelaar om verschillende componenten (HDFS, MapReduce, Pig, introduceren Hive en HBase) Hadoop ecosysteem.

Advanced Hadoop for Developers

21 Hours

Apache Hadoop is een van de populairste kaders voor het verwerken van Big Data op clusters van servers. Deze cursus gaat in op gegevensbeheer in HDFS, geavanceerde Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen voordelig zijn voor ervaren Hadoop ontwikkelaars.

Publiek : ontwikkelaars

Duur: drie dagen

Formaat: hoorcolleges (50%) en hands-on labs (50%).

Hadoop for Project Managers

14 Hours

In deze door een instructeur geleide training in België leren deelnemers de kerncomponenten van het Hadoop ecosysteem en hoe deze technologieën kunnen worden gebruikt om grootschalige problemen op te lossen. Door deze fundamenten te leren, zullen de deelnemers hun vermogen verbeteren om te communiceren met de ontwikkelaars en implementeerders van deze systemen, evenals met de datawetenschappers en analisten waarbij veel IT-projecten betrokken zijn.

Publiek

Projectmanagers die Hadoop willen implementeren in hun bestaande ontwikkelings- of IT-infrastructuur
Projectmanagers die moeten communiceren met multifunctionele teams, waaronder big data-ingenieurs, datawetenschappers en bedrijfsanalisten

Hadoop Administration on MapR

28 Hours

Publiek:

Deze cursus is bedoeld om big data / hadoop-technologie te demystificeren en aan te tonen dat het niet moeilijk te begrijpen is.

Hadoop with Python

28 Hours

Hadoop is een populair Big Data verwerkingskader. Python is een high-level programmering taal beroemd om zijn duidelijke syntax en code leesbaarheid.

In deze instructeur geleide, live training, zullen de deelnemers leren hoe te werken met Hadoop, MapReduce, Pig, en Spark met behulp van Python als ze stappen door meerdere voorbeelden en gebruik gevallen.

Aan het einde van deze training zullen de deelnemers in staat zijn:

Begrijp de basisbegrippen achter Hadoop, MapReduce, Pig en Spark
Gebruik Python met Hadoop Distributed File System (HDFS), MapReduce, Pig en Spark
Gebruik Snakebite om programmatisch toegang te krijgen tot HDFS binnen Python
Gebruik mrjob om MapReduce banen te schrijven in Python
Schrijf Spark programma's met Python
Uitbreid de functionaliteit van varkens met Python UDF's
Manage MapReduce banen en Pig scripts met behulp van Luigi

Het publiek

Ontwikkelaars
IT Professionals

Format van de cursus

Deel lezing, deel discussie, oefeningen en zware praktijken

Hadoop and Spark for Administrators

35 Hours

Deze instructeur-geleide, live training in België (op locatie of op afstand) is gericht op systeembeheerders die willen leren hoe ze clusters binnen hun organisatie kunnen opzetten, implementeren en beheren.

Aan het einde van deze training kunnen deelnemers:

Installeer en configureer Apache Hadoop.
Begrijp de vier belangrijkste componenten in het Hadoop-ecosysteem: HDFS, MapReduce, YARN en Hadoop Common.
Gebruik Hadoop Distributed File System (HDFS) om een cluster te schalen naar honderden of duizenden knooppunten.
Stel HDFS in om te functioneren als opslagengine voor on-premise Spark-implementaties.
Stel Spark in voor toegang tot alternatieve opslagoplossingen zoals Amazon S3 en NoSQL databasesystemen zoals Redis, Elasticsearch, Couchbase, Aerospike, enz.
Voer administratieve taken uit zoals het inrichten, beheren, monitoren en beveiligen van een Apache Hadoop-cluster.

Hadoop for Developers and Administrators Training Cursus

Course Outline

Module 1. Inleiding tot Hadoop

Module 2. Inleiding tot MapReduce

Module 3. Een Hadoop cluster plannen

Module 4. Installatie en configuratie

Module 5. I/O Hadoop begrijpen

Module 6. Een MapReduce-applicatie ontwikkelen

Module 7. Identiteit, authenticatie en autorisatie

Module 8. Hulpbron Management

Module 9. MapReduce-typen en formaten

Module 10. MapReduce-functies gebruiken

Module 11. Clusteronderhoud en probleemoplossing

Module 12. Toezicht

Module 13. Back-up en herstel

Getuigenissen (1)

vyzVoice

Cursus - Hadoop for Developers and Administrators

Related Courses

Hortonworks Data Platform (HDP) for Administrators

Apache Ambari: Efficiently Manage Hadoop Clusters

Impala for Business Intelligence

Data Analysis with Hive/HiveQL

Administrator Training for Apache Hadoop

Publiek:

Go al:

Big Data Analytics in Health

Datameer for Data Analysts

Hadoop Administration

Doel van de cursus:

Hadoop For Administrators

Publiek

Formaat

Hadoop for Developers (4 days)

Advanced Hadoop for Developers

Hadoop for Project Managers

Hadoop Administration on MapR

Publiek:

Hadoop with Python

Hadoop and Spark for Administrators

Related Categories

Hadoop

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites