Home
big data opleiding
hadoop opleiding

Hadoop Administration on MapR Training Cursus

Publiek:

Deze cursus is bedoeld om big data / hadoop-technologie te demystificeren en aan te tonen dat het niet moeilijk te begrijpen is.

Thank you for sending your enquiry! One of our team members will contact you shortly.

Thank you for sending your booking! One of our team members will contact you shortly.

Course Outline

[1. Overzicht:

Wat is Big Data
Waarom Big Data aan populariteit wint
Big Data Casestudies
Big Data Kenmerken
Oplossingen om aan te werken Big Data.

Hadoop & Zijn componenten:

Wat is Hadoop en wat zijn de componenten ervan.
Hadoop Architectuur en de kenmerken ervan van de gegevens die het kan verwerken/verwerken.
Kort over Hadoop Geschiedenis, bedrijven die het gebruiken en waarom ze het zijn gaan gebruiken.
Hadoop Framewerk en de componenten ervan - in detail uitgelegd.
Wat is HDFS en leest en schrijft naar Hadoop gedistribueerd bestandssysteem.
Hoe in te stellen Hadoop Cluster in verschillende modi - Stand-alone/Pseudo/Multi Node-cluster.

(Dit omvat het opzetten van een Hadoop cluster in VirtualBox/KVM/VMware, netwerkconfiguraties waar zorgvuldig naar moet worden gekeken, het uitvoeren van Hadoop Daemons en het testen van het cluster).

Wat is Map Reduce frame work en hoe het werkt.
Kaart uitvoeren Verminder taken op cluster Hadoop.
Inzicht in replicatie, mirroring en rackbewustzijn in de context van Hadoop clusters.

Hadoop Clusterplanning:

Hoe u uw hadoop-cluster plant.
Hardware-software begrijpen om uw hadoop-cluster te plannen.
Inzicht in werklasten en planningscluster om fouten te voorkomen en optimaal te presteren.

Wat is MapR en waarom MapR:

Overzicht van MapR en zijn architectuur.
Begrip en werking van MapR Control System, MapR Volumes, snapshots & Mirrors.
Een cluster plannen in de context van MapR.
Vergelijking van MapR met andere distributies en Apache Hadoop.
MapR-installatie en clusterimplementatie.

Clusterconfiguratie en -beheer:

Beheer van services, knooppunten, momentopnamen, spiegelvolumes en externe clusters.
Knooppunten begrijpen en beheren.
Inzicht in Hadoop componenten, installatie van Hadoop componenten naast MapR Services.
Accessing Gegevens op cluster, inclusief via NFS-beheerservices en knooppunten.
Gegevens beheren door volumes te gebruiken, gebruikers en groepen beheren, rollen beheren en toewijzen aan knooppunten, de buitengebruikstelling van knooppunten in bedrijf stellen, clusterbeheer en prestatiemonitoring, statistieken configureren/analyseren en monitoren om de prestaties te monitoren, MapR-beveiliging configureren en beheren.
M7 begrijpen en ermee werken - Native opslag voor MapR-tabellen.
Clusterconfiguratie en afstemming voor optimale prestaties.

Clusterupgrade en integratie met andere opstellingen:

Softwareversie van MapR upgraden en soorten upgrades.
Mapr-cluster configureren voor toegang tot het HDFS-cluster.
MapR-cluster instellen op Amazon Elastic Mapreduce.

Alle bovenstaande onderwerpen omvatten demonstraties en oefensessies zodat leerlingen praktijkervaring met de technologie kunnen opdoen.

Requirements

Basiskennis van Linux FS
Basis Java
Kennis van Apache Hadoop (aanbevolen)

28 Hours

Number of participants

Online

Classroom

Select Location

Please select a Venue

Price per participant

Open Training Courses require 5+ participants.

Hadoop Administration on MapR Training Cursus - Booking

Full name *

Phone *

Email *

Job Title

Company Name

Address 1 *

Address 2

City *

State / Province

Country *

Postcode *

Tax ID

Start Date

End Date

Dates are subject to availability and take place between 09:30 and 16:30.

Payment Method *

Bank Transfer (Invoice, PO)

Debit / Credit Card

Additional Information

Comments

Allow Publishing Certificate

If you check this box the participants will receive an option to publish their course certificate on the NobleProg Certified Professional Catalogue.

Algemene Voorwaarden *

I am an authorised representative of the above named client and I wish to book the above courses or services in accordance with NobleProg Terms and Conditions and Privacy Policy.

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop Administration on MapR Training Cursus - Enquiry

Full name *

Phone *

Preferred

Email *

Preferred

Company Name

Company Address

Preferred

Number of participants

Date

How do you want to take the course?

Client Premises

Online

Classroom

Course Name

Duration, hours

Suitable Time

Preferred language

Suggested Venue Address

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Hadoop Administration on MapR - Consultancy Enquiry

Full name *

Phone *

Email *

Company Name

Consultancy Subject *

Consultancy Goal

Consultancy Duration

Number of Consultants

Suitable Date

Who will the consultant work with?

Consultancy Urgency *

Course Name

Duration, hours

Comments

Inform me about discounts and promotions

Please read our Privacy Policy to find out how we use your data

Getuigenissen (1)

practical things of doing, also theory was served good by Ajay

Dominik Mazur - Capgemini Polska Sp. z o.o.

Cursus - Hadoop Administration on MapR

Related Courses

Hortonworks Data Platform (HDP) for Administrators

21 Hours

Deze door een instructeur geleide, live training in België (op locatie of op afstand) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.

Aan het einde van deze training kunnen deelnemers:

Gebruik Hortonworks om Hadoop betrouwbaar op grote schaal uit te voeren. Verenig de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark. Gebruik Hortonworks om elk onderdeel van een Spark-project te onderzoeken, valideren, certificeren en ondersteunen. Verwerk verschillende soorten gegevens, waaronder gestructureerd, ongestructureerd, in beweging en in rust.

Apache Ambari: Efficiently Manage Hadoop Clusters

21 Hours

Apache Ambari is een open-source beheerplatform voor het Apache Ambari , beheren, bewaken en beveiligen van Apache Hadoop clusters.

In deze door een instructeur geleide live training leren deelnemers de managementtools en -praktijken die Ambari biedt om met succes Hadoop clusters te beheren.

Aan het einde van deze training kunnen deelnemers:

Zet een live Big Data cluster op met Ambari
Pas de geavanceerde functies en functionaliteiten van Ambari toe op verschillende gebruikssituaties
Voeg indien nodig naadloos knooppunten toe en verwijder deze
Verbeter de prestaties van een Hadoop cluster door afstemmen en tweaken

Publiek

DevOps
Systeembeheerders
DBA
Hadoop testprofessionals

Formaat van de cursus

Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen

Impala for Business Intelligence

21 Hours

Cloudera Impala is een open source MPP-query-engine (Massively Parallel Processing) SQL voor Apache Hadoop-clusters.

Impala stelt gebruikers in staat query's met lage latentie SQL uit te voeren naar gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevensverplaatsing of -transformatie nodig is.

Publiek

Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.

Na deze cursus zullen afgevaardigden in staat zijn om

Haal zinvolle informatie uit Hadoop-clusters met Impala. Schrijf specifieke programma's om Business Intelligence in Impala SQL Dialect te vergemakkelijken. Problemen met Impala oplossen.

Data Analysis with Hive/HiveQL

7 Hours

Deze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive

Administrator Training for Apache Hadoop

35 Hours

Publiek:

De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Go al:

Diepe kennis van Hadoop clusterbeheer.

Big Data Analytics in Health

21 Hours

Big data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken.

De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving.

In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen.

Aan het einde van deze training kunnen deelnemers:

Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
Begrijp de kenmerken van medische gegevens
Pas big data-technieken toe om met medische gegevens om te gaan
Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen

Publiek

ontwikkelaars
Data Scientists

Indeling van de cursus

Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.

Notitie

Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.

Datameer for Data Analysts

14 Hours

Datameer is een business intelligence en analytics-platform gebouwd op Hadoop Het stelt eindgebruikers in staat om op grote schaal gemakkelijk toegang te krijgen tot grootschalige, gestructureerde, semigestructureerde en ongestructureerde gegevens, deze te verkennen en te correleren Tijdens deze live training met instructeur leren deelnemers Datameer te gebruiken om de steile leercurve van Hadoop te overwinnen terwijl ze de opstelling en analyse van een reeks big data-bronnen doorlopen Aan het einde van deze training kunnen deelnemers: Creëer, ontwikkel en exploreer interactief een datameer voor bedrijven Toegang tot datawarehouses voor business intelligence, transactiedatabases en andere analytische winkels Gebruik een spreadsheetgebruikersinterface om endtoend gegevensverwerkingspijplijnen te ontwerpen Toegang tot vooraf gebouwde functies om complexe gegevensrelaties te verkennen Gebruik draganddrop-wizards om gegevens te visualiseren en dashboards te maken Gebruik tabellen, grafieken, grafieken en kaarten om queryresultaten te analyseren Publiek Data-analisten Formaat van de cursus Gedeeltelijke lezing, deelbespreking, oefeningen en zware handsonoefeningen .

Hadoop Administration

21 Hours

De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing voor het opslaan en verwerken van grote gegevenssets in een gedistribueerde systeemomgeving

Doel van de cursus:

Kennis verkrijgen over Hadoop clusterbeheer

Hadoop For Administrators

21 Hours

Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. In deze drie (eventueel vier) dagen cursus, zullen de deelnemers leren over de zakelijke voordelen en use cases voor Hadoop en zijn ecosysteem, hoe cluster inzet en groei plannen, hoe te installeren, onderhouden, monitor, problemen oplossen en optimaliseren van Hadoop . Ze zullen ook oefenen met het bulksgewijs laden van gegevens, vertrouwd Hadoop met verschillende Hadoop distributies en oefenen met het installeren en beheren van Hadoop ecosysteemtools. De cursus eindigt met een bespreking van het beveiligen van cluster met Kerberos.

“… De materialen waren zeer goed voorbereid en grondig bedekt. Het lab was erg behulpzaam en goed georganiseerd ”
- Andrew Nguyen, hoofdintegratie DW Engineer, Microsoft Online Advertising

Publiek

Hadoop beheerders

Formaat

Lezingen en hands-on labs, bij benadering evenwicht 60% lezingen, 40% labs.

Hadoop for Developers (4 days)

28 Hours

Apache Hadoop is het populairste framework voor het verwerken van Big Data op clusters van servers. Deze cursus zal een ontwikkelaar om verschillende componenten (HDFS, MapReduce, Pig, introduceren Hive en HBase) Hadoop ecosysteem.

Advanced Hadoop for Developers

21 Hours

Apache Hadoop is een van de populairste kaders voor het verwerken van Big Data op clusters van servers. Deze cursus gaat in op gegevensbeheer in HDFS, geavanceerde Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen voordelig zijn voor ervaren Hadoop ontwikkelaars.

Publiek : ontwikkelaars

Duur: drie dagen

Formaat: hoorcolleges (50%) en hands-on labs (50%).

Hadoop for Developers and Administrators

21 Hours

Hadoop is het meest populaire framework voor Big Data-verwerking .

Hadoop for Project Managers

14 Hours

In deze door een instructeur geleide training in België leren deelnemers de kerncomponenten van het Hadoop ecosysteem en hoe deze technologieën kunnen worden gebruikt om grootschalige problemen op te lossen. Door deze fundamenten te leren, zullen de deelnemers hun vermogen verbeteren om te communiceren met de ontwikkelaars en implementeerders van deze systemen, evenals met de datawetenschappers en analisten waarbij veel IT-projecten betrokken zijn.

Publiek

Projectmanagers die Hadoop willen implementeren in hun bestaande ontwikkelings- of IT-infrastructuur
Projectmanagers die moeten communiceren met multifunctionele teams, waaronder big data-ingenieurs, datawetenschappers en bedrijfsanalisten

Hadoop with Python

28 Hours

Hadoop is een populair Big Data verwerkingskader. Python is een high-level programmering taal beroemd om zijn duidelijke syntax en code leesbaarheid.

In deze instructeur geleide, live training, zullen de deelnemers leren hoe te werken met Hadoop, MapReduce, Pig, en Spark met behulp van Python als ze stappen door meerdere voorbeelden en gebruik gevallen.

Aan het einde van deze training zullen de deelnemers in staat zijn:

Begrijp de basisbegrippen achter Hadoop, MapReduce, Pig en Spark
Gebruik Python met Hadoop Distributed File System (HDFS), MapReduce, Pig en Spark
Gebruik Snakebite om programmatisch toegang te krijgen tot HDFS binnen Python
Gebruik mrjob om MapReduce banen te schrijven in Python
Schrijf Spark programma's met Python
Uitbreid de functionaliteit van varkens met Python UDF's
Manage MapReduce banen en Pig scripts met behulp van Luigi

Het publiek

Ontwikkelaars
IT Professionals

Format van de cursus

Deel lezing, deel discussie, oefeningen en zware praktijken

Hadoop and Spark for Administrators

35 Hours

Deze instructeur-geleide, live training in België (op locatie of op afstand) is gericht op systeembeheerders die willen leren hoe ze clusters binnen hun organisatie kunnen opzetten, implementeren en beheren.

Aan het einde van deze training kunnen deelnemers:

Installeer en configureer Apache Hadoop.
Begrijp de vier belangrijkste componenten in het Hadoop-ecosysteem: HDFS, MapReduce, YARN en Hadoop Common.
Gebruik Hadoop Distributed File System (HDFS) om een cluster te schalen naar honderden of duizenden knooppunten.
Stel HDFS in om te functioneren als opslagengine voor on-premise Spark-implementaties.
Stel Spark in voor toegang tot alternatieve opslagoplossingen zoals Amazon S3 en NoSQL databasesystemen zoals Redis, Elasticsearch, Couchbase, Aerospike, enz.
Voer administratieve taken uit zoals het inrichten, beheren, monitoren en beveiligen van een Apache Hadoop-cluster.

Hadoop Administration on MapR Training Cursus

Publiek:

Course Outline

[1. Overzicht:

Hadoop & Zijn componenten:

Hadoop Clusterplanning:

Wat is MapR en waarom MapR:

Clusterconfiguratie en -beheer:

Clusterupgrade en integratie met andere opstellingen:

Requirements

Getuigenissen (1)

Dominik Mazur - Capgemini Polska Sp. z o.o.

Cursus - Hadoop Administration on MapR

Related Courses

Hortonworks Data Platform (HDP) for Administrators

Apache Ambari: Efficiently Manage Hadoop Clusters

Impala for Business Intelligence

Data Analysis with Hive/HiveQL

Administrator Training for Apache Hadoop

Big Data Analytics in Health

Datameer for Data Analysts

Hadoop Administration

Hadoop For Administrators

Hadoop for Developers (4 days)

Advanced Hadoop for Developers

Hadoop for Developers and Administrators

Hadoop for Project Managers

Hadoop with Python

Hadoop and Spark for Administrators

Related Categories

This site in other countries/regions

Europe

Asia Pacific

North America

South America

Africa / Middle East

Other sites