Course Outline

Invoering

  • Waarom en hoe projectteams adopteren Hadoop
  • Hoe het allemaal begon
  • De rol van de projectmanager in Hadoop projecten

De architectuur en sleutelconcepten van Hadoop begrijpen

  • HDFS
  • KaartVerminderen
  • Andere delen van het Hadoop ecosysteem

Wat is Big Data?

Verschillende benaderingen van opslag Big Data

HDFS (Hadoop Distributed File System) als basis

Hoe Big Data wordt verwerkt

  • De kracht van gedistribueerde verwerking

Gegevens verwerken met MapReduce

  • Hoe data stap voor stap uit elkaar worden gehaald

De rol van clustering bij grootschalige gedistribueerde verwerking

  • Architectonisch overzicht
  • Clusterende benaderingen

Cluster uw gegevens en processen met YARN

De rol van niet-relationele Database in Big Data opslag

Werken met niet-relationele Database van Hadoop: HBase

Architectuuroverzicht datawarehousing

Je Data Warehouse beheren met Hive

Uitvoeren van Hadoop vanuit Shell-Scripts

Werken met Hadoop Streaming

Overige Hadoop Tools en hulpprogramma's

Aan de slag met een Hadoop-project

  • Demystificerende complexiteit

Een bestaand project migreren naar Hadoop

  • Overwegingen bij infrastructuur
  • Schaal verder dan uw toegewezen resources

Hadoop Projectbelanghebbenden en hun toolkits

  • Ontwikkelaars, datawetenschappers, businessanalisten en projectmanagers

Hadoop als basis voor nieuwe technologieën en benaderingen

Slotopmerkingen

Requirements

  • Een algemeen begrip van programmeren
  • Een goed begrip van databases
  • Basiskennis van Linux
 14 Hours

Number of participants



Price per participant

Getuigenissen (5)

Related Courses

Hortonworks Data Platform (HDP) for Administrators

21 Hours

Apache Ambari: Efficiently Manage Hadoop Clusters

21 Hours

Impala for Business Intelligence

21 Hours

Data Analysis with Hive/HiveQL

7 Hours

Administrator Training for Apache Hadoop

35 Hours

Big Data Analytics in Health

21 Hours

Datameer for Data Analysts

14 Hours

Hadoop Administration

21 Hours

Hadoop For Administrators

21 Hours

Hadoop for Developers (4 days)

28 Hours

Advanced Hadoop for Developers

21 Hours

Hadoop for Developers and Administrators

21 Hours

Hadoop Administration on MapR

28 Hours

Hadoop with Python

28 Hours

Hadoop and Spark for Administrators

35 Hours

Related Categories