
Apache Hadoop est un framework libre et open source inspiré de deux noyeaux de la gestion BigData de Google: GFS (Google File System) and MapReduce. C'est un framework complet destiné à stocker et traiter de grosses quantités de données. Hadoop est utilisé par la plupart des fournisseurs de service dont Yahoo, Facebook ou LinkedIn.
Nos Clients témoignent
Le fait que toutes les données et tous les logiciels étaient prêts à être utilisés sur une VM déjà préparée, fournie par le formateur sur des disques externes.
vyzVoice
Formation: Hadoop for Developers and Administrators
Machine Translated
J'ai surtout aimé le formateur en donnant des exemples réels.
Simon Hahn
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai vraiment apprécié les grandes compétences du formateur.
Grzegorz Gorski
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai vraiment apprécié les nombreuses sessions pratiques.
Jacek Pieczątka
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai beaucoup aimé la façon interactive d'apprendre.
Luigi Loiacono
Formation: Data Analysis with Hive/HiveQL
Machine Translated
C'était une formation très pratique, j'ai aimé les exercices pratiques.
Proximus
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai bénéficié de la bonne vue d'ensemble, du bon équilibre entre la théorie et les exercices.
Proximus
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai apprécié l'interaction dynamique et la pratique du sujet, grâce à la machine virtuelle, très stimulante!
Philippe Job
Formation: Data Analysis with Hive/HiveQL
Machine Translated
J'ai bénéficié de la compétence et des connaissances du formateur.
Jonathan Puvilland
Formation: Data Analysis with Hive/HiveQL
Machine Translated
C'était très pratique, nous avons passé la moitié du temps à faire des choses dans Clouded / Hardtop, à exécuter différentes commandes, à vérifier le système, etc. Les matériaux supplémentaires (livres, sites Web, etc.) ont été très appréciés, nous devrons continuer à apprendre. Les installations étaient très amusantes et très pratiques, la configuration du cluster à partir de zéro était vraiment bonne.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
Le formateur était fantastique et connaissait vraiment ses affaires. J'ai beaucoup appris sur le logiciel que je ne connaissais pas auparavant, ce qui aidera beaucoup dans mon travail!
Steve McPhail - Alberta Health Services - Information Technology
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Les principes de haut niveau concernant Hive, HDFS ...
Geert Suys - Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Le handson. Le mix pratique / theroy
Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Fulvio a été en mesure de comprendre le business de notre entreprise et a pu établir une corrélation avec le matériel de cours presque instantanément.
Samuel Peeters - Proximus Group
Formation: Data Analysis with Hive/HiveQL
Machine Translated
Beaucoup d'exercices pratiques.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
Outil de gestion Ambari. Capacité à discuter des expériences pratiques Hadoop partir d'une analyse de rentabilité autre que celle des télécommunications.
Ericsson
Formation: Administrator Training for Apache Hadoop
Machine Translated
J'ai pensé qu'il a fait un excellent travail d'adapter l'expérience à l'auditoire. Cette classe est principalement conçue pour couvrir l'analyse des données avec HIVE, mais moi et mon collègue faisons l'administration HIVE sans responsabilités réelles d'analyse de données.
ian reif - Franchise Tax Board
Formation: Data Analysis with Hive/HiveQL
Machine Translated
La VM que j'aimais beaucoup L'enseignant était très bien informé sur le sujet ainsi que d'autres sujets, il était très gentil et sympathique J'ai aimé l'installation à Dubaï.
Safar Alqahtani - Elm Information Security
Formation: Big Data Analytics in Health
Machine Translated
Thèmes de formation et engagement du formateur
Izba Administracji Skarbowej w Lublinie
Formation: Apache NiFi for Administrators
Machine Translated
Communication avec les personnes participant à la formation.
Andrzej Szewczuk - Izba Administracji Skarbowej w Lublinie
Formation: Apache NiFi for Administrators
Machine Translated
choses pratiques de faire, aussi la théorie a été bien servi par Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Formation: Hadoop Administration on MapR
Machine Translated
Des exercices
Capgemini Polska Sp. z o.o.
Formation: Hadoop Administration on MapR
Machine Translated
utilité des exercices
Algomine sp.z.o.o sp.k.
Formation: Apache NiFi for Administrators
Machine Translated
J'ai trouvé la formation bonne, très informative ... mais aurait pu être répartie sur 4 ou 5 jours, nous permettant d'entrer dans plus de détails sur différents aspects.
Veterans Affairs Canada
Formation: Hadoop Administration
Machine Translated
J'ai vraiment apprécié l'entraînement. Anton a beaucoup de connaissances et a présenté la théorie nécessaire de manière très accessible. C’est formidable que la formation comprenne de nombreux exercices intéressants. Nous avons donc été en contact avec la technologie que nous connaissons depuis le tout début.
Szymon Dybczak - Algomine sp.z.o.o sp.k.
Formation: Apache NiFi for Administrators
Machine Translated
J'ai trouvé que ce cours donnait un bon aperçu et touchait rapidement certains domaines que je n'avais même pas envisagés.
Veterans Affairs Canada
Formation: Hadoop Administration
Machine Translated
J'ai vraiment aimé les exercices avec cluster pour voir les performances des nœuds à travers le cluster et les fonctionnalités étendues.
CACI Ltd
Formation: Apache NiFi for Developers
Machine Translated
Ajay était un consultant très expérimenté et a été en mesure de répondre à toutes nos questions et même de faire des suggestions sur les meilleures pratiques pour le projet sur lequel nous sommes actuellement engagés.
CACI Ltd
Formation: Apache NiFi for Administrators
Machine Translated
Partie pratique. Les tâches ont été bien choisies pour les questions discutées.
Rossmann SDP
Formation: HBase for Developers
Machine Translated
Sous-catégories Hadoop
Plans de cours Hadoop
Cette formation guidée par les instructeurs (online ou on-site) est destinée aux développeurs qui souhaitent utiliser et intégrer Spark, Hadoop, et Python pour traiter, analyser et transformer de grands et complexes ensembles de données.
À la fin de cette formation, les participants seront en mesure de :
Créez l’environnement nécessaire pour commencer à traiter les grandes données avec Spark, Hadoop, et Python. Comprendre les caractéristiques, les composants de base et l'architecture de Spark et Hadoop. Apprenez à intégrer Spark, Hadoop, et Python pour le traitement de données grandes. Explorez les outils dans l'écosystème Spark (Spark MlLib, Spark Streaming, Kafka, Sqoop, Kafka, et Flume). Construisez des systèmes de recommandations de filtration collaboratives similaires à Netflix, YouTube, Amazon, Spotify et Google. Utilisez Apache Mahout pour échanger les algorithmes d’apprentissage automatique.
Le format du cours
Lecture et discussion interactives. Beaucoup d’exercices et de pratiques. La mise en œuvre dans un environnement de laboratoire en direct.
Options de personnalisation de cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Course goal:
Getting knowledge regarding Hadoop cluster administration
Le cours est destiné aux informaticiens à la recherche d'une solution pour stocker et traiter de grands ensembles de données dans un environnement système distribué.
Go al:
Connaissance approfondie de l'administration de cluster Hadoop .
This course is intended to demystify big data/hadoop technology and to show it is not difficult to understand.
Public : développeurs
Durée: trois jours
Format: cours magistraux (50%) et travaux pratiques (50%).
We will walk a developer through HBase architecture and data modelling and application development on HBase. It will also discuss using MapReduce with HBase, and some administration topics, related to performance optimization. The course is very hands-on with lots of lab exercises.
Duration : 3 days
Audience : Developers & Administrators
“… Les matériaux étaient très bien préparés et couverts à fond. Le laboratoire était très serviable et bien organisé ”
- Andrew Nguyen, ingénieur principal en intégration, Microsoft Online Advertising
Public
Administrateurs Hadoop
Format
Cours magistraux et ateliers pratiques, bilan approximatif: 60% cours magistraux, 40% laboratoires.
Audience
Business Analysts
Duration
three days
Format
Lectures and hands on labs.
- Developers
Format of the Course
- Lectures, hands-on practice, small tests along the way to gauge understanding
Le cours est axé sur la manipulation et la transformation des données.
Parmi les outils de l'écosystème Hadoop , ce cours comprend l'utilisation de Pig et Hive deux outils très utilisés pour la transformation et la manipulation de données.
Cette formation aborde également les métriques de performance et l'optimisation de la performance.
Le cours est entièrement pratique et est ponctué de présentations des aspects théoriques.
Audience
- Project Managers wishing to implement Hadoop into their existing development or IT infrastructure
- Project Managers needing to communicate with cross-functional teams that include big data engineers, data scientists and business analysts
Cette formation en direct, animée par un instructeur, présente les principes sous-jacents aux systèmes de messagerie et au traitement de flux distribué, tout en guidant les participants dans la création d'un exemple de projet et d'exécution de travaux basé sur Samza.
À la fin de cette formation, les participants seront en mesure de:
- Utilisez Samza pour simplifier le code nécessaire à la production et à la consommation de messages.
- Découpler le traitement des messages d'une application.
- Utilisez Samza pour implémenter un calcul asynchrone en temps quasi réel.
- Utilisez le traitement de flux pour fournir un niveau d'abstraction plus élevé sur les systèmes de messagerie.
Public
- Développeurs
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Dans cette formation guidée par l'instructeur, les participants apprendront comment utiliser Alluxio pour broyer différents cadres de calcul avec les systèmes de stockage et gérer efficacement les données d'échelle multi-pétabytes au fur et à mesure qu'ils traversent la création d'une application avec Alluxio.
À la fin de cette formation, les participants seront en mesure de :
Développer une application avec Alluxio Connectez les systèmes de données et les applications tout en conservant un seul espace de nom Extrait efficace de la valeur des grandes données dans n'importe quel format de stockage Améliorer la performance du travail Déployer et gérer Alluxio indépendamment ou cluster
Audience
scientifique des données Développeur Système administrateur
Format du cours
Lecture partielle, discussion partielle, exercices et pratiques lourdes
Au cours de cette formation en direct animée par un instructeur (sur site ou à distance), les participants apprendront à déployer et à gérer Apache NiFi dans un environnement de laboratoire réel.
À la fin de cette formation, les participants seront en mesure de:
- Installez et configurez Apachi NiFi.
- Créez, transformez et gérez des données à partir de sources de données disparates et distribuées, y compris des bases de données et des grands lacs de données.
- Automatiser les flux de données.
- Activer l'analyse en streaming.
- Appliquez diverses approches pour l’ingestion de données.
- Transformez le Big Data en un aperçu des affaires.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Lors de cette formation en direct animée par un instructeur, les participants apprendront les bases de la programmation basée sur les flux tout en développant un certain nombre d'extensions, de composants et de processeurs de démonstration utilisant Apache NiFi .
À la fin de cette formation, les participants seront en mesure de:
- Comprendre l'architecture et les concepts de flux de données de NiFi.
- Développez des extensions à l'aide d'API NiFi et tierces.
- Personnaliser développer leur propre processeur Apache Nifi.
- Acquérir et traiter des données en temps réel à partir de formats de fichiers et de sources de données disparates et peu communes.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Dans cette formation guidée par l'instructeur, les participants apprendront comment travailler avec Hadoop, MapReduce, Pig, et Spark en utilisant Python alors qu'ils passent par plusieurs exemples et utilisent des cas.
À la fin de cette formation, les participants seront en mesure de :
Comprendre les concepts de base derrière Hadoop, MapReduce, Pig, et Spark Utiliser Python avec Hadoop Système de fichiers distribués (HDFS), MapReduce, Pig et Spark Utilisez Snakebite pour accéder programmatiquement à HDFS dans Python Utilisez mrjob pour écrire MapReduce emplois dans Python Écrire des programmes Spark avec Python Élargissez la fonctionnalité du porc en utilisant Python UDFs Gérer MapReduce des emplois et des scripts de porc en utilisant Luigi
Audience
Développeurs Les professionnels
Format du cours
Lecture partielle, discussion partielle, exercices et pratiques lourdes
Au cours de cette formation en direct animée par un instructeur, les participants apprendront à utiliser Sqoop pour importer des données d'une base de données relationnelle traditionnelle vers un stockage Hadoop tel que HDFS ou Hive et inversement.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer Sqoop
- Importer des données de My SQL vers HDFS et Hive
- Importer des données depuis HDFS et Hive vers My SQL
Public
- Administrateurs système
- Ingénieurs de données
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
L'industrie de la santé dispose de quantités massives de données médicales et cliniques hétérogènes complexes. L'application de l'analyse de données volumineuses sur les données de santé présente un potentiel énorme pour la compréhension de l'amélioration de la prestation des soins de santé. Cependant, l'énormité de ces ensembles de données pose de grands défis pour les analyses et les applications pratiques dans un environnement clinique.
Au cours de cette formation en direct animée par un instructeur (à distance), les participants apprendront à effectuer des analyses de données volumineuses dans le domaine de la santé tout en effectuant une série d'exercices pratiques en laboratoire.
À la fin de cette formation, les participants seront en mesure de:
- Installer et configurer des outils d'analyse de données volumineuses tels que Hadoop MapReduce et Spark
- Comprendre les caractéristiques des données médicales
- Appliquer des techniques Big Data pour traiter des données médicales
- Etudiez les systèmes de données volumineuses et les algorithmes dans le contexte d'applications de santé
Public
- Développeurs
- Data Scientists
Format du cours
- Partie lecture, partie discussion, exercices et exercices intensifs.
Remarque
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Cette formation guidée par les instructeurs, en direct (online ou sur site) est destinée aux administrateurs de systèmes qui souhaitent apprendre à configurer, déployer et gérer Hadoop des clusters dans leur organisation.
À la fin de cette formation, les participants seront en mesure de :
Installer et configurer Apache Hadoop. Comprendre les quatre principaux composants de l'écosystème Hadoop : HDFS, MapReduce, YARN et Hadoop Common. Utilisez Hadoop Système de fichiers distribué (HDFS) pour échanger un cluster à des centaines ou des milliers de nœuds.   ; Configurez HDFS pour fonctionner en tant que moteur de stockage pour les déploiements Spark en prévision. Configurez Spark pour accéder à des solutions de stockage alternatives telles que les systèmes de base de données Amazon S3 et NoSQL telles que Redis, Elasticsearch, Couchbase, Aerospike, etc. Exécuter des tâches administratives telles que la fourniture, la gestion, le suivi et la sécurité d'un cluster Apache.
Le format du cours
Lecture et discussion interactives. Beaucoup d’exercices et de pratiques. La mise en œuvre dans un environnement de laboratoire en direct.
Options de personnalisation de cours
Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser.
Impala permet aux utilisateurs d’émettre des requêtes à faible latence SQL à des données stockées dans Hadoop Système de fichiers distribués et Apache Hbase sans nécessiter le mouvement ou la transformation des données.
Audience
Ce cours vise les analystes et les scientifiques de données qui effectuent des analyses sur les données stockées dans Hadoop viaBusiness Intelligence ou SQL outils.
Après cette formation, les délégués seront en mesure de
Écrivez des informations significatives de Hadoop clusters avec Impala. Écrivez des programmes spécifiques pour faciliter Business Intelligence dans Impala SQL Dialect. Le trouble Impala
Dans cette formation en direct animée par un instructeur, les participants apprendront les outils et pratiques de gestion fournis par Ambari pour gérer avec succès les clusters Hadoop .
À la fin de cette formation, les participants seront en mesure de:
- Configurer un cluster Big Data en direct avec Ambari
- Appliquer les fonctionnalités avancées d'Ambari à divers cas d'utilisation
- Ajoutez et supprimez des nœuds de manière transparente, au besoin
- Améliorez les performances d'un cluster Hadoop le biais de réglages et d'ajustements
Public
- DevOps
- Administrateurs système
- DBA
- Professionnels de test Hadoop
Format du cours
- Partie de conférence, partie de discussion, exercices et exercices intensifs
Cette formation en direct animée par un instructeur (sur site ou à distance) présente Hortonworks Data Platform (HDP) et guide les participants dans le déploiement de la solution Spark + Hadoop .
À la fin de cette formation, les participants seront en mesure de:
- Utilisez Hortonworks pour exécuter Hadoop de manière fiable à grande échelle.
- Unifiez les capacités de sécurité, de gouvernance et d'exploitation de Hadoop avec les workflows d'analyse agiles de Spark.
- Utilisez Hortonworks pour étudier, valider, certifier et soutenir chacun des composants d’un projet Spark.
- Traitez différents types de données, y compris les données structurées, non structurées, en mouvement et au repos.
Format du cours
- Conférence interactive et discussion.
- Beaucoup d'exercices et de pratique.
- Mise en œuvre pratique dans un environnement de laboratoire réel.
Options de personnalisation du cours
- Pour demander une formation personnalisée pour ce cours, veuillez nous contacter pour organiser cela.
Last Updated: