Plan du cours

Introduction

Principes de l'informatique distribuée

    Apache Spark Hadoop

Principes de Data Serialization

    Comment les objets de données sont transmis sur le réseau Sérialisation des objets Approches de sérialisation Tampons de protocole Thrift Apache Avro caractéristiques de la taille, de la vitesse et du format de la structure des données intégration du stockage de données persistant avec des langages dynamiques schémas de typage dynamique gestion des modifications de données non balisées

Data Serialization et informatique distribuée

    Avro en tant que sous-projet de sérialisation Hadoop Java Sérialisation Hadoop Sérialisation Avro

Utiliser Avro avec

    Hive (AvroSerDe) Cochon (AvroStorage)

Portage des frameworks RPC existants

Sommaire et conclusion

Pré requis

  • Une familiarité générale avec l'informatique distribuée.
  14 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (3)

Cours Similaires

Catégories Similaires