Plan du cours

Introduction

  • Bases de données graphiques et bibliothèques

Comprendre les données graphiques

  • Le graphe en tant que structure de données
  • Utiliser les sommets (points) et les arêtes (lignes) pour modéliser des scénarios du monde réel

Utilisation des graphes Database pour modéliser, persister et traiter les données graphiques

  • Algorithmes/traversées de graphes locaux
  • neo4j, OrientDB et Titan

Exercice : Modélisation de données graphiques avec neo4j

  • Modélisation de données sur tableau blanc

Au-delà des graphes Databases : Graph Computing

  • Comprendre le graphe de propriétés
  • Graphique modélisant différents scénarios (graphe logiciel, graphe de discussion, graphe de concept)

Résoudre des problèmes concrets à l'aide de trajets

  • Traversée algorithmique/dirigée du graphe
  • Déterminer les dépendances circulaires

Étude de cas : Classement des contributeurs aux discussions

  • Classement en fonction du nombre et de la profondeur des contributions aux discussions
  • Note sur l'analyse des sentiments et des concepts

Graph Computing : Boîtes à outils locales et en mémoire pour les graphes

  • Analyse et visualisation des graphes
  • JUNG, NetworkX et iGraph

Exercice : Modélisation de données graphiques avec NetworkX

  • Utilisation de NetworkX pour modéliser un système complexe

Graph Computing : Cadres de traitement par lots des graphes

  • Exploiter Hadoop pour le stockage (HDFS) et le traitement (MapReduce)
  • Aperçu des algorithmes itératifs
  • Hama, Giraph et GraphLab

Graph Computing : Calcul parallèle de graphes

  • Unification de l'ETL, de l'analyse exploratoire et du calcul itératif de graphes au sein d'un système unique
  • GraphX

Configuration et installation

  • Hadoop et Spark

GraphX Opérateurs

  • Propriété, structure, jointure, agrégation de voisinage, mise en cache et décachetage

Itérer avec l'API Pregel

  • Passer des arguments pour l'envoi, la réception et le calcul

Construction d'un graphe

  • Utilisation des sommets et des arêtes dans un RDD ou sur disque

Conception d'algorithmes Scalable

  • Optimisation GraphX

[Algorithmes supplémentaires

  • PageRank, composantes connectées, comptage de triangles

Exercices : Page Rank et Top Users

  • Construction et traitement de données graphiques à l'aide de fichiers texte en entrée

Déploiement en production

Remarques finales

Pré requis

  • Une compréhension de la programmation et des cadres Java
  • Une compréhension générale de Python est utile mais non requise
  • Une compréhension générale des concepts de base de données

Audience

  • Développeurs
  28 heures
 

Nombre de participants


Début

Fin


Dates are subject to availability and take place between 09:30 and 16:30.
Les formations ouvertes requièrent plus de 3 participants.

Nos Clients témoignent (2)

Cours Similaires

Catégories Similaires