Plan du cours

Semaine 1 Big Data concepts

  • Définition de VVVV (Vélocité, Volume, Variété, Véracité)
  • Limites de la capacité traditionnelle de traitement des données
  • Traitement distribué
  • Analyse statistique
  • Machine Learning Types d'analyse
  • Data Visualization
  • Traitement distribué (par ex. map-reduce)
  • Introduction aux langages utilisés
  • Cours accéléré sur le langage R
  • Python cours accéléré

Semaines 2&3 Exécution Data Analysis

  • Analyse statistique
  • Descriptive Statistics dans Big Data ensembles (par exemple, calcul de la moyenne)
  • Inférentielle Statistics (estimation)
  • Forecasting avec des modèles de corrélation et de régression
  • Analyse des séries temporelles
  • Notions de base Machine Learning
  • Apprentissage supervisé ou non supervisé
  • Classification et regroupement
  • Estimation du coût des méthodes spécifiques
  • Filtre

Semaine 4 Traitement du langage naturel

  • Traitement du texte
  • Comprendre le sens du texte
  • Génération automatique de texte
  • Analyse du sentiment/sujet
  • Computer Vision

Semaine 5&6 Concept d'outil

  • Solution de stockage de données (SQL, NoSQL, hiérarchique, orienté objet, orienté document)
  • (par exemple, HDFS MySQL, Cassandra, MongoDB, Elasticsearch, etc...)
  • Choisir la bonne solution au problème
  • Traitement distribué
  • Spark
  • Machine Learning avec Spark (MLLib)
  • Spark SQL
  • Scalabilité
  • Cloud public (AWS, Google, etc...)
  • Cloud privé (OpenStack, cloud foundry)
  • Autoscalabilité

Semaine 7 Soft Skills

  • Conseil et Leadership compétences
  • Avoir un impact : raconter des histoires basées sur des données
  • Comprendre son public
  • Présentation efficace des données - faire passer votre message
  • Efficacité de l'influence et conduite du changement
  • Gérer les situations difficiles

Examen de fin d'études

  • Examen de fin de programme

Pré requis

Les participants doivent avoir de bonnes bases en mathématiques, au moins au niveau du lycée.

Il n'est pas nécessaire d'avoir des compétences en programmation, mais toute compétence en la matière sera utile.

Les participants seront évalués et interrogés avant de participer à ce programme de formation.

 245 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (4)

Cours Similaires

Big Data Business Intelligence for Telecom and Communication Service Providers

35 heures

MATLAB Fundamentals, Data Science & Report Generation

35 heures

F# for Data Science

21 heures

Python Programming for Finance

35 heures

Catégories Similaires