Plan du cours

Rapide vue d'ensemble

  • Les sources de données
  • Attention aux données
  • Systèmes de recommandation
  • Cible Marketing

Types de données

  • Structuré vs non structuré
  • Statique ou diffusé en continu
  • Données comportementales, comportementales et démographiques
  • Analyse basée sur les données ou basée sur l'utilisateur
  • validité des données
  • Volume, vitesse et variété des données

Des modèles

  • Modèles de construction
  • Modèles statistiques
  • Apprentissage automatique

Classification des données

  • Regroupement
  • kGroups, k-means, les voisins les plus proches
  • Colonies de fourmis, oiseaux affluant

Modèles prédictifs

  • Arbres de décision
  • Machine à vecteurs de support
  • Classification naïve de Bayes
  • Les réseaux de neurones
  • Modèle de Markov
  • Régression
  • Méthodes d'ensemble

Retour sur investissement

  • Rapport bénéfice/coût
  • Coût du logiciel
  • Coût de développement
  • Des bénéfices potentiels

Modèles de construction

  • Préparation des données (MapReduce)
  • Nettoyage des données
  • Choisir des méthodes
  • Modèle en développement
  • Modèle de test
  • Évaluation du modèle
  • Déploiement et intégration de modèles

Présentation des logiciels Open Source et commerciaux

  • Sélection du package R-project
  • Python bibliothèques
  • Hadoop et Mahout
  • Projets Apache sélectionnés liés à Big Data et Analytics
  • Solution commerciale sélectionnée
  • Intégration avec les logiciels et sources de données existants

Pré requis

Compréhension des méthodes traditionnelles de gestion et d'analyse des données telles que SQL, les entrepôts de données, la veille économique, OLAP, etc... Compréhension des statistiques de base et des probabilités (moyenne, variance, probabilité, probabilité conditionnelle, etc....)

 21 heures

Nombre de participants



Prix par participant

Nos Clients témoignent (1)

Catégories Similaires