Plan du cours

Jour Un : Fondements du langage

  • Présentation du cours
  • À propos de Data Science
    • Définition de Data Science
    • Processus de réalisation de Data Science.
  • Présentation de R Language
  • Variables et Types
  • Structures de contrôle (Boucles / Conditionnels)
  • Scalaires R, Vecteurs et Matrices
    • Définition des vecteurs R
    • Matrices
  • Manipulation de chaînes et de texte
    • Type de données caractère
    • Entrée/sortie de fichiers
  • Listes
  • Fonctions
    • Introduction aux fonctions
    • Closures
    • Fonctions lapply/sapply
  • DataFrames
  • Ateliers pour toutes les sections

Jour Deux : R intermédiaire Programming

  • DataFrames et Entrée/sortie de fichiers
  • Lecture des données à partir des fichiers
  • Préparation des données
  • Jeux de données intégrés
  • Visualisation
    • Paquet Graphics
    • plot() / barplot() / hist() / boxplot() / scatter plot
    • Heat Map
    • Paquet ggplot2 (qplot(), ggplot())
  • Exploration avec Dplyr
  • Ateliers pour toutes les sections

Jour Trois : Avancé Programming Avec R

  • Modélisation statistique avec R
    • Fonctions statistiques
    • Gestion des valeurs manquantes (NA)
    • Distributions (Binomiale, Poisson, Normale)
  • Régression
    • Introduction aux régressions linéaires
  • Recommandations
  • Traitement de texte (paquet tm / Wordclouds)
  • Clustering
    • Introduction au clustering
    • KMeans
  • Classification
    • Introduction à la classification
    • Naive Bayes
    • Arbres de décision
    • Formation avec le paquet caret
    • Évaluation des algorithmes
  • R et Big Data
    • Connexion de R aux bases de données
    • Ecosystème Big Data
  • Ateliers pour toutes les sections

Pré requis

  • Une connaissance de base en programmation est recommandée

Configuration

 21 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (7)

Cours à venir

Catégories Similaires