Plan du cours
Jour 1 : Les bases du langage
- Introduction au cours
-
À propos de la Science des Données
- Définition de la Science des Données
- Processus de réalisation d'un projet de Science des Données.
- Présentation du langage R
- Variables et types
- Structures de contrôle (Boucles / Conditions)
-
Scalers, Vecteurs et Matrices dans R
- Définition de vecteurs R
- Matrices
-
Manipulation de chaînes et de texte
- Type de données caractère
- E/S de fichiers
- Listes
-
Fonctions
- Introduction aux fonctions
- Fermetures (Closures)
- Fonctions lapply/sapply
- DataFrames
- Travaux pratiques sur toutes les sections
Jour 2 : Programmation R intermédiaire
- DataFrames et E/S de fichiers
- Lecture de données depuis des fichiers
- Préparation des données
- Ensembles de données intégrés
-
Visualisation
- Package Graphics
- plot() / barplot() / hist() / boxplot() / nuage de points
- Carte thermique (Heat Map)
- Package ggplot2 (qplot(), ggplot())
- Exploration avec Dplyr
- Travaux pratiques sur toutes les sections
Jour 3 : Programmation R avancée
-
Modélisation statistique avec R
- Fonctions statistiques
- Gestion des valeurs NA
- Distributions (Binomiale, Poisson, Normale)
-
Régression
- Introduction aux régressions linéaires
- Systèmes de recommandation
- Traitement de texte (package tm / nuages de mots)
-
Regroupement (Clustering)
- Introduction au regroupement
- KMeans
-
Classification
- Introduction à la classification
- Bayes naïf (Naive Bayes)
- Arbres de décision
- Entraînement avec le package caret
- Évaluation des algorithmes
-
R et les Big Data
- Connexion de R aux bases de données
- Écosystème des Big Data
- Travaux pratiques sur toutes les sections
Pré requis
- Des bases en programmation sont préférables
Prérequis techniques
- Un ordinateur portable récent
- RStudio à jour et environnement R installés
Nos clients témoignent (7)
Les applications dans la vie réelle utilisant Statcan et le CER comme exemples.
Matthew - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Ses connaissances et les codes étaient déjà écrits dans les fichiers, donc je pouvais étudier après les cours et m'entraîner par moi-même.
GLORIA ADANNE - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Beaucoup de codage R est fourni ainsi que d'excellents exemples
Kasia - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
Langage très élaboré et bien développé. Une grande quantité d'informations de support sont également disponibles en ligne.
Michel - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique
J'ai apprécié que le formateur s'assure que nous comprenions tous et suivions les cours. Si nous avions un problème, il s'arrêtait et nous aidait à le résoudre.
Cesar - AMERICAN EXPRESS COMPANY MEXICO
Formation - Data Analytics With R
Traduction automatique
The tool was interesting and I see the use. I would like to learn about more about it.
- Teleperformance
Formation - Data Analytics With R
Traduction automatique
New tool which is “R” and I find it interesting to know the existence of such tool for data analysis.
Michael Lopez - Teleperformance
Formation - Data Analytics With R
Traduction automatique