Merci d'avoir envoyé votre demande ! Un membre de notre équipe vous contactera sous peu.
Merci d'avoir envoyé votre réservation ! Un membre de notre équipe vous contactera sous peu.
Plan du cours
I. Introduction et préliminaires
1. Aperçu
- Rendre R plus convivial ; R et les interfaces graphiques (GUI) disponibles
- RStudio
- Logiciels et documentation associés
- R et les statistiques
- Utilisation interactive de R
- Séance d'introduction
- Obtenir de l'aide concernant les fonctions et les fonctionnalités
- Commandes R, sensibilité à la casse, etc.
- Mémorisation et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou redirection de la sortie vers un fichier
- Persistance des données et suppression des objets
- Bonnes pratiques de programmation : scripts autonomes, lisibilité accrue (scripts structurés, documentation, markdown)
- Installation de packages ; CRAN et Bioconductor
2. Lecture des données
- Fichiers TXT (read.delim)
- Fichiers CSV
3. Manipulations simples ; nombres et vecteurs + tableaux
- Vecteurs et assignation
- Arithmétique sur les vecteurs
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un jeu de données
- Tableaux
- Indexation de tableaux. Sous-sections d'un tableau
- Matrices d'index
- La fonction array() + opérations simples sur les tableaux (ex. multiplication, transposition)
- Autres types d'objets
4. Listes et data frames
- Listes
- Construction et modification de listes
- Concaténation de listes
- Data frames
- Création de data frames
- Travail avec des data frames
- Attachement de listes arbitraires
- Gestion du chemin de recherche (search path)
5. Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison de jeux de données
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, c(), avec les tableaux
- Manipulation de chaînes de caractères, package stringr
- Introduction à grep et regexpr
6. Approfondissement sur la lecture des données
- Fichiers XLS, XLSX
- Packages readr et readxl
- Données SPSS, SAS, Stata et autres formats
- Exportation de données vers txt, csv et d'autres formats
6. Regroupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
- Introduction à apply, lapply, sapply, tapply
7. Fonctions
- Création de fonctions
- Arguments optionnels et valeurs par défaut
- Nombre variable d'arguments
- Portée (scope) et ses conséquences
8. Graphiques simples sous R
- Création d'un graphique
- Graphiques de densité
- Graphiques en points
- Diagrammes en barres
- Graphiques linéaires
- Diagrammes circulaires
- Courbes en boîte (boxplots)
- Graphiques de dispersion
- Combinaison de graphiques
II. Analyse statistique sous R
1. Distributions de probabilité
- R comme ensemble de tables statistiques
- Examen de la distribution d'un ensemble de données
2. Tests d'hypothèses
- Tests sur la moyenne de la population
- Test du rapport de vraisemblance
- Tests à un et deux échantillons
- Test du Khi-deux d'adéquation
- Statistique de Kolmogorov-Smirnov à un échantillon
- Test des rangs signés de Wilcoxon
- Test à deux échantillons
- Test des rangs de Wilcoxon
- Test de Mann-Whitney
- Test de Kolmogorov-Smirnov
3. Tests multiples d'hypothèses
- Erreur de type I et FDR
- Courbes ROC et AUC
- Procédures de tests multiples (BH, Bonferroni, etc.)
4. Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur le modèle
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés
- Familles
- La fonction glm()
- Classification
- Régression logistique
- Analyse discriminante linéaire
- Apprentissage non supervisé
- Analyse en composantes principales (ACP)
- Méthodes de regroupement (k-means, clustering hiérarchique, k-medoids)
5. Analyse de survie (package survival)
- Objets de survie sous R
- Estimateur de Kaplan-Meier, test du log-rank, régression paramétrique
- Bandes de confiance
- Analyse de données censurées (censure par intervalles)
- Modèles de Cox PH, covariables constantes
- Modèles de Cox PH, covariables dépendantes du temps
- Simulation : comparaison de modèles (comparaison de modèles de régression)
6. Analyse de la variance
- Analyse de variance à un facteur (One-Way ANOVA)
- Analyse de la variance à deux facteurs (Two-Way Classification of ANOVA)
- Analyse de la variance multivariée (MANOVA)
III. Problèmes traités en bioinformatique
- Introduction courte au package limma
- Flux de travail d'analyse des données de microréseaux (microarrays)
- Téléchargement de données depuis GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Traitement des données (QC, normalisation, expression différentielle)
- Graphique en nuage de points (Volcano plot)
- Exemples de clustering + heatmaps
28 Heures
Nos clients témoignent (2)
connaissances du formateur, adaptées sur mesure, tous les sujets abordés
eleni - EUAA
Formation - Forecasting with R
Traduction automatique
Les applications dans la vie réelle utilisant Statcan et le CER comme exemples.
Matthew - Natural Resources Canada
Formation - Data Analytics With R
Traduction automatique