Plan du cours
I. Introduction et préliminaires
1. Vue d'ensemble
- Rendre R plus convivial, R et les interfaces graphiques disponibles
- Rstudio
- Logiciels connexes et documentation
- R et les statistiques
- Utiliser R de manière interactive
- Une session d'introduction
- Obtenir de l'aide sur les fonctions et les caractéristiques
- Commandes R, sensibilité à la casse, etc.
- Rappel et correction des commandes précédentes
- Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
- Permanence des données et suppression d'objets
- Go Pratique de la programmation : scripts autonomes, bonne lisibilité, par exemple scripts structurés, documentation, markdown
- installation de paquets ; CRAN et Bioconductor
2. Lecture des données
- Fichiers Txt (read.delim)
- Fichiers CSV
3. Manipulations simples ; nombres et vecteurs + tableaux
- Vecteurs et affectation
- Arithmétique vectorielle
- Génération de séquences régulières
- Vecteurs logiques
- Valeurs manquantes
- Vecteurs de caractères
- Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
- Tableaux
- Indexation des tableaux. Sous-sections d'un tableau
- Matrices d'indexation
- La fonction array() + les opérations simples sur les tableaux, par exemple la multiplication, la transposition.
- Autres types d'objets
4. Listes et cadres de données
- Les listes
- Construction et modification de listes
- Concaténation de listes
- Cadres de données
- Création de cadres de données
- Travailler avec des cadres de données
- Attacher des listes arbitraires
- Gestion du chemin de recherche
5. Manipulation des données
- Sélection, sous-ensemble d'observations et de variables
- Filtrage, regroupement
- Recodage, transformations
- Agrégation, combinaison d'ensembles de données
- Formation de matrices partitionnées, cbind() et rbind()
- La fonction de concaténation, (), avec les tableaux
- Manipulation de caractères, paquetage stringr
- brève introduction à grep et regexpr
6. En savoir plus sur la lecture de données
- Fichiers XLS, XLSX
- paquets readr et readxl
- Données SPSS, SAS, Stata,... et autres formats
- Exporter des données vers txt, csv et d'autres formats
6. Groupement, boucles et exécution conditionnelle
- Expressions groupées
- Instructions de contrôle
- Exécution conditionnelle : instructions if
- Exécution répétitive : boucles for, repeat et while
- Introduction à apply, lapply, sapply, tapply
7. Les fonctions
- Création de fonctions
- Arguments facultatifs et valeurs par défaut
- Nombre variable d'arguments
- Portée et ses conséquences
8. Graphiques simples en R
- Création d'un graphique
- Graphiques de densité
- Graphiques en points
- Graphiques à barres
- Graphiques linéaires
- Graphiques circulaires
- Diagrammes en boîte
- Diagrammes de dispersion
- Combinaison de graphiques
II. Analyse statistique dans R
1. Distributions de probabilités
- R en tant qu'ensemble de tableaux statistiques
- Examen de la distribution d'un ensemble de données
2. Tests d'hypothèses
- Tests concernant la moyenne d'une population
- Test du rapport de vraisemblance
- Tests à un et deux échantillons
- Test d'ajustement du chi-carré Goodness-of-fit
- Statistique de Kolmogorov-Smirnov à un échantillon
- Test de Wilcoxon Signé-Rank
- Test à deux échantillons
- Test de la somme des rangs de Wilcoxon
- Test de Mann-Whitney
- Test de Kolmogorov-Smirnov
3. Tests multiples d'hypothèses
- Erreur de type I et FDR
- Courbes ROC et AUC
- Procédures de tests multiples (BH, Bonferroni, etc.)
4. Modèles de régression linéaire
- Fonctions génériques pour l'extraction d'informations sur les modèles
- Mise à jour des modèles ajustés
- Modèles linéaires généralisés
- Familles
- La fonction glm()
- Classification
- Régression logistique
- Analyse discriminante linéaire
- Apprentissage non supervisé
- Analyse des composantes principales
- Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)
5. Analyse de survie (survival package)
- Objets de survie dans r
- Estimation de Kaplan-Meier, test de log-rank, régression paramétrique
- Bandes de confiance
- Analyse de données censurées (intervalle censuré)
- Modèles PH de Cox, covariables constantes
- Modèles PH de Cox, covariables dépendantes du temps
- Simulation : Comparaison de modèles (comparaison de modèles de régression)
6. Analyse de la variance
- ANOVA à une voie
- Classification de l'ANOVA à deux voies
- MANOVA
III. Problèmes pratiques en bioinformatique
- Brève introduction au paquet limma
- Flux de travail pour l'analyse des données de microréseaux
- Téléchargement des données à partir de GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
- Traitement des données (QC, normalisation, expression différentielle)
- Tracé de volcan
- Exemples de clustering + heatmaps
Nos clients témoignent (5)
Le premier et le deuxième jour ont été très simples pour moi et j'ai vraiment apprécié cette expérience.
Mareca Sithole - Africa Health Research Institute
Formation - R Fundamentals
Traduction automatique
J'ai vraiment apprécié les exercices pratiques.
Yunfa Zhu - Environmental and Climate Change Canada
Formation - Foundation R
Traduction automatique
Le rythme était juste et l'atmosphère détendue a permis aux candidats de poser des questions avec sérénité.
Rhian Hughes - Public Health Wales NHS Trust
Formation - Introduction to Data Visualization with Tidyverse and R
Traduction automatique
la question a été bien présentée et de manière ordonnée.
Marylin Houle - Ivanhoe Cambridge
Formation - Introduction to R with Time Series Analysis
Traduction automatique
Michael the trainer is very knowledgeable and skillful about the subject of Big Data and R. He is very flexible and quickly customize the training meeting clients' need. He is also very capable to solve technical and subject matter problems on the go. Fantastic and professional training!.
Xiaoyuan Geng - Ottawa Research and Development Center, Science Technology Branch, Agriculture and Agri-Food Canada
Formation - Programming with Big Data in R
Traduction automatique