Prenez contact avec nous

Plan du cours

I. Introduction et préliminaires

1. Aperçu

  • Rendre R plus convivial ; R et les interfaces graphiques (GUI) disponibles
  • RStudio
  • Logiciels et documentation associés
  • R et les statistiques
  • Utilisation interactive de R
  • Séance d'introduction
  • Obtenir de l'aide concernant les fonctions et les fonctionnalités
  • Commandes R, sensibilité à la casse, etc.
  • Mémorisation et correction des commandes précédentes
  • Exécution de commandes à partir d'un fichier ou redirection de la sortie vers un fichier
  • Persistance des données et suppression des objets
  • Bonnes pratiques de programmation : scripts autonomes, lisibilité accrue (scripts structurés, documentation, markdown)
  • Installation de packages ; CRAN et Bioconductor

2. Lecture des données

  • Fichiers TXT (read.delim)
  • Fichiers CSV

3. Manipulations simples ; nombres et vecteurs + tableaux

  • Vecteurs et assignation
  • Arithmétique sur les vecteurs
  • Génération de séquences régulières
  • Vecteurs logiques
  • Valeurs manquantes
  • Vecteurs de caractères
  • Vecteurs d'index ; sélection et modification de sous-ensembles d'un jeu de données
    • Tableaux
  • Indexation de tableaux. Sous-sections d'un tableau
  • Matrices d'index
  • La fonction array() + opérations simples sur les tableaux (ex. multiplication, transposition)
  • Autres types d'objets

4. Listes et data frames

  • Listes
  • Construction et modification de listes
    • Concaténation de listes
  • Data frames
    • Création de data frames
    • Travail avec des data frames
    • Attachement de listes arbitraires
    • Gestion du chemin de recherche (search path)

5. Manipulation des données

  • Sélection, sous-ensemble d'observations et de variables
  • Filtrage, regroupement
  • Recodage, transformations
  • Agrégation, combinaison de jeux de données
  • Formation de matrices partitionnées, cbind() et rbind()
  • La fonction de concaténation, c(), avec les tableaux
  • Manipulation de chaînes de caractères, package stringr
  • Introduction à grep et regexpr

6. Approfondissement sur la lecture des données

  • Fichiers XLS, XLSX
  • Packages readr et readxl
  • Données SPSS, SAS, Stata et autres formats
  • Exportation de données vers txt, csv et d'autres formats

6. Regroupement, boucles et exécution conditionnelle

  • Expressions groupées
  • Instructions de contrôle
  • Exécution conditionnelle : instructions if
  • Exécution répétitive : boucles for, repeat et while
  • Introduction à apply, lapply, sapply, tapply

7. Fonctions

  • Création de fonctions
  • Arguments optionnels et valeurs par défaut
  • Nombre variable d'arguments
  • Portée (scope) et ses conséquences

8. Graphiques simples sous R

  • Création d'un graphique
  • Graphiques de densité
  • Graphiques en points
  • Diagrammes en barres
  • Graphiques linéaires
  • Diagrammes circulaires
  • Courbes en boîte (boxplots)
  • Graphiques de dispersion
  • Combinaison de graphiques

II. Analyse statistique sous R

1. Distributions de probabilité

  • R comme ensemble de tables statistiques
  • Examen de la distribution d'un ensemble de données

2. Tests d'hypothèses

  • Tests sur la moyenne de la population
  • Test du rapport de vraisemblance
  • Tests à un et deux échantillons
  • Test du Khi-deux d'adéquation
  • Statistique de Kolmogorov-Smirnov à un échantillon
  • Test des rangs signés de Wilcoxon
  • Test à deux échantillons
  • Test des rangs de Wilcoxon
  • Test de Mann-Whitney
  • Test de Kolmogorov-Smirnov

3. Tests multiples d'hypothèses

  • Erreur de type I et FDR
  • Courbes ROC et AUC
  • Procédures de tests multiples (BH, Bonferroni, etc.)

4. Modèles de régression linéaire

  • Fonctions génériques pour l'extraction d'informations sur le modèle
  • Mise à jour des modèles ajustés
  • Modèles linéaires généralisés
    • Familles
    • La fonction glm()
  • Classification
    • Régression logistique
    • Analyse discriminante linéaire
  • Apprentissage non supervisé
    • Analyse en composantes principales (ACP)
    • Méthodes de regroupement (k-means, clustering hiérarchique, k-medoids)

5. Analyse de survie (package survival)

  • Objets de survie sous R
  • Estimateur de Kaplan-Meier, test du log-rank, régression paramétrique
  • Bandes de confiance
  • Analyse de données censurées (censure par intervalles)
  • Modèles de Cox PH, covariables constantes
  • Modèles de Cox PH, covariables dépendantes du temps
  • Simulation : comparaison de modèles (comparaison de modèles de régression)

6. Analyse de la variance

  • Analyse de variance à un facteur (One-Way ANOVA)
  • Analyse de la variance à deux facteurs (Two-Way Classification of ANOVA)
  • Analyse de la variance multivariée (MANOVA)

III. Problèmes traités en bioinformatique

  • Introduction courte au package limma
  • Flux de travail d'analyse des données de microréseaux (microarrays)
  • Téléchargement de données depuis GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Traitement des données (QC, normalisation, expression différentielle)
  • Graphique en nuage de points (Volcano plot)
  • Exemples de clustering + heatmaps
 28 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (2)

Cours à venir

Catégories Similaires