Plan du cours

I. Introduction et préliminaires

1. Vue d'ensemble

  • Rendre R plus convivial, R et les interfaces graphiques disponibles
  • Rstudio
  • Logiciels connexes et documentation
  • R et les statistiques
  • Utiliser R de manière interactive
  • Une session d'introduction
  • Obtenir de l'aide sur les fonctions et les caractéristiques
  • Commandes R, sensibilité à la casse, etc.
  • Rappel et correction des commandes précédentes
  • Exécution de commandes à partir d'un fichier ou détournement de la sortie vers un fichier
  • Permanence des données et suppression d'objets
  • Go Pratique de la programmation : scripts autonomes, bonne lisibilité, par exemple scripts structurés, documentation, markdown
  • installation de paquets ; CRAN et Bioconductor

2. Lecture des données

  • Fichiers Txt (read.delim)
  • Fichiers CSV

3. Manipulations simples ; nombres et vecteurs + tableaux

  • Vecteurs et affectation
  • Arithmétique vectorielle
  • Génération de séquences régulières
  • Vecteurs logiques
  • Valeurs manquantes
  • Vecteurs de caractères
  • Vecteurs d'index ; sélection et modification de sous-ensembles d'un ensemble de données
    • Tableaux
  • Indexation des tableaux. Sous-sections d'un tableau
  • Matrices d'indexation
  • La fonction array() + les opérations simples sur les tableaux, par exemple la multiplication, la transposition.
  • Autres types d'objets

4. Listes et cadres de données

  • Les listes
  • Construction et modification de listes
    • Concaténation de listes
  • Cadres de données
    • Création de cadres de données
    • Travailler avec des cadres de données
    • Attacher des listes arbitraires
    • Gestion du chemin de recherche

5. Manipulation des données

  • Sélection, sous-ensemble d'observations et de variables
  • Filtrage, regroupement
  • Recodage, transformations
  • Agrégation, combinaison d'ensembles de données
  • Formation de matrices partitionnées, cbind() et rbind()
  • La fonction de concaténation, (), avec les tableaux
  • Manipulation de caractères, paquetage stringr
  • brève introduction à grep et regexpr

6. En savoir plus sur la lecture de données

  • Fichiers XLS, XLSX
  • paquets readr et readxl
  • Données SPSS, SAS, Stata,... et autres formats
  • Exporter des données vers txt, csv et d'autres formats

6. Groupement, boucles et exécution conditionnelle

  • Expressions groupées
  • Instructions de contrôle
  • Exécution conditionnelle : instructions if
  • Exécution répétitive : boucles for, repeat et while
  • Introduction à apply, lapply, sapply, tapply

7. Les fonctions

  • Création de fonctions
  • Arguments facultatifs et valeurs par défaut
  • Nombre variable d'arguments
  • Portée et ses conséquences

8. Graphiques simples en R

  • Création d'un graphique
  • Graphiques de densité
  • Graphiques en points
  • Graphiques à barres
  • Graphiques linéaires
  • Graphiques circulaires
  • Diagrammes en boîte
  • Diagrammes de dispersion
  • Combinaison de graphiques

II. Analyse statistique dans R

1. Distributions de probabilités

  • R en tant qu'ensemble de tableaux statistiques
  • Examen de la distribution d'un ensemble de données

2. Tests d'hypothèses

  • Tests concernant la moyenne d'une population
  • Test du rapport de vraisemblance
  • Tests à un et deux échantillons
  • Test d'ajustement du chi-carré Goodness-of-fit
  • Statistique de Kolmogorov-Smirnov à un échantillon
  • Test de Wilcoxon Signé-Rank
  • Test à deux échantillons
  • Test de la somme des rangs de Wilcoxon
  • Test de Mann-Whitney
  • Test de Kolmogorov-Smirnov

3. Tests multiples d'hypothèses

  • Erreur de type I et FDR
  • Courbes ROC et AUC
  • Procédures de tests multiples (BH, Bonferroni, etc.)

4. Modèles de régression linéaire

  • Fonctions génériques pour l'extraction d'informations sur les modèles
  • Mise à jour des modèles ajustés
  • Modèles linéaires généralisés
    • Familles
    • La fonction glm()
  • Classification
    • Régression logistique
    • Analyse discriminante linéaire
  • Apprentissage non supervisé
    • Analyse des composantes principales
    • Méthodes de clustering (k-means, clustering hiérarchique, k-medoids)

5. Analyse de survie (survival package)

  • Objets de survie dans r
  • Estimation de Kaplan-Meier, test de log-rank, régression paramétrique
  • Bandes de confiance
  • Analyse de données censurées (intervalle censuré)
  • Modèles PH de Cox, covariables constantes
  • Modèles PH de Cox, covariables dépendantes du temps
  • Simulation : Comparaison de modèles (comparaison de modèles de régression)

6. Analyse de la variance

  • ANOVA à une voie
  • Classification de l'ANOVA à deux voies
  • MANOVA

III. Problèmes pratiques en bioinformatique

  • Brève introduction au paquet limma
  • Flux de travail pour l'analyse des données de microréseaux
  • Téléchargement des données à partir de GEO : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE1397
  • Traitement des données (QC, normalisation, expression différentielle)
  • Tracé de volcan
  • Exemples de clustering + heatmaps
 28 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires