Plan du cours

Statistiques & programmation probabiliste en Julia

Statistiques de base

  • Statistiques
    • Résumés statistiques avec le package Statistics
  • Distributions & package StatsBase
    • Univariate & multivariate
    • Moments
    • Fonctions de probabilité
    • Échantillonnage et Générateur de nombres aléatoires (RNG)
    • Histogrammes
    • Estimation du maximum de vraisemblance
    • Produit, troncature et distribution censurée
    • Statistiques robustes
    • Corrélation & covariance

DataFrames

(Package DataFrames)

  • Entrée/sortie de données (Data I/O)
  • Création de Data Frames
  • Types de données, y compris catégorielles et manquantes
  • Triage & jointure
  • Réorganisation & pivotage des données

Tests d'hypothèse

(Package HypothesisTests)

  • Principe de base des tests d'hypothèse
  • Test du chi-deux
  • Test z et test t
  • Test F
  • Test exact de Fisher
  • ANOVA
  • Tests de normalité
  • Test de Kolmogorov-Smirnov
  • Test T de Hotelling

Régression & analyse de survie

(Packages GLM & Survival)

  • Principe de base de la régression linéaire et de la famille exponentielle
  • Régression linéaire
  • Modèles linéaires généralisés (GLM)
    • Régression logistique
    • Régression de Poisson
    • Régression gamma
    • Autres modèles GLM
  • Analyse de survie
    • Événements
    • Kaplan-Meier
    • Nelson-Aalen
    • Cox Proportional Hazard

Distances

(Package Distances)

  • Qu'est-ce qu'une distance ?
  • Euclidienne
  • Cityblock (Manhattan)
  • Cosinus
  • Corrélation
  • Mahalanobis
  • Hamming
  • MAD (Déviation absolue moyenne)
  • RMS (Racine carrée de la moyenne des carrés)
  • Déviation quadratique moyenne

Statistiques multivariées

(Packages MultivariateStats, Lasso & Loess)

  • Régression ridge
  • Régression lasso
  • Loess
  • Analyse discriminante linéaire
  • Analyse en composantes principales (PCA)
    • PCA linéaire
    • PCA noyau
    • PCA probabiliste
    • Analyse indépendante de composantes (ICA)
  • Régression par les composantes principales (PCR)
  • Analyse factorielle
  • Analyse de corrélation canonique
  • Mise à l'échelle multidimensionnelle

Clustering

(Package Clustering)

  • K-means
  • K-medoids
  • DBSCAN
  • Clustering hiérarchique
  • Algorithme de clustering de Markov
  • Clustering flou C-means

Statistiques bayésiennes & programmation probabiliste

(Package Turing)

  • Modèle de chaîne de Markov Monte Carlo (MCMC)
  • Hamiltonian Monte Carlo
  • Modèles de mélange gaussien
  • Régression linéaire bayésienne
  • Régression exponentielle bayésienne
  • Réseaux de neurones bayésiens
  • Modèles de Markov cachés
  • Filtrage particulaire
  • Inférence variationnelle

Pré requis

Ce cours est destiné aux personnes ayant déjà une formation en science des données et statistiques.

 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires