Prenez contact avec nous

Plan du cours

Introduction

Cette section propose une introduction générale sur le moment opportun pour utiliser l'« apprentissage automatique », les éléments à considérer et ce que cela implique, en incluant les avantages et les inconvénients. Types de données (structurées/non structurées/statiques/en streaming), validité/volume des données, analyse pilotée par les données vs pilotée par l'utilisateur, modèles statistiques vs modèles d'apprentissage automatique / défis de l'apprentissage non supervisé, compromis biais-variance, itération/évaluation, approches de validation croisée, apprentissage supervisé/non supervisé/par renforcement.

SUJETS PRINCIPAUX

1. Comprendre Naïve Bayes

  • Concepts de base des méthodes bayésiennes
  • Probabilité
  • Probabilité conjointe
  • Probabilité conditionnelle avec le théorème de Bayes
  • L'algorithme Naïve Bayes
  • La classification Naïve Bayes
  • L'estimateur de Laplace
  • Utilisation de caractéristiques numériques avec Naïve Bayes

2. Comprendre les arbres de décision

  • Diviser pour régner
  • L'algorithme d'arbre de décision C5.0
  • Choisir la meilleure séparation
  • Élaguer l'arbre de décision

3. Comprendre les réseaux de neurones

  • Des neurones biologiques aux neurones artificiels
  • Fonctions d'activation
  • Topologie du réseau
  • Le nombre de couches
  • La direction du flux d'information
  • Le nombre de nœuds dans chaque couche
  • Entraînement des réseaux de neurones par rétropropagation
  • Deep Learning

4. Comprendre les machines à vecteurs de soutien

  • Classification avec des hyperplans
  • Trouver la marge maximale
  • Le cas des données linéairement séparables
  • Le cas des données non linéairement séparables
  • Utilisation de noyaux pour les espaces non linéaires

5. Comprendre le clustering

  • Le clustering en tant que tâche d'apprentissage automatique
  • L'algorithme k-means pour le clustering
  • Utilisation de la distance pour assigner et mettre à jour les clusters
  • Choisir le nombre approprié de clusters

6. Mesurer la performance pour la classification

  • Travailler avec les données de prédiction de classification
  • Examen approfondi des matrices de confusion
  • Utilisation des matrices de confusion pour mesurer la performance
  • Au-delà de la précision – autres mesures de performance
  • Le statistique Kappa
  • Sensibilité et spécificité
  • Précision et rappel
  • La mesure F
  • Visualisation des compromis de performance
  • Courbes ROC
  • Estimation de la performance future
  • La méthode de l'échantillon hors jeu
  • Validation croisée
  • Échantillonnage de bootstrap

7. Ajuster les modèles standards pour de meilleures performances

  • Utilisation de caret pour le réglage automatisé des paramètres
  • Création d'un modèle simple réglé
  • Personnalisation du processus de réglage
  • Amélioration des performances du modèle grâce au méta-apprentissage
  • Compréhension des ensembles
  • Bagging
  • Boosting
  • Forêts aléatoires
  • Entraînement des forêts aléatoires
  • Évaluation des performances des forêts aléatoires

SUJETS SECONDAIRES

8. Comprendre la classification par les plus proches voisins

  • L'algorithme kNN
  • Calcul de la distance
  • Choix d'un k approprié
  • Préparation des données pour utilisation avec kNN
  • Pourquoi l'algorithme kNN est-il paresseux ?

9. Comprendre les règles de classification

  • Séparer pour régner
  • L'algorithme One Rule
  • L'algorithme RIPPER
  • Règles extraites des arbres de décision

10. Comprendre la régression

  • Régression linéaire simple
  • Estimation par moindres carrés ordinaires
  • Corrélations
  • Régression linéaire multiple

11. Comprendre les arbres de régression et les arbres de modèles

  • Ajout de la régression aux arbres

12. Comprendre les règles d'association

  • L'algorithme Apriori pour l'apprentissage de règles d'association
  • Mesure de l'intérêt des règles – support et confiance
  • Construction d'un ensemble de règles selon le principe d'Apriori

Suppléments

  • Spark/PySpark/MLlib et les bandits multi-bras

Pré requis

Connaissances en Python

 21 Heures

Nombre de participants


Prix par participant

Nos clients témoignent (7)

Cours à venir

Catégories Similaires