Plan du cours

Introduction

    Le processus Data Science Rôles et responsabilités d'un Data Scientist

Préparation de l'environnement de développement

    Bibliothèques, frameworks, langages et outils Développement local Développement collaboratif basé sur le Web

Collecte de données

    Différents types de données Bases de données locales structurées Connecteurs de base de données Formats courants : xlxs, XML, Json, csv, ...
Clics non structurés, censeurs, smartphones
  • Apis
  • Internet of Things (IoT)
  • Documents, images, vidéos, sons
  • Étude de cas : Collecte continue de grandes quantités de données non structurées
  • Stockage de donnéesBases de données relationnelles Bases de données non relationnelles Hadoop : Système de fichiers distribués (HDFS) Spark : Ensemble de données distribuées résilientes (RDD) Stockage cloud
  • Préparation des données
  • Ingestion, sélection, nettoyage et transformation Assurer la qualité des données - exactitude, signification et sécurité Rapports d'exceptions

      Languages utilisé pour la préparation, le traitement et l'analyse

    Langage R Introduction à R Manipulation des données, calcul et affichage graphique

      Python Introduction à Python

    Manipulation, traitement, nettoyage et traitement des données

      Analyse des données
    Analyse exploratoire Statistiques de base Projets de visualisation Comprendre les données
  • Causalité
  • Caractéristiques et transformations
  • Machine Learning Supervisé ou non

      Quand utiliser quel modèle
    Natural Language Processing (NLP)
  • Data Visualization
  • Meilleures pratiques Sélectionner le bon graphique pour les bonnes données Palettes de couleurs Passer au niveau supérieur Tableaux de bord Visualisations interactives
  • Raconter des histoires avec des données
  • Sommaire et conclusion
  • Pré requis

    • Une compréhension générale des concepts de base de données
    • Une compréhension de base des statistiques
      35 heures
     

    Nombre de participants


    Début

    Fin


    Dates are subject to availability and take place between 09:30 and 16:30.
    Les formations ouvertes requièrent plus de 3 participants.

    Nos Clients témoignent (3)

    Cours Similaires

    QGIS for Geographic Information System

      21 heures

    Catégories Similaires