Plan du cours
Semaine 1 Big Data concepts
- Définition de VVVV (Vélocité, Volume, Variété, Véracité)
- Limites de la capacité traditionnelle de traitement des données
- Traitement distribué
- Analyse statistique
- Machine Learning Types d'analyse
- Data Visualization
- Traitement distribué (par ex. map-reduce)
- Introduction aux langages utilisés
- Cours accéléré sur le langage R
- Python cours accéléré
Semaines 2&3 Exécution Data Analysis
- Analyse statistique
- Descriptive Statistics dans Big Data ensembles (par exemple, calcul de la moyenne)
- Inférentielle Statistics (estimation)
- Forecasting avec des modèles de corrélation et de régression
- Analyse des séries temporelles
- Notions de base Machine Learning
- Apprentissage supervisé ou non supervisé
- Classification et regroupement
- Estimation du coût des méthodes spécifiques
- Filtre
Semaine 4 Traitement du langage naturel
- Traitement du texte
- Comprendre le sens du texte
- Génération automatique de texte
- Analyse du sentiment/sujet
- Computer Vision
Semaine 5&6 Concept d'outil
- Solution de stockage de données (SQL, NoSQL, hiérarchique, orienté objet, orienté document)
- (par exemple, HDFS MySQL, Cassandra, MongoDB, Elasticsearch, etc...)
- Choisir la bonne solution au problème
- Traitement distribué
- Spark
- Machine Learning avec Spark (MLLib)
- Spark SQL
- Scalabilité
- Cloud public (AWS, Google, etc...)
- Cloud privé (OpenStack, cloud foundry)
- Autoscalabilité
Semaine 7 Soft Skills
- Conseil et Leadership compétences
- Avoir un impact : raconter des histoires basées sur des données
- Comprendre son public
- Présentation efficace des données - faire passer votre message
- Efficacité de l'influence et conduite du changement
- Gérer les situations difficiles
Examen de fin d'études
- Examen de fin de programme
Pré requis
Les participants doivent avoir de bonnes bases en mathématiques, au moins au niveau du lycée.
Il n'est pas nécessaire d'avoir des compétences en programmation, mais toute compétence en la matière sera utile.
Les participants seront évalués et interrogés avant de participer à ce programme de formation.
Nos clients témoignent (5)
Comprendre mieux les grandes données
Shaune Dennis - Vodacom
Formation - Big Data Business Intelligence for Telecom and Communication Service Providers
Traduction automatique
Le formateur était accommodant. Et il m'a vraiment encouragé à suivre la formation.
Grace Goh - DBS Bank Ltd
Formation - Python in Data Science
Traduction automatique
Apprentissage automatique, python, manipulation de données
Siphelo Mapolisa - University Of South Africa
Formation - Data Science: Analysis and Presentation
Traduction automatique
Présentation du sujet connaissances horaire
Aly Saleh - FAB banak Egypt
Formation - Introduction to Data Science and AI (using Python)
Traduction automatique
C'est formidable que le cours soit personnalisé aux domaines clés que j'ai soulignés dans le questionnaire préparatoire. Cela aide vraiment à répondre à mes questions sur le sujet et à me conformer à mes objectifs d'apprentissage.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
Traduction automatique