Plan du cours
Fondamentaux de Python pour les tâches de données
- Installation de Python et configuration de l'environnement de développement
- Fundamentals du langage : variables, types de données, structures de contrôle
- Rédaction et exécution de scripts Python simples
Gestion des fichiers : CSV et Excel
- Lecture et écriture de fichiers CSV à l'aide du module csv et Pandas
- Manipulation de fichiers Excel à l'aide de openpyxl/xlrd et Pandas
- Exercices pratiques : automatisation de conversions de fichiers
Introduction à Pandas
- Bases des DataFrames : création, indexation, sélection et filtrage
- Opérations d'agrégation et de groupement
- Opérations courantes de nettoyage : valeurs manquantes, doublons et conversions de type
Introduction à Polars
- Concepts de Polars et caractéristiques de performance comparées à Pandas
- Opérations de base sur les DataFrames avec Polars
- Exemple d'utilisation : quand choisir Polars plutôt que Pandas
Transformation avancée des données (intermédiaire)
- Joins complexes, fonctions de fenêtre et opérations pivot avec Pandas
- Modes de traitement efficaces des données avec Polars
- Enchaînement d'opérations et optimisation de l'utilisation de la mémoire
Automatisation des processus avec Python
- Rédaction de scripts pour automatiser les tâches de données répétitives et les étapes ETL
- Planification de scripts avec des planificateurs de système d'exploitation ou des planificateurs de tâches
- Journalisation, gestion des erreurs et notifications
Emballage de scripts et bonnes pratiques
- Création d'exécutables avec PyInstaller ou des outils similaires
- Structure de projet, environnements virtuels et gestion des dépendances
- Bases du contrôle de version et documentation des flux de travail
Mini-projet pratique
- Tâche de bout en bout : lecture de fichiers bruts, nettoyage et transformation des données, production de sorties
- Automatisation du workflow et empaquetage en script ou exécutable exécutable
- Examen et améliorations basés sur les commentaires des pairs
Résumé et étapes suivantes
Pré requis
- Familiarité de base avec les concepts de programmation ou volonté d'apprendre
- Confort dans l'utilisation de la ligne de commande ou du terminal pour l'installation de packages
- Expérience de travail avec des tableurs (CSV/Excel)
Public cible
- Analystes de données et personnel opérationnel automatisant des tâches de données
- Ingénieurs analytiques recherchant un scripting ETL léger
- Professionnels intéressés par des workflows de données pratiques basés sur Python
Nos clients témoignent (5)
Le fait d'avoir plus d'exercices pratiques utilisant des données plus proches de ce que nous utilisons dans nos projets (images satellites en format raster)
Matthieu - CS Group
Formation - Scaling Data Analysis with Python and Dask
Traduction automatique
J'ai trouvé que le formateur était très compétent et a répondu aux questions avec assurance pour clarifier la compréhension.
Jenna - TCMT
Formation - Machine Learning with Python – 2 Days
Traduction automatique
Une très bonne préparation et expertise de la part du formateur, une communication parfaite en anglais. Le cours était pratique (exercices + partage d'exemples de cas d'utilisation)
Monika - Procter & Gamble Polska Sp. z o.o.
Formation - Developing APIs with Python and FastAPI
Traduction automatique
La explanation
Wei Yang Teo - Ministry of Defence, Singapore
Formation - Machine Learning with Python – 4 Days
Traduction automatique
Formateur développe la formation selon le rythme des participants
Farris Chua
Formation - Data Analysis in Python using Pandas and Numpy
Traduction automatique