Objectifs
- Maîtriser les bases de python
- Etre capable d'analyser des données avec python
- Etre capable d'automatiser le traitement de données avec python
- Connaître les outils pour la data science de python
Description
Jour 1 - Python aujourd'hui : bases et bonnes pratiques
- Introduction au langage python
- Pour qui ? Pour quoi faire ? Comment ?
- Les consoles et le débogage en python
- Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
- Les classes, les objets et la création de bibliothèques
- Importation de données
- CSV, Excel
- Fichiers texte
- Bases de données (SQL – principes, exemples)
- Données issues du web (API, scraping léger)
- Manipulation de données avec pandas
- DataFrame : concepts fondamentaux
- Sélection, filtrage, tri
- Création et transformation de variables
- Jointures et concaténations
- Gestion des données manquantes
- Préparation des données pour l'analyse
- Nettoyage et contrôles de qualité
- Typage des variables
- Variables catégorielles
- Travail sur les dates et les données textuelles
- Agrégations (groupby, pivots)
- Automatisation des traitements
- Principes de la data visualisation
- Pourquoi visualiser ?
- Erreurs classiques
- Choisir le bon graphique pour la bonne question
- Visualisation avec matplotlib & seaborn
- Histogrammes, boxplots, scatter plots
- Comparaison de groupes
- Visualisations multivariées
- Personnalisation minimale mais lisible
- Analyse exploratoire (EDA)
- Lire une distribution
- Détecter des anomalies
- Comprendre des relations entre variables
- Interpréter sans sur-interpréter
- Visualisation interactive (ou dashboards légers)
- Introduction aux visualisations interactives
- Atelier : exploration visuelle complète d'un jeu de données
- Comprendre le machine learning (sans jargon inutile)
- Apprentissage supervisé / non supervisé
- Régression vs classification
- Sur-apprentissage, biais, variance
- Importance de la validation
- Préparation des données pour le ML
- Séparation train / test
- Standardisation et encodage
- Pipelines avec scikit-learn
- Cas pratiques de machine learning
- Régression (prévision, scoring)
- Classification simple
- Clustering (k-means, segmentation)
- Industrialisation et bonnes pratiques
Conditions d'accès
- Connaissances de base en traitement de donnees (statistique et tables de donnees)
- Pas de prerequis en python
Rythme
Temps plein
Liste des sessions
17 mars 2026 > 20 mars 2026 • Période d'inscription du 5 janvier 2026 au 16 mars 2026
16 juin 2026 > 19 juin 2026 • Période d'inscription du 5 janvier 2026 au 15 juin 2026
5 octobre 2026 > 8 octobre 2026
Stat4decision
- 0172254082
- info@stat4decision.com
Centre de formation
37 Av Ledru-rollin, 75012 Paris 12e
Lieu de formation
37 Av Ledru-rollin, 75012 Paris 12e