Python pour la data science

  • Paris 12e

Objectifs


  • Maîtriser les bases de python

  • Etre capable d'analyser des données avec python

  • Etre capable d'automatiser le traitement de données avec python

  • Connaître les outils pour la data science de python

Description

Jour 1 - Python aujourd'hui : bases et bonnes pratiques


  • Introduction au langage python

    • Pour qui ? Pour quoi faire ? Comment ?

    • Les consoles et le débogage en python

    • Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)

    • Les classes, les objets et la création de bibliothèques


Jour 2 – Manipulation et préparation des données avec pandas


  • Importation de données

    • CSV, Excel

    • Fichiers texte

    • Bases de données (SQL – principes, exemples)

    • Données issues du web (API, scraping léger)



  • Manipulation de données avec pandas

    • DataFrame : concepts fondamentaux

    • Sélection, filtrage, tri

    • Création et transformation de variables

    • Jointures et concaténations

    • Gestion des données manquantes



  • Préparation des données pour l'analyse

    • Nettoyage et contrôles de qualité

    • Typage des variables

    • Variables catégorielles

    • Travail sur les dates et les données textuelles

    • Agrégations (groupby, pivots)



  • Automatisation des traitements
Jour 3 – Visualisation et analyse exploratoire


  • Principes de la data visualisation

    • Pourquoi visualiser ?

    • Erreurs classiques

    • Choisir le bon graphique pour la bonne question



  • Visualisation avec matplotlib & seaborn

    • Histogrammes, boxplots, scatter plots

    • Comparaison de groupes

    • Visualisations multivariées

    • Personnalisation minimale mais lisible



  • Analyse exploratoire (EDA)

    • Lire une distribution

    • Détecter des anomalies

    • Comprendre des relations entre variables

    • Interpréter sans sur-interpréter



  • Visualisation interactive (ou dashboards légers)

    • Introduction aux visualisations interactives

    • Atelier : exploration visuelle complète d'un jeu de données


Jour 4 – Introduction au machine learning et mise en production 


  • Comprendre le machine learning (sans jargon inutile)

    • Apprentissage supervisé / non supervisé

    • Régression vs classification

    • Sur-apprentissage, biais, variance

    • Importance de la validation



  • Préparation des données pour le ML

    • Séparation train / test

    • Standardisation et encodage

    • Pipelines avec scikit-learn



  • Cas pratiques de machine learning

    • Régression (prévision, scoring)

    • Classification simple

    • Clustering (k-means, segmentation)



  • Industrialisation et bonnes pratiques

Conditions d'accès

- Connaissances de base en traitement de donnees (statistique et tables de donnees)
- Pas de prerequis en python

Rythme

Temps plein

Liste des sessions

17 mars 2026 > 20 mars 2026 • Période d'inscription du 5 janvier 2026 au 16 mars 2026
16 juin 2026 > 19 juin 2026 • Période d'inscription du 5 janvier 2026 au 15 juin 2026
5 octobre 2026 > 8 octobre 2026

Stat4decision

  • 0172254082
  • info@stat4decision.com

Centre de formation

37 Av Ledru-rollin, 75012 Paris 12e

Lieu de formation

37 Av Ledru-rollin, 75012 Paris 12e