Librairies Python de Data Science

  • Paris 17e

Objectifs


  • Savoir choisir les librairies Python adéquates dans des projets de données

  • Maîtriser NumPy, Pandas, Matplotlib, Seaborn et Plotly

  • Être autonome dans l'analyse, le nettoyage et la visualisation de données

Description

Programme détaillé

Jour 1 — L'écosystème Python scientifique & NumPy


  • Tour d'horizon des packages Python de Data Science

  • Installation de bibliothèques scientifiques : pip, venv, miniconda, mamba, miniforge, WinPython

  • Environnement de développement : IPython, Jupyter Notebook, JupyterLab, Spyder, VS Code

  • Présentation de la librairie NumPy

  • Avantages des tableaux (performance, représentation des données)

  • Création de tableaux avec array(), zeros(), ones(), full(), arange(), linspace(), logspace()

  • Multiplication matricielle avec np.dot et l'opérateur @

  • Matrice identité avec identity() et eye(), matrice diagonale avec diag()

  • Initialisation avec des données aléatoires (module random de NumPy)

  • Types de données et attributs ndim, shape, size, dtype, itemsize, nbytes

  • Indexation, slicing, indexation avancée et broadcasting

  • Transposer et changer les dimensions de tableaux (transpose(), reshape(), newaxis())

  • Concaténer et découper des tableaux (concatenate(), vstack(), hstack(), split())

  • Fonctions sum(), min(), max(), median(), percentile(), cumsum(), var(), argmin(), argmax()

  • Masques booléens pour extraire des informations

  • Charger et sauvegarder les tableaux : loadtxt(), save(), load()

Jour 2 — Manipulation de données avec Pandas


  • Présentation de la librairie Pandas

  • Créer une Series et un DataFrame

  • Extraire les indices de ligne et de colonnes (attributs index et columns)

  • Lire et exporter des données (CSV, Excel…)

  •  

  •  

Jour 3 — Visualisation avec Matplotlib & Seaborn


  • Présentation de Matplotlib : style MATLAB vs style orienté objet

  • Les objets Figure et Axes

  • Tracer des courbes : plot() — couleur, style, largeur, titre, légende

  • Nuages de points : scatter()

  • Barres d'erreurs : errorbar()

  • Remplissage entre courbes : fill_between()

  • Histogrammes : hist()

  • Graphiques multiples avec subplots() et graphiques 3D avec mplot3d

  •  

  • Cartes thermiques : heatmap()

  • Modèles de régression linéaire : lmplot()

  • Personnalisation : set_theme(), set_style(), set_context(), despine()

Jour 4 — Visualisation interactive avec Plotly


  • Présentation de la librairie Plotly et de Kaleido : introduction et exploration de Plotly Express

  • Tracer des courbes avec line() : modification de la figure avec les options title, width, height, marker, labels

  • Ajout d'informations : hover_data, hover_name, text

  • Graphiques multiples : facet_row, facet_col

  • atter_geo(), et choropleth()

Liste des sessions

15 juin 2026 > 18 juin 2026

BENCHIMOL NATHANIEL

  • 0184160944
  • contact@pythonia.fr

Centre de formation

4 SQUARE JEAN-PAUL LAURENS, 75016 Paris 16e

Lieu de formation

255 Boulevard Pereire, 75017 Paris 17e