Fondamentaux du Data Mining - méthodes, processus, techniques prédictives & descriptives - Data Mining

  • Vélizy-Villacoublay

Objectifs

Cette formation vise à donner aux apprenants une compréhension claire et structurée du Data Mining : concepts clés, méthodes (associations, prédictif, descriptif), processus (KDD/CRISP-DM) et bonnes pratiques de préparation des données, afin de conduire des analyses fiables et exploitables.

À l'issue de la formation, les participants seront capables de :

• Définir un problème de data mining et sélectionner les méthodes adaptées

• Mettre en place une démarche méthodologique (KDD/CRISP-DM) de bout en bout

• Préparer et transformer les données (qualité, encodage, normalisation, features)

• Construire, comparer et interpréter des modèles prédictifs et descriptifs

• Identifier les limites, risques éthiques et enjeux de gouvernance des projets data

 

Description

Introduction au Data Mining

• Définir le Data Mining et ses cas d'usage

• Distinguer data mining, machine learning et data science

• Identifier les types de tâches (prédictif vs descriptif)

Méthodes du Data Mining - Associations

• Situer les méthodes de data mining et leurs usages

• Comprendre et appliquer les règles d'association

• Interpréter et filtrer des règles pertinentes

Processus et méthodologie de Data Mining

• Comprendre les étapes KDD et CRISP-DM

• Définir une stratégie d'évaluation et de validation

• Documenter et piloter un projet data
Préparation et gestion des données

• Diagnostiquer la qualité des données

• Concevoir une stratégie de préparation et features

• Sécuriser la validation (leakage, déséquilibre)

Techniques prédictives

• Distinguer classification et régression

• Évaluer et comparer des modèles supervisés

• Améliorer un modèle (tuning, régularisation)

Techniques descriptives

• Réaliser une analyse descriptive structurée

• Appliquer des techniques de clustering

• Exploiter la réduction de dimension et profiling

Limitations, éthiques et enjeux

• Identifier les limites techniques (données, généralisation, drift)

• Analyser les biais et impacts

• Intégrer conformité et gouvernance

Conditions d'accès

Notions de statistiques descriptives, bases de manipulation de donnees (tableaux), et connaissances generales en Python ou SQL (souhaitables pour les ateliers)

Rythme

Temps plein

Liste des sessions

10 mars 2026 > 13 mars 2026 • Période d'inscription du 6 février 2026 au 28 février 2026

NOVATIEL

  • 0626030474
  • l.abiassaf@caplogy.com

Centre de formation

4 AVENUE DES AUBEPINES, 95500 Gonesse

Lieu de formation

36 avenue de l Europe, 78140 Vélizy-Villacoublay