Objectifs
Cette formation vise à donner aux apprenants une compréhension claire et structurée du Data Mining : concepts clés, méthodes (associations, prédictif, descriptif), processus (KDD/CRISP-DM) et bonnes pratiques de préparation des données, afin de conduire des analyses fiables et exploitables.
À l'issue de la formation, les participants seront capables de :
• Définir un problème de data mining et sélectionner les méthodes adaptées
• Mettre en place une démarche méthodologique (KDD/CRISP-DM) de bout en bout
• Préparer et transformer les données (qualité, encodage, normalisation, features)
• Construire, comparer et interpréter des modèles prédictifs et descriptifs
• Identifier les limites, risques éthiques et enjeux de gouvernance des projets data
Description
Introduction au Data Mining
• Définir le Data Mining et ses cas d'usage
• Distinguer data mining, machine learning et data science
• Identifier les types de tâches (prédictif vs descriptif)
Méthodes du Data Mining - Associations
• Situer les méthodes de data mining et leurs usages
• Comprendre et appliquer les règles d'association
• Interpréter et filtrer des règles pertinentes
Processus et méthodologie de Data Mining
• Comprendre les étapes KDD et CRISP-DM
• Définir une stratégie d'évaluation et de validation
• Documenter et piloter un projet data
Préparation et gestion des données
• Diagnostiquer la qualité des données
• Concevoir une stratégie de préparation et features
• Sécuriser la validation (leakage, déséquilibre)
Techniques prédictives
• Distinguer classification et régression
• Évaluer et comparer des modèles supervisés
• Améliorer un modèle (tuning, régularisation)
Techniques descriptives
• Réaliser une analyse descriptive structurée
• Appliquer des techniques de clustering
• Exploiter la réduction de dimension et profiling
Limitations, éthiques et enjeux
• Identifier les limites techniques (données, généralisation, drift)
• Analyser les biais et impacts
• Intégrer conformité et gouvernance
Conditions d'accès
Notions de statistiques descriptives, bases de manipulation de donnees (tableaux), et connaissances generales en Python ou SQL (souhaitables pour les ateliers)
Rythme
Temps plein
Liste des sessions
NOVATIEL
- 0626030474
- l.abiassaf@caplogy.com
Centre de formation
Lieu de formation