Chapitre 1 : Introduction à l'analyse des données - Qu'est-ce que l'analyse des données ? - Importance de la prise de décision basée sur les données. - Aperçu du processus d'analyse des données. Chapitre 2 : Nettoyage et préparation des données - Gestion des données manquantes : imputation, suppression ou estimation. - Gestion des données déséquilibrées : suréchantillonnage, sous-échantillonnage, données synthétiques. - Détection et traitement des valeurs aberrantes : Identifier et corriger les anomalies. - Transformation des données : normalisation, standardisation ou mise à l'échelle. - Ingénierie des fonctionnalités : créez de nouvelles variables pour améliorer l'analyse. Chapitre 3 : Analyse exploratoire des données (EDA) - Analyse univariée : Etude de variables individuelles. - Analyse bivariée : Relations entre paires de variables. - Analyse multivariée : étude simultanée de plusieurs variables. - Segmentation et clustering : regroupement de données pour découvrir des modèles. Chapitre 4 : Réduction de la dimensionnalité - Analyse en composantes principales (ACP) : réduit la dimensionnalité tout en préservant la variance - Sélection des fonctionnalités : filtre, wrapper, méthodes intégrées - Visualisation et analyse de corrélation Séances pratiques : - Gérer les données manquantes et les données déséquilibrées - Transformation et nettoyage des données - Analyse de régression - Analyse de clustering - Réduction de dimensionnalité