Chapitre 1 : Introduction à l'analyse des données
- Qu'est-ce que l'analyse des données ?
- Importance de la prise de décision basée sur les données.
- Aperçu du processus d'analyse des données.
Chapitre 2 : Nettoyage et préparation des données
- Gestion des données manquantes : imputation, suppression ou estimation.
- Gestion des données déséquilibrées : suréchantillonnage, sous-échantillonnage, données synthétiques.
- Détection et traitement des valeurs aberrantes : Identifier et corriger les anomalies.
- Transformation des données : normalisation, standardisation ou mise à l'échelle.
- Ingénierie des fonctionnalités : créez de nouvelles variables pour améliorer l'analyse.
Chapitre 3 : Analyse exploratoire des données (EDA)
- Analyse univariée : Etude de variables individuelles.
- Analyse bivariée : Relations entre paires de variables.
- Analyse multivariée : étude simultanée de plusieurs variables.
- Segmentation et clustering : regroupement de données pour découvrir des modèles.
Chapitre 4 : Réduction de la dimensionnalité
- Analyse en composantes principales (ACP) : réduit la dimensionnalité tout en préservant la variance
- Sélection des fonctionnalités : filtre, wrapper, méthodes intégrées
- Visualisation et analyse de corrélation
Séances pratiques :
- Gérer les données manquantes et les données déséquilibrées
- Transformation et nettoyage des données
- Analyse de régression
- Analyse de clustering
- Réduction de dimensionnalité
- Manager: Luisa Rocha da silva