Gestion de données et analyse de données exploratoire avec R Introduction à la tidyverse, un ensemble de packages qui fonctionnent tous ensemble comme un écosystème avec la même philosophie, la même grammaire et les memes structures de données afin de donner la meilleure expérience possible a l’utilisateur pour les tache de manipulation de données et d’analyses exploratoires. Visualisation avec la librairie ggplot2. Manipulation des jeux de données avec la librairie dplyr: sélection de variables ou d’observation, construction de résumés statistiques, ajout de variables dérivées, fusion de plusieurs jeux de données, tri par valeurs de certaines variables. Transformation des jeux de données avec la librairie tidyr. Gestion des différents types de variables: numériques (base R), chaines de caractères (stringr), facteurs (forcats), date/heure (hms, lubridate). Utilisation optimale des listes et des variables-listes avec la librairie purrr. Rédaction et automatisation de rapports et création de présentations interactives avec Quarto. Modélisation avec R Tests d’hypotheses. Régression linéaire. Extraction consistante des informations essentielles d’un modèle donné avec la librairie modelr. Analyse en composantes principales. Clustering par partitionnement et hiérarchique. Introduction aux tidymodels, un ensemble de packages dédié à la modélisation et au machine learning. Ces packages partagent ici aussi la même philosophie, la même grammaire et les memes structures de donnéess, dans la lignée de la tidyverse.