Résumé de Modélisation probabiliste et apprentissage par renforcement

MPAR Modélisation probabiliste et apprentissage par renforcement

Plan de cours : Le cours est divisé en trois grandes parties : I. Modélisation probabiliste 1. Chaîne de Markov discrètes (DTMC) 2. Processus de décision Markoviens (MDP) 3. Extensions à information imparfaite (HMC et PO-MDP) II. Vérification de modèles probabilistes 1. Model-Checking probabiliste 2. Model-Checking statistique III. Apprentissage par Renforcement 1. Bandit Manchot et MDP 2. Programmation dynamique (DP) 3. Méthodes de Monte-Carlo 4. Différence temporelle (TD)

Gestionnaire: Didier Lime