Plan de cours :
Le cours est divisé en trois grandes parties :
I. Modélisation probabiliste
1. Chaîne de Markov discrètes (DTMC)
2. Processus de décision Markoviens (MDP)
3. Extensions à information imparfaite (HMC et PO-MDP)
II. Vérification de modèles probabilistes
1. Model-Checking probabiliste
2. Model-Checking statistique
III. Apprentissage par Renforcement
1. Bandit Manchot et MDP
2. Programmation dynamique (DP)
3. Méthodes de Monte-Carlo
4. Différence temporelle (TD)
- Gestionnaire: Didier Lime