Le cours contient deux grandes parties :
1. recherche de stratégies
- environnement déterministe totalement observé : recherche de chemins : DFS, BFS, A
- environnement non-déterministe et partiellement observé
- environnement probabiliste : processus de décision Markoviens et apprentissage par renforcement
- environnement probabiliste partiellement observé : Modèles de Markov cachés
- présence d'autres agents : jeux
2. apprentissage
- modèles linéaires
- réseaux de neurones
- Gestionnaire: Didier Lime
- Enseignant: Remi Parrot