Le cours contient deux grandes parties : 1. recherche de stratégies - environnement déterministe totalement observé : recherche de chemins : DFS, BFS, A - environnement non-déterministe et partiellement observé - environnement probabiliste : processus de décision Markoviens et apprentissage par renforcement - environnement probabiliste partiellement observé : Modèles de Markov cachés - présence d'autres agents : jeux 2. apprentissage - modèles linéaires - réseaux de neurones