Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs .
Degris, Thomas
LIP6 - Pôle IA
Université Paris 6
8, rue du capitaine Scott F-75015 Paris, France
email: thomas.degris@lip6.fr
Sigaud, Olivier
LIP6 - Pôle IA
Université Paris 6
8, rue du capitaine Scott F-75015 Paris, France
email: olivier.sigaud@lip6.fr
Wuillemin, Pierre-Henri
LIP6 - Pôle IA
Université Paris 6
8, rue du capitaine Scott F-75015 Paris, France
email: pierre-henri.wuillemin@lip6.fr home: www-desir.lip6.fr/~phw
Degris, Thomas and Sigaud, Olivier and Wuillemin, Pierre-Henri (2009) "Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs .". Revue d'Intelligence Artificielle, Vol 23, N°2, pp. 221--251.
(Special Issue on Video Games Revue d'Intelligence Artificielle)
Nous avons développé une méthode d'apprentissage par renforcement capable de fonctionner sur des problèmes de grande taille sans connaissance a priori sur la structure de ces problèmes. Dans cet article, après avoir décrit la méthode elle-même, nous montrons comment elle permet de mettre au point automatiquement le comportement des personnages non joueurs d'un jeu vidéo de tir en première personne, Counter-Strike (c) . Le résultat de l'apprentissage est un ensemble d'arbres de décision qui exploitent la structure du problème pour représenter de façon compacte et lisible un modèle de celui-ci et la politique de décision des personnages. Au-delà de ce travail illustratif, nous discutons de la portée de notre méthode pour la réalisation d'architectures de décision pour les personnages non joueurs des jeux vidéo du commerce.
@Article{,
author = {Degris, Thomas and Sigaud, Olivier and Wuillemin, Pierre-Henri},
title = {Apprentissage par renforcement factorisé pour le comportement de personnages non joueurs .},
journal = {Revue d'Intelligence Artificielle},
year = {2009},
volume = {23},
number = {2},
pages = {221--251},
month = {4}
}
RIA09-ApprentissagePNJ.pdf