3 | Toshinori Kitamura

(OS 招待講演) 逐次意思決定における諸問題設定と問題に関する事前知識が性能保証に及ぼす影響について

小津野将, 北村俊徳, 市原有生希, 萩原誠

KL-Entropy-Regularized RL with a Generative Model is Minimax Optimal

Tadashi Kozuno, Wenhao Yang, Nino Vieillard, Toshinori Kitamura, Yunhao Tang, Jincheng Mei, Pierre Ménard, Mohammad Gheshlaghi Azar, Michal Valko, Rémi Munos, others

Cautious Policy Programming: Exploiting KL Regularization in Monotonic Policy Improvement for Reinforcement Learning

Lingwei Zhu, Toshinori Kitamura, Takamitsu Matsubara

ShinRL: A Library for Evaluating RL Algorithms from Theoretical and Practical Perspectives

Toshinori Kitamura, Ryo Yonetani