Improved Regret Bounds for Undiscounted Continuous Reinforcement Learning

Lakshmanan Kailasam, Ronald Ortner, Daniil Ryabko

Publikation: Beitrag in Buch/Bericht/KonferenzbandBeitrag in Konferenzband

OriginalspracheEnglisch
TitelProceedings of The 32nd International Conference on Machine Learning
PublikationsstatusVeröffentlicht - 2015

Dieses zitieren