Logarithmic online regret bounds for undiscounted reinforcement learning

Titel in Übersetzung: Logarithmic online regret bounds for undiscounted reinforcement learning

Publikation: KonferenzbeitragPosterForschungBegutachtung

Titel in ÜbersetzungLogarithmic online regret bounds for undiscounted reinforcement learning
OriginalspracheEnglisch
PublikationsstatusVeröffentlicht - 2006
VeranstaltungAdvances in Neural Information Processing Systems (NIPS) 2006 - Vancouver, Kanada
Dauer: 4 Dez. 20067 Dez. 2006

Konferenz

KonferenzAdvances in Neural Information Processing Systems (NIPS) 2006
Land/GebietKanada
OrtVancouver
Zeitraum4/12/067/12/06

Dieses zitieren