On the Global Optimality of Policy Gradient Methods in General Utility Reinforcement Learning

Anas Barakat, Souradip Chakraborty, Peihong Yu, Pratap Tokekar, Amrit Singh Bedi

September 2025

Poster Proceedings Arxiv

Type

Conference paper

Publication

NeurIPS 2025

Reinforcement Learning