Reinforcement Learning with General Utilities: Scaling to Large State Action Spaces via Occupancy Measure Approximation

Anas Barakat, Souradip Chakraborty, Peihong Yu, Pratap Tokekar, Amrit Singh Bedi, Niao He

October 2023