Search

Anas Barakat

Anas Barakat

Home
Research
Talks
Teaching
CV
Contact

Light Dark Automatic

Policy Gradients for Cumulative Prospect Theory in Reinforcement Learning

Olivier Lepel, Anas Barakat

October 2025

Slides Arxiv

Type

Conference paper

Publication

Under review

Reinforcement Learning

Related

Why Pass@k Optimization Can Degrade Pass@1: Prompt Interference in LLM Post-training
On the Global Optimality of Policy Gradient Methods in General Utility Reinforcement Learning
Policy Mirror Descent with Lookahead
Reinforcement Learning with General Utilities: Simpler Variance Reduction and Large State-Action Space
Stochastic Policy Gradient Methods: Improved Sample Complexity for Fisher-non-degenerate Policies

Powered by the Academic theme for Hugo.

Cite