Why Pass@k Optimization Can Degrade Pass@1: Prompt Interference in LLM Post-training

Anas Barakat, Souradip Chakraborty, Khushbu Pahwa, Amrit Singh Bedi

February 2026

Arxiv

Type

Conference paper

Publication

Under review

Reinforcement Learning