0%

2025-06-11-insights

AbstentionBench: Reasoning LLMs Fail on Unanswerable Questions

这是一篇meta的safety领域的研究,作者评测了reasoning model在无法回答问题的上的表现,发现在使用long cot以后,模型的拒答率事实上下降了,变得更加危险