0%

2025-06-11-insights

AbstentionBench: Reasoning LLMs Fail on Unanswerable Questions

这是一篇 meta 的 safety 领域的研究,作者评测了 reasoning model 在无法回答问题的上的表现,发现在使用 long cot 以后,模型的拒答率事实上下降了,变得更加危险

Powered By Valine
v1.5.2