2025-04-28-insights 发表于 2025-04-30 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 175 阅读时长 ≈ 1 分钟 Scaling Laws For Scalable Oversight这篇工作中,作者探索了弱模型监督强模型的效果,作者发现。如果把智能等级用elo(chatbotarena)表示的话,监督的难度会随着分差变大而变大,在400分差时,监督已经变得非常困难。 我没太看懂这个文章,不过感觉还挺有趣的,自从openai提了这个问题,好像follow up的工作并不大 相关文章 本月更新(Recent Update) arxiv-insights 2025-04-25-insights 2025-04-24-insights 2025-04-23-insights