2024-11-20-insights 发表于 2024-11-20 更新于 2024-11-25 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 212 阅读时长 ≈ 1 分钟 AtomThink: A Slow Thinking Framework for Multimodal Mathematical Reasoning 一篇在 vlm 里搞 o1 的工作:作者从数据驱动的视角理解这个问题,认为主要难点在于合成 long-cot 数据。作者先用 4o+prompt 启动了一些 long-cot 种子数据,再在运行时挂载了 prm 和树搜索,训出来效果还不错 公式呀公式…… 感觉未来会有 50 篇这个模式的工作出来,不知道谁能先 scale 起来 相关文章 本月更新 (Recent Update) arxiv-insights 2025-04-18-insights 2025-04-17-insights 2025-04-16-insights
v1.5.2