2024-11-20-insights

发表于 2024-11-20 更新于 2024-11-25 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 212 阅读时长 ≈ 1 分钟

AtomThink: A Slow Thinking Framework for Multimodal Mathematical Reasoning

一篇在vlm里搞o1的工作：作者从数据驱动的视角理解这个问题，认为主要难点在于合成long-cot数据。作者先用4o+prompt启动了一些long-cot种子数据，再在运行时挂载了prm和树搜索，训出来效果还不错

公式呀公式……感觉未来会有50篇这个模式的工作出来，不知道谁能先scale起来