2025-07-14-insights 发表于 2025-07-15 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 118 阅读时长 ≈ 1 分钟 M2-Reasoning: Empowering MLLMs with Unified General and Spatial Reasoning 蚂蚁的vlm rl工作,最近感觉大家都开始陆陆续续放出vlm rl了。作者构造了300k query来做rlvr 相关文章 本月更新(Recent Update) arxiv-insights 2025-07-15-insights 2025-07-11-insights 2025-07-10-insights