2025-08-25-insights

发表于 2025-08-29 更新于 2025-09-10 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 189 阅读时长 ≈ 1 分钟

Mini-Omni-Reasoner: Token-Level Thinking-in-Speaking in Large Speech Models

这篇工作的想法很有趣。基本上⬇️这张图说明了做着的想法：对于一个speech model，模型每时每刻都在说话。能不能让模型在每个时间片里，在说完了应该说的东西以后，剩下的时间用来做一些reasoning token？作者跑起来了一个这样的模型