0%

2025-08-25-insights

Mini-Omni-Reasoner: Token-Level Thinking-in-Speaking in Large Speech Models

这篇工作的想法很有趣。基本上⬇️这张图说明了做着的想法:对于一个speech model,模型每时每刻都在说话。能不能让模型在每个时间片里,在说完了应该说的东西以后,剩下的时间用来做一些reasoning token?作者跑起来了一个这样的模型