2025-02-28-insights

发表于 2025-03-02 更新于 2025-03-05 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 274 阅读时长 ≈ 1 分钟

Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation

最近看到很多图片生成领域的工作，他们都想要把next-token predicton这里的token定义做探索。我感觉这里面其实有个大的问题：对于图片这类没有intrinsic casuality的object，我们似乎缺少一种通用的办法将他们表示成具有Autoregressive关系的一系列原子

感觉这个open problem，是一个和seq2seq一样重要的问题。毕竟……先得有sequence才能才seq2seq吧