0%

2025-02-28-insights

Beyond Next-Token: Next-X Prediction for Autoregressive Visual Generation

最近看到很多图片生成领域的工作,他们都想要把next-token predicton这里的token定义做探索。我感觉这里面其实有个大的问题:对于图片这类没有intrinsic casuality的object,我们似乎缺少一种通用的办法将他们表示成具有Autoregressive关系的一系列原子

感觉这个open problem,是一个和seq2seq一样重要的问题。毕竟……先得有sequence才能才seq2seq吧