2025-03-25-insights

发表于 2025-03-25 更新于 2025-03-28 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 362 阅读时长 ≈ 1 分钟

今天ICML出分，不知道大家如何呢

ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data

这篇工作讲得故事挺大的，其核心思想是说：能不能让一个value model做value pretrain，提前见到各种各样的视频等数据，来增强value的准确性。

ldm大家已经见怪不怪了，这篇其实和一年前的genie没什么区别。

不过说实在的，我感觉这里面应该藏着一个更深刻的东西，最近kaiming刚发了一个工作说diffusion里其实不需要random noise假设，但是大家似乎都没有找到一个object是diffusion里真的需要的。真的没有吗？