今天 ICML 出分,不知道大家如何呢
ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data
这篇工作讲得故事挺大的,其核心思想是说:能不能让一个 value model 做 value pretrain,提前见到各种各样的视频等数据,来增强 value 的准确性。
AdaWorld: Learning Adaptable World Models with Latent Actions
ldm 大家已经见怪不怪了,这篇其实和一年前的 genie 没什么区别。
不过说实在的,我感觉这里面应该藏着一个更深刻的东西,最近 kaiming 刚发了一个工作说 diffusion 里其实不需要 random noise 假设,但是大家似乎都没有找到一个 object 是 diffusion 里真的需要的。真的没有吗?
v1.5.2