0%

2025-03-25-insights

今天ICML出分,不知道大家如何呢

ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data

这篇工作讲得故事挺大的,其核心思想是说:能不能让一个value model做value pretrain,提前见到各种各样的视频等数据,来增强value的准确性。

AdaWorld: Learning Adaptable World Models with Latent Actions

ldm大家已经见怪不怪了,这篇其实和一年前的genie没什么区别。

不过说实在的,我感觉这里面应该藏着一个更深刻的东西,最近kaiming刚发了一个工作说diffusion里其实不需要random noise假设,但是大家似乎都没有找到一个object是diffusion里真的需要的。真的没有吗?