0%

2025-03-25-insights

今天 ICML 出分,不知道大家如何呢

ViVa: Video-Trained Value Functions for Guiding Online RL from Diverse Data

这篇工作讲得故事挺大的,其核心思想是说:能不能让一个 value model 做 value pretrain,提前见到各种各样的视频等数据,来增强 value 的准确性。

AdaWorld: Learning Adaptable World Models with Latent Actions

ldm 大家已经见怪不怪了,这篇其实和一年前的 genie 没什么区别。

不过说实在的,我感觉这里面应该藏着一个更深刻的东西,最近 kaiming 刚发了一个工作说 diffusion 里其实不需要 random noise 假设,但是大家似乎都没有找到一个 object 是 diffusion 里真的需要的。真的没有吗?

Powered By Valine
v1.5.2