0%

2025-01-08-insights

Cosmos World Foundation Model Platform for Physical AI

前两天 nvidia 发布会说的世界模型挂出来了。这是一个 world model 的工作,根据不同的动作可以生成后续视频。作者在这边把 world model 定义了一个 pretrain 的概念,然后说明基于 cosmos pretrained world model,可以在下游进行各种微调。这篇开源了一大堆模型,包含 diffusion-loss 的,Autoregressive-loss,可以做 text2video,文字 + 视频输入,生成视频后文的

Powered By Valine
v1.5.2