0%

2025-01-08-insights

Cosmos World Foundation Model Platform for Physical AI

前两天nvidia发布会说的世界模型挂出来了。这是一个world model的工作,根据不同的动作可以生成后续视频。作者在这边把world model定义了一个pretrain的概念,然后说明基于cosmos pretrained world model,可以在下游进行各种微调。这篇开源了一大堆模型,包含diffusion-loss的,Autoregressive-loss,可以做text2video,文字+视频输入,生成视频后文的