2025-01-10-insights 发表于 2025-01-11 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 177 阅读时长 ≈ 1 分钟 An Empirical Study of Autoregressive Pre-training from Videos Meta的一篇研究,如果把视频按照多图的方式tokenize完,然后直接去pretrain会怎样。作者做了一个简单粗暴的实验,大概找来了1T token的训练量,发现这种方案也有一致的scaling law,并且在scaling起来以后,效果并不差。 相关文章 本月更新(Recent Update) arxiv-insights 2025-01-13-insights 2025-01-09-insights