0%

2025-07-01-insights

DenseWorld-1M: Towards Detailed Dense Grounded Caption in the Real World

seed的工作,是一个dense caption的数据集。大概一年前deepmind做了一篇dense caption标注的工作,但当时没有开源数据集。这次这个方法很像,但是把1M caption全部开源了。

平均长度2813,比之前deepmind那个900更上一层楼