0%

2025-08-05-insights

WebDS: An End-to-End Benchmark for Web-based Data Science

作者发现已有的data science benchmark工作,要么是纯qa考验知识,要么是纯操作考验gui。作者想要结合一下,搞了个都包含的benchmark,还额外附赠了一些gui+mcp+知识才能解决的问题

VeOmni: Scaling Any Modality Model Training with Model-Centric Distributed Recipe Zoo

seed出的sft框架,可以比较方便地训练多模态模型。