Intern-S1: A Scientific Multimodal Foundation Model
Intern系列的新domain model。作者足足搞了2.5T的sci token,重点关注下游的sci reasoning场景,由此可以在下游做各个学科的高价值任务
这才是真正的ai4science
Mobile-Agent-v3: Foundamental Agents for GUI Automation
qwen团队也对gui agent出手了,一个7B模型,一个框架。作者基本上做了gui agent全流程的训练,然后在测试时进一步通过agent框架增强,在各个gui online benchmark上都做到了第一梯队的水平
各个团队都在向着omni agent前进呀