0%

2025-10-24-insights

Collective Communication for 100k+ GPUs

meta做的架构创新工作,作者目标如何在通信上加速100k gpu这个规模的训练集群。作者把他们的方法称为ncclX

不明觉厉

Surfer 2

一篇cua领域的agent framework工作,不过作者同时做了osworld train on test的rl训练,榜单刷的挺高的