WebSailor: Navigating Super-human Reasoning for Web Agent
Qwen团队出的webgpt agent工作。一篇很好的报告,基本把冷启、rft、rl都讲了一遍
AI Research Agents for Machine Learning: Search, Exploration, and Generalization in MLE-bench
meta出的agent工作,虽然比较传统,但是像alpha evolve这样的系统已经证明,还就是这种系统现在效果好。这个系统可以在kaggle上50%的比赛拿到奖牌