0%

2025-04-07-insights

DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments

前有 deeperesearch,今天又来了个 deepresearcher。这篇工作了类似于前几天的 searcher-r1,也是探索通过 end2end-rl 的方式学习使用搜索引擎。但是和之前的 native agent 实现不同,这篇工作外置了一个 memory 模块和 html parser,让 agent 本身更专注在 reasoning 上。

sofa
Powered By Valine
v1.5.2