2025-04-07-insights

发表于 2025-04-07 更新于 2025-04-10 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 245 阅读时长 ≈ 1 分钟

DeepResearcher: Scaling Deep Research via Reinforcement Learning in Real-world Environments

前有deeperesearch，今天又来了个deepresearcher。这篇工作了类似于前几天的searcher-r1，也是探索通过end2end-rl的方式学习使用搜索引擎。但是和之前的native agent实现不同，这篇工作外置了一个memory模块和html parser，让agent本身更专注在reasoning上。