2025-09-16-insights 发表于 2025-09-19 更新于 2025-09-20 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 168 阅读时长 ≈ 1 分钟 UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning 一篇qwen team的gui agent工作,作者在这里提了一个semi-online rl的概念,可以提前采集好traj,然后放进池子慢慢训练。 tongyi最近放了好几篇都是和semi-online rl相关的东西 相关文章 2025-09-18-insights 本月更新(Recent Update) arxiv-insights 2025-09-19-insights 2025-09-15-insights