2025-09-16-insights

发表于 2025-09-19 更新于 2025-09-24 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 168 阅读时长 ≈ 1 分钟

UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning

一篇qwen team的gui agent工作，作者在这里提了一个semi-online rl的概念，可以提前采集好traj，然后放进池子慢慢训练。

tongyi最近放了好几篇都是和semi-online rl相关的东西