0%

2025-09-16-insights

UI-S1: Advancing GUI Automation via Semi-online Reinforcement Learning

一篇qwen team的gui agent工作,作者在这里提了一个semi-online rl的概念,可以提前采集好traj,然后放进池子慢慢训练。

tongyi最近放了好几篇都是和semi-online rl相关的东西