2025-05-14-insights 发表于 2025-05-14 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 188 阅读时长 ≈ 1 分钟 What Matters for Batch Online Reinforcement Learning in Robotics? 这篇文章名字朴素,但做的还是挺清晰的。作者研究了巨身里面batch online rl这个具体的setting,分析消融了里面的一些关键设计,讨论了一下什么是不可或缺的。最后做了一个recipe的文章 我最近还挺喜欢这类工作的,感觉像是在某些层面和大家share认知。 相关文章 本月更新(Recent Update) arxiv-insights 2025-05-13-insights 2025-05-12-insights 2025-05-09-insights