2025-05-14-insights

发表于 2025-05-14 更新于 2025-05-22 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 188 阅读时长 ≈ 1 分钟

What Matters for Batch Online Reinforcement Learning in Robotics?

这篇文章名字朴素，但做的还是挺清晰的。作者研究了巨身里面batch online rl这个具体的setting，分析消融了里面的一些关键设计，讨论了一下什么是不可或缺的。最后做了一个recipe的文章

我最近还挺喜欢这类工作的，感觉像是在某些层面和大家share认知。