WildFeedback: Aligning LLMs With In-situ User Interactions And Feedback
这篇论文瞄准了一个挺有意思的领域:在 LLM 上线以后,用户会和模型一直交流,用户不会帮公司点赞或者踩的按钮,而是会有文本的反馈。人类的反馈可以看做一种隐式的、带噪的对 response 的 feedback。作者探索了是否有可能直接从这种反馈里面增强 LLM 能力。
前几个月有个工作,想的是能不能把人类反馈做 extract and refine 变成正常的 feedback。当时发现 30% 的人类 response 有潜力变成反馈
v1.5.2