祈祷明天别再来700篇论文了……真顶不住了
RePrompt: Reasoning-Augmented Reprompting for Text-to-Image Generation via Reinforcement Learning
这篇工作的场景比较有意思,是image reprompt,大概意思是:用户给一个巨垃圾的提示词,模型自己根据自己的理解完善成一个长长的提示词,然后送给t2i模型。作者直接在这个setting上跑了个rl,用生成图片的满意度来反馈re-prompt的效果,让模型先自己think一大堆再做re-prompt
if you have a reward……
Superplatforms Have to Attack AI Agents
这是一个奇怪的工作,感觉应该挂在经济学track,作者讨论AI Agent对平台应用的影响。作者认为这些平台的营业模式是定向广告和推荐来垄断用户注意力(因为你不得不一直用他们来完成任务)。但如果是Agent,就没钱挣了。从这个角度出发, 平台APP一定会去攻击或者抵制Agent
和前两天那个给Agent放广告(网页内容投毒)的工作形成卧龙凤雏……