最近反思了一下,之前只刷 CL track,导致错过了不少好论文。从今天开始我刷 AI track!
Bayesian scaling laws for in-context learning
Goodman 带着他的数学来了。作者发现,ICL 在某种程度上类似于一个 bayesian learner,所以也会有对应的 bayesian scaling law,通过在合成任务和真实世界任务上的实验,作者发现这个新的 scaling law 在 ICL 领域拟合地非常准。
Breaking ReAct Agents: Foot-in-the-Door Attack Will Get You In
一篇做 ReAct 攻击的工作,IBM research。作者发现,Agent 对于安全性的防御很少涉及到 tool response 里面的内容。如果 tool response 里含有有害指令会怎样呢?作者发现 Agent 会直接执行。这个攻击叫做 foot-in-the-door。所以 multi-turn agent 本质还是多个 single-turn agent 组合在一起吗……
话说我还以为 IBM research 已经解散了……
Large Language Models Empowered Personalized Web Agents
今天 claude 出了自己 GUI Agent 功能,估计这个领域最近又要火了。今天推一篇这个方向的 AAAI 文体的工作:这篇是做 web agent 的,但是瞄准了 personalize 这个属性
v1.5.2