之前我们聊了
今天我们满足了所有前置知识,可以来看这篇的本体了。如何把diffusion models 用到可控文本生成中。虽然是老本行,但这篇还是精读一下。
昨天晚上失眠了,呆到了4点多才睡着,感觉蝉鸣好刺耳。不知道是不是咖啡的原因,确实有几天没喝咖啡了……这波是抗药性衰退
MLSys的论文,讲了如何在auto-tuners中更好的利用硬件的信息
这篇是DDIM,21年的ICLR,把DDPM的速度提升了50倍,基本不影响效果。
陈天奇在MLSys的新作,提出一种形状动态的auto-scheduler方法,速度和效果都很好。
回家了
有监督预训练,在绝大多数任务上击败基线BART,在11个数据集达到SOTA