0%

2023-10-05-insights

今天两篇有趣的论文

Self-Taught Optimizer (STOP): Recursively Self-Improving Code Generation

之前有一篇 "take a deep breathe" 的论文,可以让模型自己优化下游任务的 prompt。这次这篇多递归了一层,可以自己 evolve "prompt-evolver"。

是个 case study 的论文,这个问题很有意思。

Kosmos-G: Generating Images in Context with Multimodal Large Language Models

作者探讨了一个很有意思的问题,现在的 text2image 基本都是从文本到图片。但是生成图片的时候就只有文本吗?能不能把图片文本联合作为一个输入去生成图片?

其实很多 ControlNet 之类的任务,天生就可以被这种方式表示出来

Powered By Valine
v1.5.2