0%

2024-01-02-insights

GitAgent: Facilitating Autonomous Agent with GitHub by Tool Extension

推荐一下我参与的工作,不算今天的名额……不知道为啥归类到software engineering track了。这个算是自主Agent的一个阶段成果了,我们一直在设想一个可能性:Agent能不能自动用人类的方式去地使用、整合人类已有的资源去完成任务。

在这篇工作中,我们尝试了让LLM自动从Github上搜索、clone、运行相关的仓库,来完成我们想完成的任务。这篇工作展示了某种可能性,可能是以后GPT4、GPT4.5、GPT5去接管人类计算和智慧资源的方式

Improving Text Embeddings with Large Language Models

Furu Wei的论文。作者在dense retreive的领域做了一个类似alpaca的东西:

  • 首先让GPT4生成一大堆retrieve可能的任务
  • 然后对于每种任务,都生成一大堆 (question, positive, hard-negative)三元组

使用这个造数据pipeline生成了100,000数据,然后直接用简单的的对比学习loss训练了1k step,就得到了多个下游任务上的新SOTA

神奇,这么朴素暴力的办法之前没有人想到吗……