0%

2024-04-02-insights

159 篇,重量级

Evaluating Text-to-Visual Generation with Image-to-Text Generation

Neubig 的论文。作者发现目前 text2image 大家还是再用 CLIPscore 做评测。CLIPscore 效果很差,毕竟是双塔。作者想,现在大家 VQA 模型都这么好了,能不能用 VQA 模型的 "yes" logits 做评测呢?答案是可以,并且效果巨好。

感觉就 Neubig 适合做这个论文…… 别人提个这种新东西估计没人 follow

INJECTING NEW KNOWLEDGE INTO LARGE LANGUAGE MODELS VIA SUPERVISED FINE-TUNING

微软的工作,酸了,人家做实验可以 finetune GPT4:作者探索了在 out-domain 场景下,用 scaling SFT 数据的方式提升模型能力是否可行。作者发现 scaling 数据量的提升有限,但是 scaling fact 的提升更高效

Stable Code Technical Report

Satbility AI 的新 code 模型。比较 "Open" 的工作,作者详细讲了训练数据的构造、预处理,然后各种超参数的对比。最后训出来了效果不错的模型,开源了 checkpoint。

Powered By Valine
v1.5.2