2024-02-01-insights

发表于 2024-02-01 更新于 2024-08-09 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 637 阅读时长 ≈ 1 分钟

Infini-gram: Scaling Unbounded** n-gram Language Models to a Trillion Tokens

Are n-gram language models still relevant in this era of neural large lan- guage models (LLMs)? Our answer is yes

Yejin Choi的新活：在1.6TB token的量级上重新尝试了n-gram model，用一个新的算法把n-gram table的复杂度降到很低。作者发现实际上infty-gram model对human text的分类能力极强。并且可以比价好的区分出来人写的、model generated text