0%

2024-02-26-insights

Orca-Math: Unlocking the potential of SLMs in Grade School Math

orca团队的新作,作者发现,用Multi-agent framework构造200k数据,加上一个SFT,就能把GSM8K top1 acc打到80%

Repetition Improves Language Model Embeddings

作者发现,对于经典的text embedding提取方式,模型似乎并没有办法把后面token的语义考虑进前文。作者想了个简单的办法,把原始语料重复一遍,用后面那份prefix的embedding。