2024-02-26-insights

发表于 2024-02-27 更新于 2024-08-09 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 265 阅读时长 ≈ 1 分钟

Orca-Math: Unlocking the potential of SLMs in Grade School Math

orca团队的新作，作者发现，用Multi-agent framework构造200k数据，加上一个SFT，就能把GSM8K top1 acc打到80%

作者发现，对于经典的text embedding提取方式，模型似乎并没有办法把后面token的语义考虑进前文。作者想了个简单的办法，把原始语料重复一遍，用后面那份prefix的embedding。