2024-12-20-insights 发表于 2024-12-21 更新于 2024-12-25 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 144 阅读时长 ≈ 1 分钟 LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks智谱出的新工作,把longbench做了一个v2版本。专门做过难度平衡,让这个数据集上人在15min的准确率也只有50%。 相关文章 本月更新(Recent Update) arxiv-insights 2024-12-30-insights 2024-12-25-insights 2024-12-24-insights