2024-12-11-insights

发表于 2024-12-11 更新于 2024-12-16 分类于 Arxiv-Insights 阅读次数： Valine：
本文字数： 330 阅读时长 ≈ 1 分钟

RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models

Nvidia继续发力，这次是瞄准agglomerative vlm，经典的数据+算法改进+分析八股

The Pitfalls of Memorization: When Memorization Hurts Generalization

这是meta的一篇grokking类的研究：作者解决的是memorization的问题，即模型记住数据集中的某个简单规则，并背诵了有例外的数据的映射。这种学习模式可以让训练集的loss接近0，但是没有泛化性。这个问题虽然简单，但是却很难解决，因为其背后的本质原因是：这可能就是目前AI学习目标的最优解。