RADIO Amplified: Improved Baselines for Agglomerative Vision Foundation Models
Nvidia继续发力,这次是瞄准agglomerative vlm,经典的数据+算法改进+分析八股
The Pitfalls of Memorization: When Memorization Hurts Generalization
这是meta的一篇grokking类的研究:作者解决的是memorization的问题,即模型记住数据集中的某个简单规则,并背诵了有例外的数据的映射。这种学习模式可以让训练集的loss接近0,但是没有泛化性。这个问题虽然简单,但是却很难解决,因为其背后的本质原因是:这可能就是目前AI学习目标的最优解。