2025-07-15-insights 发表于 2025-07-15 分类于 Arxiv-Insights 阅读次数: Valine: 本文字数: 194 阅读时长 ≈ 1 分钟 Cameras as Relative Positional Encoding 这是一篇做multiview建模的工作,这个领域的任务是输入一个环境的几个角度的照片,然后让模型预测另外一个视角看起来是什么样子。这篇工作是从position embedding的视角理解这个问题,希望设计一种对multiview问题更友好的position embedding,天然让模型对不同视角的变换关系有prior 相关文章 本月更新(Recent Update) arxiv-insights 2025-07-14-insights 2025-07-11-insights 2025-07-10-insights