0%

2025-07-15-insights

Cameras as Relative Positional Encoding

这是一篇做multiview建模的工作,这个领域的任务是输入一个环境的几个角度的照片,然后让模型预测另外一个视角看起来是什么样子。这篇工作是从position embedding的视角理解这个问题,希望设计一种对multiview问题更友好的position embedding,天然让模型对不同视角的变换关系有prior