LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models
这篇工作没有研究3d生成,而是在研究mesh-generation。作者发现,LLM中应该具有一定的基础空间知识,以及对于mesh object的基础理解。由此,作者定义了一套tokenize方法,在不扩展词表的情况下把mesh represention变成了一堆token,由此构造了一个SFT数据集。发现LLM是有能力直接理解自然语言的需求,然后直接生成3d mesh obj的