先前任务不足传统LLM VLMS没有建立在涉及空间关系、适用性、物理、布局等丰富概念的3D物理世界中
实验目标3D点云及其特征作为输入,并执行包括字幕、密集字幕、3D问题回答、任务分解、3D基础、3D辅助对话、导航等多样的3D相关任务
实验
2024-03-04
