DL3DV-10K Dataset:针对基于深度学习的3D视觉的大规模场景数据集
:针对基于深度学习的3D视觉的大规模场景数据集基于深度学习的3D视觉领域已经取得了显著的进步,从神经辐射场(NeRF)驱动的3D表示学习到应用于全新视角合成(NVS)。然而,当前的针对基于深度学习的3D视觉的场景级别数据集,不管是只限于虚构环境或者狭窄的现实世界场景的选择,都非常框定。这种局限性限制了我们对现有方法进行全面的基准测试,也限制了在基于深度学习的3D分析中可能探索的领域。为了填补这个空白,我们提出了DL3DV-10K,一个大规模场景数据集,包含51.2百万帧,从10,510个视频中捕获,涵盖了65种热点(POI)地点,包括有边界和无边界的场景,呈现出不同层次的反射、透明度和光照。我们对DL3DV-10K进行了全新视角合成(NVS)方法的全面基准测试,揭示出NVS未来研究的宝贵观察。此外,我们利用DL3DV-10K进行的通用化NeRF初步学习研究取得了令人鼓舞的结果,突显了大规模场景级别数据集对于建立学习3D表示的基础模型的重要性。我们的DL3DV-10K数据集,基准测试结果和模型将可在网页链接上公开获取。
在Telegram中查看相关推荐
🔍 发送关键词来寻找群组、频道或视频。
启动SOSO机器人