Learning 3D-Gaussian Simulators from RGB Videos
作者: Mikel Zhobro, Andreas René Geist, Georg Martius
发布时间: 2025-04-02
来源: arxiv
研究方向: 计算机视觉与机器人学
主要内容
该研究提出了一种名为3DGSim的3D物理模拟器,可以从多视角RGB视频中学习物体动力学。该模型通过将图像编码为3D高斯粒子表示,利用Transformer进行动力学传播,并通过3D高斯喷射进行渲染,实现了对物体运动和场景的逼真模拟。
主要贡献
1. 从RGB视频中直接学习物体动力学,无需访问网格或深度相机。
2. 使用3D高斯点云代替传统的点云,提高了模型的可扩展性。
3. 引入时间编码和合并层,提高了Transformer处理非结构化点云嵌入的效率。
4. 联合训练逆渲染和动力学模型,将物理属性嵌入到点状潜在向量中。
5. 提出开源数据集和代码,促进了该领域的进一步研究。
研究方法
1. 3D高斯粒子表示
2. Transformer架构
3. 3D高斯喷射渲染
4. 点云序列化
5. 逆渲染
6. 时间编码和合并
实验结果
3DGSim在刚性、弹性布料等不同类型的物体动力学模拟中表现出色,能够捕捉复杂的物理现象,如阴影、反射等。实验结果表明,该模型在物理真实性和视觉效果方面都优于其他现有方法。
未来工作
未来将探索在更大规模的数据集上训练3DGSim,并考虑将语言嵌入引入模拟器中,以更好地理解物体的物理属性。