近年来,体积视频(Volumetric Video)作为沉浸式媒体的重要形式,逐渐成为虚拟现实、增强现实及未来互联网应用的关键内容载体。然而,与传统二维视频相比,体积视频在存储、传输带宽与实时渲染等方面仍面临显著挑战,尤其在网络条件不稳定的移动端设备上,这一问题更为突出。针对现有方法存在单一模型多码率支持不足、实时解码性能有限以及复杂运动场景鲁棒性不佳等问题,上海交通大学、上海AI Lab、上海科技大学等单位的研究团队联合天翼视讯科技有限公司提出了一种新的压缩框架——4DGCPro,首次在动态高斯表征单一模型中实现了多码率支持,并能在手机等轻量级设备上完成实时解码与高保真渲染。

论文链接: https://arxiv.org/abs/2509.17513
项目地址: https://mediax-sjtu.github.io/4DGCPro/


目前,该成果已被机器学习顶级会议 NeurlPS 2025 正式接收。
作者在 N3DV、HiFi4G 和自建 4DGCPro 数据集 上进行了全面实验,对比了 ReRF、HPC、3DGStream、4DGC、HiCoM、V3 等方法。




由此可见,4DGCPro 同时实现了高质量、低码率和实时解码渲染,首次让体积视频的“渐进式流媒体”在移动端成为可能。