从静态照片到动态体积
静态 NeRF 与 3DGS 已经证明多视角照片可以生成可自由观看的空间资产。Infinite Realities 的重点是把这种能力推到人体动态表演:每一帧都经过高度校准的多相机采集,再串成可播放的 4D 高斯序列。
设备规模
Radiance Fields 原文给出的量级很具体:176 台相机、484 盏灯、每秒数据体量巨大,30 秒片段超过 30 万张静态图像。这个规模解释了为什么当前高保真人体 4D 捕捉仍主要位于专业棚内,而不是手机端日常采集。
公开的 Unity VR demo、1800 个训练 PLY 与图像数据集,使它不只是一次体验报道,也成为研究者和工具开发者观察 4DGS 资产形态的样本。
媒体形态的启发
如果二维视频的每一帧都能成为可重光照、可导航、可嵌入空间计算设备的体积记录,那么内容生产会从固定镜头剪辑转向可交互场景编排。短期门槛仍是采集棚、同步、存储与算力;长期信号则是动态三维影像正在形成自己的资产标准。