Depth Anything 3 推出，从任意视角重建视觉空间，以卓越几何精度与 3D 高斯渲染还原真实场景，可使用单张图像、多视角图像及视频流。两大核心发现：- 基础 Transformer 架构（如标准的 DINO）已足够胜任，无需专门定制模型结构。- 单一深度射线表征足矣，无需复杂三维任务。论文：

Depth Anything 3 推出，从任意视角重建视觉空间，以卓越几何精度与 3D 高斯渲染还原真实场景，可使用单张图像、多视角图像及视频流。

两大核心发现：
- 基础 Transformer 架构（如标准的 DINO）已足够胜任，无需专门定制模型结构。
- 单一深度射线表征足矣，无需复杂三维任务。

论文： http://t.cn/AX2HfRJp
项目页面： http://t.cn/AX2HfRJl
代码： http://t.cn/AX2HfRJW
Hugging face 演示： http://t.cn/AX2HfRJ0 http://t.cn/AX2Hf3YP

发布于北京