Depth Anything 3 推出,从任意视角重建视觉空间,以卓越几何精度与 3D 高斯渲染还原真实场景,可使用单张图像、多视角图像及视频流。
两大核心发现:
- 基础 Transformer 架构(如标准的 DINO)已足够胜任,无需专门定制模型结构。
- 单一深度射线表征足矣,无需复杂三维任务。
论文: http://t.cn/AX2HfRJp
项目页面: http://t.cn/AX2HfRJl
代码: http://t.cn/AX2HfRJW
Hugging face 演示: http://t.cn/AX2HfRJ0 http://t.cn/AX2Hf3YP
发布于 北京
