循环神经优化器-视频流深度和相机轨迹估计

我要开发同款
匿名用户2024年07月31日
26阅读
所属分类ai、roberta、pytorch、XR、3D Vision、Motion、Depth、Video、Alibaba、accuracy
开源地址https://modelscope.cn/models/iic/cv_dro-resnet18_video-depth-estimation_indoor
授权协议Apache License 2.0

作品详情

视频流深度与相机位姿估计算法介绍

任务

输入一段RGB视频流,深度与相机位姿估计算法将分析场景三维结构、输出图像对应的稠密深度图以及图像之间的相对相机位姿

模型描述

本模型基于DRO: Deep Recurrent Optimizer for Structure-from-Motion算法,是该算法的官方模型。

技术细节请见:

DRO: Deep Recurrent Optimizer for Structure-from-Motion
Xiaodong Gu, Weihao Yuan, Zuozhuo Dai, Chengzhou Tang, Siyu Zhu, Ping Tan
[Paper] | [中文解读]

如何使用

代码示例

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
from modelscope.utils.cv.image_utils import show_video_depth_estimation_result


task = 'video-depth-estimation'
model_id = 'damo/cv_dro-resnet18_video-depth-estimation_indoor'

input_location = 'data/test/videos/video_depth_estimation.mp4'
estimator = pipeline(Tasks.video_depth_estimation, model=model_id)
result = estimator(input_location)
show_video_depth_estimation_result(result[OutputKeys.DEPTHS_COLOR], 'out.mp4')

适用范围

默认输入图片的摄像机参数应与训练数据集(ScanNet)保持一直, 即分辨率为1296x968,内参为

1170.187988,         0.0,   647.750000
        0.0, 1170.187988,   483.750000
        0.0,         0.0,          0.0

如输入图像不一致,请将输入图片矫正为上述参数,否则会影响结果准确性

已知依赖问题

  • ANTIALIAS was removed in Pillow 10.0.0, please use lower version, e.g.,
pip install Pillow==9.5.0

模型精度

Model Abs.Rel. Sqr.Rel RMSE RMSElog a1 a2 a3 SILog L1_inv rot_ang t_ang t_cm
scannet_sup 0.053 0.017 0.165 0.080 0.967 0.994 0.998 0.078 0.033 0.472 9.297 1.160

Bibtex

@article{gu2021dro,
  title={DRO: Deep Recurrent Optimizer for Structure-from-Motion},
  author={Gu, Xiaodong and Yuan, Weihao and Dai, Zuozhuo and Tang, Chengzhou and Zhu, Siyu and Tan, Ping},
  journal={arXiv preprint arXiv:2103.13201},
  year={2021}
}

Acknowledgements

该项目中一些代码来自于 packnet-sfmRAFT,非常感谢他们开源了相关工作。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论