全景图室内框架估计

我要开发同款
匿名用户2024年07月31日
22阅读
所属分类ai、roberta、pytorch、arxiv:2212.12156、XR、Panorama、Layout、Alibaba、ViT、accuracy
开源地址https://modelscope.cn/models/iic/cv_panovit_indoor-layout-estimation
授权协议Apache License 2.0

作品详情

室内框架估计算法介绍

输入一张室内空间的全景RGB图像,室内框架估计算法将输出房间的墙线,天花板线跟地线

  

模型描述

PanoViT 的网络框架可以分为backbone、全景视觉变换器编码器(Vision transformer encoder)、边缘增强模块(Edge enhancement module)和布局预测模块(Layout prediction module)。一张全景图送到backbone提取多尺度特征图,送到边缘增强模块得到边缘增强图。全景视觉转换器编码器以原始图像、边缘增强图和多尺度特征图为输入,输出特征向量供布局预测模块估计房间布局。网络的结构如图所示

  

如何使用

代码范例

import cv2
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks


task = Tasks.indoor_layout_estimation
model_id = 'damo/cv_panovit_indoor-layout-estimation'

input_location = 'data/test/images/indoor_layout_estimation.png'
estimator = pipeline(Tasks.indoor_layout_estimation, model=model_id)
result = estimator(input_location)
layout_vis = result[OutputKeys.LAYOUT]
cv2.imwrite('layout.jpg', layout_vis)

输入图像格式

输入图像与mattroport3D数据集一致,为512*1024的全景图像。

模型精度

在Mattroport上的结果为

  

Bibtex

@article{shen2022panovit,
  title={PanoViT: Vision Transformer for Room Layout Estimation from a Single Panoramic Image},
  author={Shen, Weichao and Dong, Yuan and Chen, Zonghao and Zhao, Zhengyi and Gao, Yang and Liu, Zhu},
  journal={arXiv preprint arXiv:2212.12156},
  year={2022}
}
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论