MEPNet 基于图像的 2D-3D 转换框架开源项目

我要开发同款
匿名用户2022年08月02日
36阅读
开发技术Python
所属分类人工智能
授权协议MIT

作品详情

MEPNet是一个基于学习的框架,可以将人类设计师创造的基于图像的、分步骤的装配手册翻译成机器可理解的指令。

研究人员将这个问题表述为一个连续的预测任务:在每个步骤中,该模型都会读取手册,定位要添加到当前形状中的部件,并推断出它们在三维空间的位置。这项任务带来的挑战是在手册图像和真实的三维物体之间建立「二维到三维」的对应关系,以及对未见过的三维物体进行三维姿态预测,因为在一个步骤中要添加的新部件可能是全新的小积木,也可能是由以前的步骤拼成的物体。

安装

运行以下命令来安装必要的依赖项。

condacreate-nlego_releasepython=3.9.12condaactivatelego_releasepip-rrequirements.txt

根据这个文档,可能需要手动安装pytoch3d0.5.0。

评估

从这里下载评估数据集和模型检查点,并将它们解压缩到代码的根目录下,然后运行

bashscripts/eval/eval_all.sh

结果将保存到results/.

训练

要从头开始训练模型,首先从这里下载训练和验证数据集,然后分别解压到data/datasets/synthetic_train和data/datasets/synthetic_val目录。

下载数据集后,运行以下命令对其进行预处理

bashscripts/process_dataset.sh

然后运行脚本来训练模型

bashscripts/train/train_mepnet.sh

你可以在wandb中加--wandb选项用于记录和可视化的训练脚本。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论