VitPose姿态估计

我要开发同款
匿名用户2024年07月31日
34阅读
所属分类aipytorch、姿态检测、Pose Detection、VitPose、cv
开源地址https://modelscope.cn/models/iic/vitpose_image_pose_detection
授权协议MIT License

作品详情

VitPose 姿态估计

模型描述

该模型是对论文 ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation 以及 ViTPose+: Vision Transformer Foundation Model for Generic Body Pose Estimation的实现。采用Vit模型进行全身关键点的预测。

期望模型使用方式以及适用范围

本模型适用范围为室内室外自然场景;

如何使用

在ModelScope框架上,提供输入图片,即可通过简单的Pipeline调用来使用。

环境配置

# 安装git(如有请跳过)
conda install -c anaconda git
# 准备基础环境
conda create -n vitpose python=3.8
conda activate vitpose
# modelscope 环境(如有请跳过)
pip install modelscope
# VitPose克隆
git clone https://github.com/ViTAE-Transformer/ViTPose.git
cd ViTPose
vim mmpose/__init__.py
修改mmcv_maximum_version = '1.5.0' 为 mmcv_maximum_version = '1.7.0', 保存退出
pip install -v -e .

代码范例

cd ..
vim demo.py

在demo.py文件中添加以下代码

import numpy as np
from PIL import Image
from modelscope.pipelines import pipeline

## 使用自己的图片
input = Image.open("vcg.jpg").convert("RGB")
input = np.array(input)
inference = pipeline('VitPose', model="damo/vitpose_image_pose_detection", model_revision='v1.0.3')
detected_map = inference(input)
Image.fromarray(np.clip(detected_map, 0, 255).astype(np.uint8)).save("pose.jpg")

随后执行python demo.py即可

模型局限性以及可能的偏差

  • 关键点在大姿态,遮挡情况下可能不准确。

引用

如果你觉得这个该模型对有所帮助,请考虑引用下面的相关的论文:

@inproceedings{
  xu2022vitpose,
  title={Vi{TP}ose: Simple Vision Transformer Baselines for Human Pose Estimation},
  author={Yufei Xu and Jing Zhang and Qiming Zhang and Dacheng Tao},
  booktitle={Advances in Neural Information Processing Systems},
  year={2022},
}
@article{xu2022vitpose+,
  title={ViTPose+: Vision Transformer Foundation Model for Generic Body Pose Estimation},
  author={Xu, Yufei and Zhang, Jing and Zhang, Qiming and Tao, Dacheng},
  journal={arXiv preprint arXiv:2212.04246},
  year={2022}
}
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论