细粒度动物识别(8k类)模型介绍
本模型是对含有动物的图像进行标签识别,无需任何额外输入,输出动物的类别标签,目前仅支持猫狗鹦鹉的动物类别。
模型描述
模型采用efficientnetv2-s网络结构。
使用方式和范围
使用方式:
- 直接推理,对输入的图像,输入图像直接进行推理。
使用场景:
- 适合含有动物的图像进行动物标签识别,期望图像中动物占比不要过小。
代码范例:
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks
animal_recognition= pipeline(
Tasks.animal_recognition,
model='fengwenyuan/maogouyingwu')
result = animal_recognition('https://image.baidu.com/search/down?tn=download&word=download&ie=utf8&fr=detail&url=https%3A%2F%2Fgimg2.baidu.com%2Fimage_search%2Fsrc%3Dhttp%253A%252F%252Fsafe-img.xhscdn.com%252Fbw%252F798f29e7-0d20-4c88-8930-a478e5bc1cb9%253FimageView2%252F2%252Fw%252F1080%252Fformat%252Fjpg%26refer%3Dhttp%253A%252F%252Fsafe-img.xhscdn.com%26app%3D2002%26size%3Df9999%2C10000%26q%3Da80%26n%3D0%26g%3D0n%26fmt%3Dauto%3Fsec%3D1702797411%26t%3Dd3535a68c6e55173813312af9830859a&thumburl=https%3A%2F%2Fimg1.baidu.com%2Fit%2Fu%3D318980013%2C1803980894%26fm%3D253%26fmt%3Dauto%26app%3D138%26f%3DJPEG%3Fw%3D500%26h%3D500')
print(result)
训练数据
训练数据共约1500带有动物标签的数据。
模型训练
预处理
图像输入:resize到384*384
LR scheduler
初始LR为 0.0003,每隔10个epoch,lr调整为原来的1/4,共训练100个epoch。
数据评估及结果
通过收集线上的实际应用数据进行评测精度为72.1%。
评论