XLM-R命名实体识别-越南语-电商领域(商品标题)-base

我要开发同款
匿名用户2024年07月31日
24阅读
所属分类ai、xlm-roberta、pytorch、信息抽取、NER、Alibaba、F1、nlp
开源地址https://modelscope.cn/models/iic/nlp_xlmr_named-entity-recognition_viet-ecommerce-title
授权协议Apache License 2.0

作品详情

越南语电商域Title NER介绍

模型描述

本方法采用Transformer-CRF模型,使用XLM-RoBERTa作为预训练模型底座。本模型主要用于给输入越南语商品标题文本产出命名实体识别结果, 具体调用方式请参考代码示例。

训练数据介绍

  • ecom-title-th: 内部越南语电商领域商品标题命名实体识别(NER)数据集, 支持产品(product), 功能(function), 品牌(brand), 模式(pattern), 颜色(color), 用户群体(consumer_group), 风格(style)等七大类型的实体识别
实体类型 英文名
产品 product
功能 function
品牌 brand
图案 pattern
颜色 color
用户群体 consumer_group
风格 style

快速上手

适用范围

在安装ModelScope完成之后即可使用named-entity-recognition(命名实体识别)的能力, 默认单句长度不超过512, 推荐输入长度不超过128的句子。

代码示例

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

ner_pipeline = pipeline(Tasks.named_entity_recognition, 'damo/nlp_xlmr_named-entity-recognition_viet-ecommerce-title', model_revision='v1.0.1')
result = ner_pipeline('Nón vành dễ thương cho bé gái')

print(result)
{'output': [{'type': 'product', 'start': 0, 'end': 8, 'span': 'Nón vành'}, {'type': 'style', 'start': 9, 'end': 18, 'span': 'dễ thương'}, {'type': 'consumer_group', 'start': 23, 'end': 29, 'span': 'bé gái'}]}

性能评测

全局评测

Precision Recall F1
80.5 75.2 77.8

按实体类型评测

实体类型 Precision Recall F1
product 81.10 82.00 81.55
brand 77.34 80.54 78.91
pattern 66.48 71.40 68.85
color 86.73 91.26 88.93
consumer_group 94.55 95.85 95.19
style 84.76 90.26 87.42
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论