XLM-R命名实体识别-越南语-电商领域(搜索query)-base

我要开发同款
匿名用户2024年07月31日
31阅读
所属分类ai、xlm-roberta、pytorch、信息抽取、NER、Alibaba、F1、nlp
开源地址https://modelscope.cn/models/iic/nlp_xlmr_named-entity-recognition_viet-ecommerce-query
授权协议Apache License 2.0

作品详情

越南语电商域Query NER介绍

模型描述

本方法采用Transformer-CRF模型,使用XLM-RoBERTa(XLM-R)作为预训练模型底座。本模型主要用于给输入越南语搜索query文本产出命名实体识别结果, 具体调用方式请参考代码示例。

训练数据介绍

  • ecom-query-vi: 内部越南语电商领域搜索query命名实体识别(NER)数据集, 支持产品(product), 功能(function), 品牌(brand), 模式(pattern), 颜色(color), 用户群体(consumer_group), 风格(style)等七大类型的实体识别
实体类型 英文名
产品 product
功能 function
品牌 brand
图案 pattern
颜色 color
用户群体 consumer_group
风格 style

快速上手

适用范围

在安装ModelScope完成之后即可使用named-entity-recognition(命名实体识别)的能力, 默认单句长度不超过512, 推荐输入长度不超过128的句子。

代码示例

from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

ner_pipeline = pipeline(Tasks.named_entity_recognition, 'damo/nlp_xlmr_named-entity-recognition_viet-ecommerce-query', model_revision='v1.0.1')
result = ner_pipeline('quần áo cổ trang cho búp bê')

print(result)
#{'output': [{'type': 'product', 'start': 0, 'end': 7, 'span': 'quần áo'}, {'type': 'style', 'start': 8, 'end': 16, 'span': 'cổ trang'}, {'type': 'function', 'start': 21, 'end': 27, 'span': 'búp bê'}]}

性能评测

全局评测

Precision Recall F1
74.9 76.6 75.7

按实体类型评测

实体类型 Precision Recall F1
product 76.88 78.60 77.73
function 60.62 61.43 61.02
brand 69.21 74.92 71.95
pattern 68.65 67.58 68.11
color 90.91 80.00 85.11
consumer_group 92.02 93.01 92.51
style 68.09 65.31 66.67
声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论