datasets:
trai: idexig:
results: 本模型使用StructBERT作为预训练模型底座,使用句子对分类计算交叉熵的方式进行训练。
模型结构如下图所示: 日常生活中输入的地址文本可以为以下几种形式: 包含四级行政区划及路名路号POI的规范地址文本; 地址要素缺省的规范地址文本,例:只有路名+路号、只有POI; 非规范的地址文本、口语化的地址信息描述,例:阿里西溪园区东门旁亲橙里; 地址相似度匹配模型主要是对输入的两条地址,评估他们之间的相似程度,输出完全相关(exactmatch)、部分相关(partialmatch)、不相关(ot_match)这三个标签类型的概率。 用户可以自行尝试输入中文句子。具体调用方式请参考代码示例。 在安装ModelScope完成之后即可使用lpstructbertaddress-matchchiesebase(地址相似度匹配)的能力, 默认两个句子长度加起来不超过512。 本模型基于ccks2021-addrsim数据集上训练,请用户自行评测后决定如何使用。 模型在ccks2021-addrsim测试数据评估结果:
地址相似度匹配介绍
模型描述
期望模型使用方式以及适用范围
如何使用
代码范例
kk```pytho
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
pipelie_is = pipelie(
task=Tasks.text_classificatio, model='damo/lp_structbert_address-matchig_chiese_base')
prit(pipelie_is(iput=('北京航空航天大学逸夫楼', '北京航空航天大学图书馆')))
# {'scores': [0.005042273085564375, 0.14676348865032196, 0.8481942415237427], 'labels': ['exact_match', 'ot_match', 'partial_match']}
模型局限性以及可能的偏差
训练数据介绍
数据评估及结果
Dataset
Accuracy
ccks2021-addrsim
83.86
点击空白处退出提示
评论