本模型基于邻域最小风险优化策略,backboe选用先进的trasformer-large模型,编码器和解码器深度分别为24和6,相关论文已发表于ACL 2022,并获得Outstadig Paper Award。 基于连续语义增强的神经机器翻译模型【论文链接】由编码器、解码器以及语义编码器三者构成。其中,语义编码器以大规模多语言预训练模型为基底,结合自适应对比学习,构建跨语言连续语义表征空间。此外,设计混合高斯循环采样策略,融合拒绝采样机制和马尔可夫链,提升采样效率的同时兼顾自然语言句子在离散空间中固有的分布特性。最后,结合邻域风险最小化策略优化翻译模型,能够有效提升数据的利用效率,显著改善模型的泛化能力和鲁棒性。 具体来说,我们将双语句子对两个点作为球心,两点之间的欧氏距离作为半径,构造邻接语义区域(即邻域),邻域内的任意一点均与双语句子对语义等价。为了达到这一点,我们引入切线式对比学习,通过线性插值方法构造困难负样例,其中负样本的游走范围介于随机负样本和切点之间。然后,基于混合高斯循环采样策略,从邻接语义分布中采样增强样本,通过对差值向量进行方向变换和尺度缩放,可以将采样目标退化为选择一系列的尺度向量。 本模型适用于具有一定数据规模(百万级以上)的所有翻译语向,同时能够与离散式数据增强方法(如back-traslatio)结合使用。 在ModelScope框架上,提供输入源文,即可通过简单的Pipelie调用来使用。 如果你觉得这个该模型对有所帮助,请考虑引用下面的相关的论文:基于连续语义增强的神经机器翻译模型介绍
温馨提示
模型描述
期望模型使用方式以及适用范围
如何使用
代码范例
# 温馨提示: 使用pipelie推理及在线体验功能的时候,尽量输入单句文本,如果是多句长文本建议人工分句,否则可能出现漏译或未译等情况!!!
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
iput_sequece = 'Elo Musk, cofudador y director ejecutivo de Tesla Motors.'
pipelie_is_es2e = pipelie(Tasks.traslatio, model='damo/lp_csamt_traslatio_es2e')
pipelie_is_e2zh = pipelie(Tasks.traslatio, model='damo/lp_csamt_traslatio_e2zh')
privot_sequece_e = pipelie_is_es2e(iput=iput_sequece)['traslatio']
outputs = pipelie_is_e2zh(iput=privot_sequece_e)
prit(outputs['traslatio'])
# 支持batch推理
# 温馨提示: 使用pipelie推理及在线体验功能的时候,尽量输入单句文本,如果是多句长文本建议人工分句,否则可能出现漏译或未译等情况!!!
from modelscope.pipelies import pipelie
from modelscope.utils.costat import Tasks
batch_iput_sequeces = ['Elo Musk, cofudador y director ejecutivo de Tesla Motors.', 'La misió de Alibaba Group es hacer egocios si dificultad e el mudo.', '¿Cómo está el tiempo hoy?']
iput_sequece = '<SENT_SPLIT>'.joi(batch_iput_sequeces) # 用特定的连接符<SENT_SPLIT>,将多个句子进行串联
pipelie_is_es2e = pipelie(Tasks.traslatio, model='damo/lp_csamt_traslatio_es2e')
pipelie_is_e2zh = pipelie(Tasks.traslatio, model='damo/lp_csamt_traslatio_e2zh')
privot_sequece_e = pipelie_is_es2e(iput=iput_sequece)['traslatio']
outputs = pipelie_is_e2zh(iput=privot_sequece_e)
prit(outputs['traslatio'].split('<SENT_SPLIT>'))
数据评估及结果
WMT18 (阿里翻译内部生产)
Remark
DeepL
27.8
Google
33.4
ModelScope
论文引用
@iproceedigs{wei-etal-2022-learig,
title = {Learig to Geeralize to More: Cotiuous Sematic Augmetatio for Neural Machie Traslatio},
author = {Xiagpeg Wei ad Heg Yu ad Yue Hu ad Rogxiag Weg ad Weihua Luo ad Rog Ji},
booktitle = {Proceedigs of the 60th Aual Meetig of the Associatio for Computatioal Liguistics, ACL 2022},
year = {2022},
}
点击空白处退出提示
评论