THUMT 神经机器翻译工具包

我要开发同款
匿名用户2017年06月22日
48阅读
开发技术Python
所属分类人工智能、机器学习/深度学习
授权协议BSD

作品详情

THUMT是由清华大学自然语言处理组开发的数据驱动机器翻译系统。

机器翻译是一种自然语言处理任务,其目的是使用计算机自动翻译自然语言。近几年来,端到端的神经机器翻译发展迅速,已经成为机器翻译系统的新主流。

THUMT是用于神经机器翻译的开源工具包,构建于Theano之上,具有以下特点:

基于 Attention 的翻译模型。THUMT应用了标准的attention编码器-解码器框架。

最低风险训练。除了标准最大似然估计(MLE)之外,THUMT还支持最小风险训练(MRT),其目的是找到一组模型参数,以最小化使用训练数据评估指标(如BLEU)计算的预期损失。

使用单一语言语料库:THUMT为NMT提供了半监督训练(SST)能力,能够利用丰富的单语语料库资源来改善源-目标和目标-源NMT模型的学习。

可视化。为了更好地了解NMT的内部工作,THUMT提供了一个可视化工具来演示每个中间状态与其相关语境之间的相关性。

声明:本文仅代表作者观点,不代表本站立场。如果侵犯到您的合法权益,请联系我们删除侵权资源!如果遇到资源链接失效,请您通过评论或工单的方式通知管理员。未经允许,不得转载,本站所有资源文章禁止商业使用运营!
下载安装【程序员客栈】APP
实时对接需求、及时收发消息、丰富的开放项目需求、随时随地查看项目状态

评论