网易首页 > 网易号 > 正文 申请入驻

哈佛大学NLP组开源神经机器翻译工具包OpenNMT

0
分享至

选自OpenNMT

机器之心编译

参与:吴攀

神经机器翻译是近段时间以来推动机器翻译发展的主要推动力。今天,哈佛大学自然语言处理研究组(Harvard NLP)宣布开源了其研发的神经机器翻译系统 OpenNMT,该系统使用了 Torch 数学工具包。该研究组在官网上表示该系统已经达到生产可用的水平(industrial-strength)。

  • 官网:http://opennmt.net

  • 代码:https://github.com/opennmt/opennmt

  • 演示:https://demo-pnmt.systran.net

  • Docker 容器:https://hub.docker.com/r/harvardnlp/opennmt

OpenNMT 可以像主要的翻译服务提供商的已投入生产的系统那样使用。该系统简单易用,易于扩展,同时也能维持效率和当前最佳的翻译准确度。

其特性包括:

  • 简单的通用型接口,仅需要源文件和目标文件;

  • 为高性能 GPU 训练进行了速度和内存优化;

  • 可以提升翻译性能的最新研究的特性;

  • 有多个语言对的预训练好的模型(即将到来);

  • 允许其它序列生成任务的扩展,比如归纳总结和图像到文本生成。

安装

OpenNMT 仅需要一次 vanilla torch/cutorch 安装。它要使用 nn、nngraph 和 cunn。有(CUDA)Docker 容器可选。

快速启动

OpenNMT 包含三条指令:

1)预处理数据

th preprocess.lua -train_src data/src-train.txt -train_tgt data/tgt-train.txt -valid_src data/src-val.txt -valid_tgt data/tgt-val.txt -save_data data/demo

2)训练模型

th train.lua -data data/demo-train.t7 -save_model model

3)翻译句子

th translate.lua -model model_final.t7 -src data/src-test.txt -output pred.txt

查看指南了解更多:http://opennmt.github.io/Guide

研究

其中主要的模型基于论文 Neural Machine Translation by Jointly Learning to Align and Translate Bahdanau et al. ICLR 2015 和 Effective Approaches to Attention-based Neural Machine Translation, Luong et al. EMNLP 2015。

在基本模型上,还有大量可选项,这都要感谢SYSTRAN(http://www.systransoft.com/)的出色工作。特别地,下面是一些实现的功能:

  • Effective Approaches to Attention-based Neural Machine Translation . Luong et al., EMNLP 2015.

  • Character-based Neural Machine Translation. Costa-Jussa and Fonollosa, ACL 2016.

  • Compression of Neural Machine Translation Models via Pruning . See et al., COLING 2016.

  • Sequence-Level Knowledge Distillation . Kim and Rush., EMNLP 2016.

  • Deep Recurrent Models with Fast Forward Connections for Neural Machine Translation . Zhou et al, TACL 2016.

  • Guided Alignment Training for Topic-Aware Neural Machine Translation . Chen et al., arXiv:1607.01628.

  • Linguistic Input Features Improve Neural Machine Translation . Senrich et al., arXiv:1606.02892

声明

OpenNMT 的实现使用了以下项目的代码:

  • Andrej Karpathy 的 char-rnn:https://github.com/karpathy/char-rnn

  • Wojciech Zaremba 的 LSTM:https://github.com/wojzaremba/lstm

  • Element RNN 库:https://github.com/Element-Research/rnn

证书

MIT

责任编辑:齐亚伦_NT4779

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网友称浙江余姚一河道链条护栏为塑料材质,浙江余姚官方确认:属实,马上全换

网友称浙江余姚一河道链条护栏为塑料材质,浙江余姚官方确认:属实,马上全换

小陆搞笑日常
2026-05-23 14:05:37
《给阿嬷的情书》再夺全球冠军,打破12项纪录,票房剑指20亿

《给阿嬷的情书》再夺全球冠军,打破12项纪录,票房剑指20亿

影视高原说
2026-05-23 14:56:48
神秘的非洲努尔族:为了延续后代不择手段,连女人也可以当丈夫

神秘的非洲努尔族:为了延续后代不择手段,连女人也可以当丈夫

掠影后有感
2026-05-22 10:32:10
不会拍就别瞎拍!看张艺谋的《主角》,才知何为真正的底层老百姓

不会拍就别瞎拍!看张艺谋的《主角》,才知何为真正的底层老百姓

糊咖娱乐
2026-05-22 15:13:07
王鹤棣后续:和沈月微信互删、掉粉超百万,更多黑料被扒出

王鹤棣后续:和沈月微信互删、掉粉超百万,更多黑料被扒出

老黯谈娱
2026-05-24 09:03:42
1052名开国将帅的军衔大体公正,只有3人授衔过低,存在遗憾

1052名开国将帅的军衔大体公正,只有3人授衔过低,存在遗憾

王鶔吃吃喝喝
2026-05-23 14:20:51
北京内城河湖为何进行大规模换水?水务部门揭秘

北京内城河湖为何进行大规模换水?水务部门揭秘

首都之窗
2026-05-23 15:40:41
我72岁住院一个月,看清儿女本心:68万拆迁款,我决定不再偏袒

我72岁住院一个月,看清儿女本心:68万拆迁款,我决定不再偏袒

王二哥老搞笑
2026-05-24 09:56:52
大渡河装机破2000万千瓦!我国第五大水电基地,悄悄改变了什么?

大渡河装机破2000万千瓦!我国第五大水电基地,悄悄改变了什么?

科学知识点秀
2026-05-24 08:00:21
没想到,马斯克离开中国才一天,78岁母亲一句话让中国网友破防

没想到,马斯克离开中国才一天,78岁母亲一句话让中国网友破防

林轻吟
2026-05-21 19:28:55
英国博主坐中国高铁连发十条推特破防:你们管时速三百五叫慢车?

英国博主坐中国高铁连发十条推特破防:你们管时速三百五叫慢车?

李子橱
2026-05-23 11:35:10
无奈,哈登出场41分钟&15中8取19分5板5助5失误,正负值-8

无奈,哈登出场41分钟&15中8取19分5板5助5失误,正负值-8

懂球帝
2026-05-24 11:07:42
姐弟恋修成正果!又一00后乒乓球名将结婚,23岁喜迎事业爱情双丰收

姐弟恋修成正果!又一00后乒乓球名将结婚,23岁喜迎事业爱情双丰收

体坛小二哥
2026-05-23 22:36:53
十七八岁的刘亦菲真的好漂亮,这是当年拍摄神雕侠侣现场拍摄的

十七八岁的刘亦菲真的好漂亮,这是当年拍摄神雕侠侣现场拍摄的

观星赏月
2026-05-23 16:00:38
大货车拉34吨面粉被雨淋湿,本以为要赔,老板娘一句话让他泪目

大货车拉34吨面粉被雨淋湿,本以为要赔,老板娘一句话让他泪目

一丝不苟的法律人
2026-05-23 13:00:47
网友调侃张天爱,裙口低得太厉害,感觉衣服都快包不住了

网友调侃张天爱,裙口低得太厉害,感觉衣服都快包不住了

可乐谈情感
2026-05-23 18:23:19
周姓喜剧演员是朱氏后裔?实乃臆想

周姓喜剧演员是朱氏后裔?实乃臆想

风铃草语
2026-05-24 10:12:43
2年升值25倍新星夺冠后洒泪告别 为何国米和布鲁日都觉得亏了

2年升值25倍新星夺冠后洒泪告别 为何国米和布鲁日都觉得亏了

国际足球冷雪
2026-05-23 07:07:22
筑牢文化根基 激发创新活力——2026文化强国建设高峰论坛综述

筑牢文化根基 激发创新活力——2026文化强国建设高峰论坛综述

新华社
2026-05-23 19:15:03
F1蒙特利尔:迈凯伦爆发无用,拉塞尔绝杀队友夺杆位!

F1蒙特利尔:迈凯伦爆发无用,拉塞尔绝杀队友夺杆位!

体育妞世界
2026-05-24 09:49:26
2026-05-24 11:32:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13064文章数 142652关注度
往期回顾 全部

科技要闻

我戴着摄像头上班,正在帮AI抢走我饭碗

头条要闻

媒体:毛焦尔上任后 匈牙利对乌克兰政策"又变回去了"

头条要闻

媒体:毛焦尔上任后 匈牙利对乌克兰政策"又变回去了"

体育要闻

少年意气,正在改变中国足球

娱乐要闻

《浪姐7》三公,王濛赢麻了,张月实惨

财经要闻

爆炸致82人遇难 留神峪煤业存违法行为

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

艺术
旅游
教育
时尚
手机

艺术要闻

蒋中正3字题匾有错字,学书法,什么最重要?

旅游要闻

看北京|北海太平花盛放,红墙白蕊引客寻香

教育要闻

10所低分可上的公办本科,2026艺考志愿的捡漏机会来了

初夏少不了一条白色长款连衣裙,真是温柔白月光,百搭不出错

手机要闻

苹果绝对王者,华为国产第一,vivo、小米呢?

无障碍浏览 进入关怀版