Our Services

始终以翻译品质、物美价廉,提升您的翻译水准与品味为己任。

文档翻译
Document Translation

专注于法律合同、管理咨询、财经金融、机械制造、生物医药、IT通讯等领域的多语言翻译。

本地化翻译
Localized Translation

提供文档本地化、软件本地化、网站翻译、多媒体本地化、游戏本地化、多语言桌面排版(DTP)等服务。

口译服务
Interpretation Service

提供陪同翻译、会议翻译、会展口译、交替传译、同声传译,以及同传设备租赁等专业服务。

母语审校
Native-speaker Proofreaders

遍布全球的资深母语译员为您提供专业地道的润色审校服务,让您的译文更符合当地的文化习惯和文风要求。

谷歌翻译集成神经网络:机器翻译实现颠覆性突破

所在位置: 翻译公司 > 新闻资讯 > 行业新闻 / 日期:2021-06-28 16:10:29 / 来源:网络

  

谷歌翻译集成神经网络:机器翻译实现颠覆性突破(图1)

 

  谷歌的神经机器翻译系统:架起了人机翻译的鸿沟,昨天在ARXIV.ORG上引入了谷歌的神经机器翻译系统(GNMT),并将机器心翻译成摘要,并将其推荐给网站(www. jqIZHIXix.com)。搜索博客发表了一篇介绍该研究的文章,并宣布GNMT已经投入到非常难的汉英双语的生产中,这引起了业界的极大关注。

  十年前,我们推出了Google Translate,其背后的核心算法是基于短语的机器翻译。攻势仍然是一个艰难的目标。

  今天,我们宣布谷歌神经机器翻译系统(GNMT)的发布,它使用迄今为止最先进的培训技术来实现机器翻译质量的最大改进。对于我们的发现的全部细节,请参阅我们的论文,谷歌的神经。机器翻译系统:弥补人与机器翻译之间的鸿沟(见本文末尾){ 1 }。

  几年前,我们开始使用递归神经网络(RNN)来直接学习输入序列(如一种语言中的句子)到输出序列(另一种语言中的相同句子)的映射。RASE,然后在很大程度上独立地翻译它们。神经机器翻译(Neuro-Machine.,NMT)将整个输入句子作为翻译的基本单位,其优点在于它比以往的基于短语的翻译系统要求更少的工程设计,当NMT被首次提出时,它达到了与基于短语的翻译系统相同的精度。中型公共基准数据集的翻译系统

  从那时起,研究人员提出了许多改进NMT的技术,包括模拟外部对齐模型以处理稀有词{3},使用注意力来对齐输入和输出词{4},以及将词分成更小的单元以处理稀有词{5,6}。NMT的速度和准确性还没有满足成为像Google Translate这样的生产系统的要求。我们的新论文{1}描述了我们如何克服使NMT工作在非常大的数据集上的许多挑战,以及我们如何构建一个足够快速和准确的系统,以便进行打赌。ER翻译谷歌的用户和服务。

  来自比较评估的数据,其中人类评估者比较给定源语句的翻译质量。评分范围从0到6,对于无意义翻译为0,对于完美翻译为6。

  下面的可视化显示了GNMT将汉语句子翻译成英语句子的过程。首先,网络将汉语句子中的单词编码为一列向量,每个向量表示迄今为止所读的所有单词(编码器)的含义。读取后,解码器开始工作——一次生成一个英语句子(Decoder)。为了在每一步中正确地生成翻译后的单词,解码器将重点放在与生成英语单词最相关的编码中文向量的权重分布上(at)。张力和蓝色链接的透明度表明解码器对编码字的关注。

  以人类评价的平行比较为标准,GNMT的翻译与以往的基于短语的制作系统相比有了很大的改进。在双语人类评价员的帮助下,我们测量了来自维基百科和新闻网站的样本句子,发现GNMT减少了翻译。N在多个主要语言对中的误差超过55-85%。

  我们的系统产生一个翻译案例,它的输入句子从一个新闻网站中取样。这个地址(https:驱动器.google.comfiled0B4-Ig7UAZe3BSUYweVo3eVhNY3cviewusp=.)允许您看到来自新闻网站和书籍的输入句子的更多随机取样的翻译样本。

  除了今天发表这篇研究论文,我们还宣布GNMT已经被投入到一个非常困难的语言到英语的翻译中。GNMT产品部署使用我们的开放式机器学习工具包TensorFlow和张量处理单元,它们为部署这些强大的GNMT模型提供足够的计算能力,并满足Google Translate产品的严格延迟要求。nese-to-English翻译是Google Translate支持的10000多种语言对之一,我们将在未来几个月继续将我们的GNMT扩展到更多的语言对。

  机器翻译远未完全解决。GNMT仍然会犯一些人类译者从未犯过的大错误,比如在翻译专有名词或稀有名词时遗漏和错误,以及在不考虑段落或页面上下文的情况下单独翻译句子。为了给我们的用户提供更好的服务,我们还有更多的工作要做。但是GNMT代表了一个重要的里程碑。我们想与过去几年中为这项研究做出贡献的许多研究人员和工程师一起庆祝,无论是来自Google还是来自更广泛的社区。

  Google Brain团队和Google翻译团队参与了这个项目,Nikhil Thorat和Big Picture也帮助可视化了这个项目。

  论文:谷歌神经机器翻译系统:弥补人机翻译的鸿沟

  翻译后摘要:神经机器翻译(NMT)是一种端到端的自动翻译学习方法,有望克服传统的基于短语的翻译系统的缺点,不幸的是,众所周知,NMT系统训练的计算成本和翻译FIE。此外,大多数NMT系统难以处理稀有字,这些问题阻碍了NMT在实际部署和服务中的应用,因为在实际应用中,精度和速度是至关重要的。在这项工作中,我们提出GNMT,谷歌的神经机器翻译。我们的模型由一个深度LSTM网络组成,其中八个编码器和八个解码器使用注意和剩余连接。为了提高并行性和减少训练时间,我们的注意机制将解码器的底层连接到顶层。为了加快最终的翻译速度,我们在推理过程中使用了低精度的操作。为了改进对稀有词的处理,我们将词分成一组有限的公共子词单元,这些子词单元既是输入又是输出。字符界定模型的灵活性和词界定模型的有效性,自然地处理了稀有词的翻译,最终提高了系统的整体精度。激怒生成可能覆盖源语句中所有单词的输出语句。在WMT'14英法英德基准测试中,GNMT取得了与当前最佳结果相当的结果。与基于谷歌的短语系统相比,压缩翻译错误平均为60%。

  { 1 }谷歌神经机器翻译系统:弥补人与机器翻译之间的鸿沟,雍慧武、Mike Schuster、支峰晨、Quoc V. Le、Mohammad Norouzi、Wolfgang Macherey、Maxm KRikun、袁曺、Pig、Y、Y、Y、Y、Y、Yukasz Kaiser,Stephan Gouws,Yoshikiyo Kato,Taku Kudo,Hideto Kazawa,Keith Stevens,George Ku.,Nishant Patil,Wei.,Cliff.,Jason Smith,Jason Riesa,Alex Rudnick,Oriol Vinyals,Greg Corrado,Macduff Hughes,Jeffrey Dean.技术,2016。

  { 2 }序列与神经网络的序列学习,Ilya Sutskever,OrOL Viyales,Quoc V.L.神经信息处理系统的进展,2014。

  { 3 }解决神经机器翻译中的罕见词问题,Minh Thang Luong,Ilya Sutskever,Quoc V. Le,Orio-Viyales,WojCij.ZaRMBA。计算语言学协会第五十三届年会论文集,2015。

  { 4 }神经机器翻译,通过联合学习对齐和翻译,Dzmitry Bahdanau,Kyunghyun Cho,Yoshua Bengio。学习表示国际会议,2015。

  { 5 }日本和韩国的语音搜索,Mike Schuster和Kaisuke Nakajima。IEEE声学、语音和信号处理国际会议,2012。

  { 6 }神经机器翻译罕见词的子词单位,Rico Sennrich,Barry Haddow,Alexandra Birch。计算语言学协会第五十四届年会论文集,2016。

相关阅读 Relate

  • 机器翻译后编辑效果好吗
  • 旅游英语论文:机器翻译及旅游文本的译后编辑
  • 被遗忘的在线翻译行业,现状如何?
  • 行业新闻相关问答
    问:如果翻译的稿件只有几百字,如何收费?
    答:对于不足一千字的稿件,目前有两种收费标准: 1)不足一千字按一千字计算。 2)对于身份证、户口本、驾驶证、营业执照、公证材料等特殊稿件按页计费。
    问:请问贵司的笔译范围?
    答:笔译翻译又称人工笔头翻译, 既通过文字形式的翻译转换, 把源语言翻译成目标语言, 是当今全球经济发展, 政治文化交流的主要方式, 笔译通过文字展现方式, 使全世界上千种语言能够互通有无, 每天都有数以亿计的文字被翻译或转译, 笔译肩负着世界各国经济文化发展的重任, 是各国各民族的文化大使, 我们的笔译领域涉及十大类专业领域和五百多种不同的分领域。
    问:是否可以请高校教师、学者或学生翻译?
    答:绝对不能,风险自负。许多公司在寻找译者时,首先想到的是当地学校或大学的外语院系。有时,这种做法对于供内部使用的翻译可能有效,即,您只想了解文件大意,但对于正式的公司宣传材料、手册或者合同文档而言,这样做却风险极大。外语教学需要有特殊的技能,但这些技能却与翻译一篇流利、优美的文章所需的技能完全不同。让学生来做翻译看起来经济实惠,但风险更高,因为他们毫无实战经验,翻译出来的文件基本无法使用。
    问:翻译交稿时间周期为多长?
    答:翻译交稿时间与您的文件大小以及复杂程度有关。每个专业译者的正常翻译速度为3000-4000中文字/天,对于加急的大型项目,我们将安排多名译员进行翻译,由项目经理将文件拆分成若干文件,分配给不同的译员进行翻译,翻译后由项目经理进行文件的合并,并经统一术语、审校、质控、排版等翻译流程,最终交付给客户。
    问:提供一个网站的网址,能够给出翻译报价吗?
    答:对于网站翻译,如果您能提供网站的FTP,或您从后台将整个网站下载打包给我们,我们可在10分钟内给出精确报价。同时,只要您提供原始网页文件,我们会提供给您格式与原网页完全一致的目标语言版本,可以直接上线使用,省却您的改版时间。
    问:为什么标点符号也要算翻译字数?
    答:①根据中华人民共和国国家标准GB/T 19363.1-2003 对翻译行业服务规范的要求,中文字数统计是以不计空格字符数为计算单位的。标点符号算翻译字数是统一的行业标准。 ②标点符号在不同的语种中,有不同的表达方式,例如中文的标点符号大多是全角的,英文的无特殊设置都是半角的,而且如果一句话或一段内容夹杂两种不同的语言,标点符号的规则就相对复杂,对于翻译文件来说,标点符号的部分也是很费时。 ③另外,标点符号在句子中对句子语境等的限制因素,使得标点对句子、对译员翻译判断等起到一定的要求。所以,该部分也要计算在内。 ④可能我们平时不是很注重标点符号,其实在文字表达中,标点符号的重要不亚于单字单词,一个标点符号可以改变全句话的意思,而我们的工作也是做到了这一点,保证每个标点符号的准确,保证译文表达的意思和原文一样。
    问:需要与你们公司什么人接洽翻译业务呢?
    答:我们公司采取专属客服服务模式。为企业客户配备专属客服,一对一沟通具体翻译需求,组建专属译员团队。
    问:为何每家翻译公司的报价不一样?
    答:大家都知道一分价格一分货,在翻译行业里更为突出,译员的水平是划分等级的。新开的翻译公司或不具备翻译资质的公司为了抢占市场,恶意搅乱,以次充好,低价吸引客户。
    问:为什么数字、字母也要算翻译字数?
    答:根据中华人民共和国国家标准GB/T 19363.1-2003 对翻译行业服务规范的要求,中文字数统计是以不计空格字符数为计算单位的。而数字、字母也是包含在其中。而对翻译公司来说,数字和字母也要算翻译字数的原因还包括以下两个方面: 首先,我们的收费都是根据国家颁布的翻译服务规范来收取翻译费用,对待收费我们都是统一对待的,其次,数字和字母也是文章中的一部分,特别是在一些商务文件中,数字就是文件的主题,所以也是一样要收费的。 另外,纯数字字母需要核对、录入,比翻译一个词语更麻烦,翻译是大脑里面概念形成的,而纯数字字母是要严谨的核对、录入才能实现的,这将会花费更多的时间,所以我们会把数字和字母也算成字数。 但是有一种情况除外,如审计报告里面那种数据很多而且又不需要我们翻译可以直接保留的,这部分我们可以不计算在内。
    问:请问贵司每天的翻译量是多少?
    答:我们公司最高翻译记录为一天翻译50万字。原则上我们会在约定的时间内完成,但是时间和质量是成正比的,慢工才能出细活,我们建议在时间允许的情况下,尽量给译员充足的翻译时间,以便交付优质的译文。
    本站部分内容和图片来源于网络用户和读者投稿,不确定投稿用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的权利,请联系:187348839@qq.com,及时删除。
    Go To Top 回顶部
    • 扫一扫,微信在线