如何评价Google神经机器翻译(GNMT)系统?
所在位置: 翻译公司 > 新闻资讯 > 行业新闻 / 日期:2017-09-20 17:40:35 / 来源:网络
翻译有纯人工翻译,还有借助电脑的机器辅助翻译(CAT,computer assisted/aided translation),还有传统的机器翻译(MT,machine translation)。
传统的机器翻译据说源于上世纪五六十年代的美国,为了破解苏联的大量俄语文件而研制。它的原理是词汇间的一一对应,可以想见,产出的译文肯定是不通的,或许只能大体看出原文在探讨的主题。这样的翻译模式或者思路,在翻译天气预报这种语汇固定的文本上有一定用处。据说加拿大魁北克地区曾用这种方式播报双语天气预报。
机器辅助翻译是指利用Trados或者wordfast这种工具,它的核心原理在于translation memory,即翻译记忆语料库。软件工具把之前翻译过的或者集中导入的双语语料储存起来,遇到相似程度高的原文时,自动调出之前的译文,译者在其基础上修改,完成最终的译文。其翻译单位为句子。
以上介绍的基于语汇一一对应的机器翻译和基于翻译记忆数据库的CAT,其实代表了实现人工智能的两个思路。我自己只是搞翻译的,对于人工智能不太懂,但机器/电脑翻译属于人工智能的范畴。人工智能的关键在于教会机器你想让它认知的东西,对于如何教,有两个思路。
举一个我在TED演讲中听过的一个例子。
演讲者从事的是图像识别软件的开发。一开始采取的套路是通过描述画面来教会机器识别事物。比如给猫设置圆脸、尖耳朵、长尾巴等参数,但是效果很差,机器识别了站立着的猫,就识别不了坐着的猫。
后来研发者换了一个思路,模拟人类孩童是如何认识猫的见的多了,就知道这样的是猫了(孩子并不会去分析原来圆脸、尖耳朵、长尾巴的才是猫)。于是将大量猫咪的图片存入机器,并告诉它这是猫,后来机器遇到类似的图片,就能识别出是猫。已有数据库越大,机器识别得就越准确。
个人认为质量较高的机器/电脑翻译的实现,也要采取这后一种思路,即基于大量双语语料的记忆和学习让机器记住什么样的话是什么意思,而不是将语句分解为单个词汇再去找它们在另一个语言中的对应。
根源还是语言的复杂性,无论是哪两种语言之间,都不像二进制和十进制之间那样可以实现一一对应,所以第一种思路的发展前途已经很局限。而第二个思路或许就是以后的方向,互联网实现的大量语料共享也为它的发展提供了可能。
------------------------------------
关于如何看待机器/线上翻译的进步:
虽然我自己是个翻译匠,而且厌恶把线上翻译随便改改交差的译员,但是对机器/电脑/线上翻译本身心存亲切它毕竟不是人,不要笑话它。
它对于译者也有用处,对于某些语汇(不是整句整段),它给的译文由于基于大量现有语料,往往确实是业内人士用的比较多的说法。
所以大家不要看到机器翻译产生可笑译文就拿来调侃,该被调侃的是那些敢用这些译文的人。
而且,没有必要恐慌自己会被取代(前提是你的水平远高于机器);机器差的还比较远如果你知道语言可以美到、精到、妙到什么程度,如果你明白很多时候它就是人的灵光一现的、独一无二的、偶然的产物,就不会怀疑这一点。
相关阅读
Relate
如何选择国际专利翻译公司
如何充分利用AI技术提升翻译效率
如何选择珠海翻译公司 口碑评价
行业新闻相关问答
问:如果翻译的稿件只有几百字,如何收费?
答:对于不足一千字的稿件,目前有两种收费标准: 1)不足一千字按一千字计算。 2)对于身份证、户口本、驾驶证、营业执照、公证材料等特殊稿件按页计费。
问:请问贵司的笔译范围?
答:笔译翻译又称人工笔头翻译, 既通过文字形式的翻译转换, 把源语言翻译成目标语言, 是当今全球经济发展, 政治文化交流的主要方式, 笔译通过文字展现方式, 使全世界上千种语言能够互通有无, 每天都有数以亿计的文字被翻译或转译, 笔译肩负着世界各国经济文化发展的重任, 是各国各民族的文化大使, 我们的笔译领域涉及十大类专业领域和五百多种不同的分领域。
问:是否可以请高校教师、学者或学生翻译?
答:绝对不能,风险自负。许多公司在寻找译者时,首先想到的是当地学校或大学的外语院系。有时,这种做法对于供内部使用的翻译可能有效,即,您只想了解文件大意,但对于正式的公司宣传材料、手册或者合同文档而言,这样做却风险极大。外语教学需要有特殊的技能,但这些技能却与翻译一篇流利、优美的文章所需的技能完全不同。让学生来做翻译看起来经济实惠,但风险更高,因为他们毫无实战经验,翻译出来的文件基本无法使用。
问:翻译交稿时间周期为多长?
答:翻译交稿时间与您的文件大小以及复杂程度有关。每个专业译者的正常翻译速度为3000-4000中文字/天,对于加急的大型项目,我们将安排多名译员进行翻译,由项目经理将文件拆分成若干文件,分配给不同的译员进行翻译,翻译后由项目经理进行文件的合并,并经统一术语、审校、质控、排版等翻译流程,最终交付给客户。
问:提供一个网站的网址,能够给出翻译报价吗?
答:对于网站翻译,如果您能提供网站的FTP,或您从后台将整个网站下载打包给我们,我们可在10分钟内给出精确报价。同时,只要您提供原始网页文件,我们会提供给您格式与原网页完全一致的目标语言版本,可以直接上线使用,省却您的改版时间。
问:为什么标点符号也要算翻译字数?
答:①根据中华人民共和国国家标准GB/T 19363.1-2003 对翻译行业服务规范的要求,中文字数统计是以不计空格字符数为计算单位的。标点符号算翻译字数是统一的行业标准。
②标点符号在不同的语种中,有不同的表达方式,例如中文的标点符号大多是全角的,英文的无特殊设置都是半角的,而且如果一句话或一段内容夹杂两种不同的语言,标点符号的规则就相对复杂,对于翻译文件来说,标点符号的部分也是很费时。
③另外,标点符号在句子中对句子语境等的限制因素,使得标点对句子、对译员翻译判断等起到一定的要求。所以,该部分也要计算在内。
④可能我们平时不是很注重标点符号,其实在文字表达中,标点符号的重要不亚于单字单词,一个标点符号可以改变全句话的意思,而我们的工作也是做到了这一点,保证每个标点符号的准确,保证译文表达的意思和原文一样。
问:需要与你们公司什么人接洽翻译业务呢?
答:我们公司采取专属客服服务模式。为企业客户配备专属客服,一对一沟通具体翻译需求,组建专属译员团队。
问:为何每家翻译公司的报价不一样?
答:大家都知道一分价格一分货,在翻译行业里更为突出,译员的水平是划分等级的。新开的翻译公司或不具备翻译资质的公司为了抢占市场,恶意搅乱,以次充好,低价吸引客户。
问:为什么数字、字母也要算翻译字数?
答:根据中华人民共和国国家标准GB/T 19363.1-2003 对翻译行业服务规范的要求,中文字数统计是以不计空格字符数为计算单位的。而数字、字母也是包含在其中。而对翻译公司来说,数字和字母也要算翻译字数的原因还包括以下两个方面:
首先,我们的收费都是根据国家颁布的翻译服务规范来收取翻译费用,对待收费我们都是统一对待的,其次,数字和字母也是文章中的一部分,特别是在一些商务文件中,数字就是文件的主题,所以也是一样要收费的。
另外,纯数字字母需要核对、录入,比翻译一个词语更麻烦,翻译是大脑里面概念形成的,而纯数字字母是要严谨的核对、录入才能实现的,这将会花费更多的时间,所以我们会把数字和字母也算成字数。
但是有一种情况除外,如审计报告里面那种数据很多而且又不需要我们翻译可以直接保留的,这部分我们可以不计算在内。
问:请问贵司每天的翻译量是多少?
答:我们公司最高翻译记录为一天翻译50万字。原则上我们会在约定的时间内完成,但是时间和质量是成正比的,慢工才能出细活,我们建议在时间允许的情况下,尽量给译员充足的翻译时间,以便交付优质的译文。