机器翻译(Machine Translation ,简称MT)的质量和准确性在过去几年有了很大提高。软件中的词库扩充了,翻译速度加快了,人们采取了许多方法提高翻译软件的功能,使之不仅能翻译句子,更能表现出句子所在的场景。
尽管在技术上有了重大改进,人为因素仍是获得高质量译文的重要因素。人们在选择MT软件之前,首先要弄清楚什么样的原文适合用机器翻译。几乎所有MT 软件都有以下两个主要特征。一是软件都选定一个最小的可翻译的“段落”,常常是一句话。翻译时软件可依次将译好的一个个段落,也就是一个个句子存入范句库。范句库内存随着翻译的进行不断扩充,即翻译记忆( Translation Memory) 在增大。每遇到一个新的段落时,机器就会在范句库内进行搜索。程序的搜索速度极快,即使在有大量翻译记忆时也是如此,因此人们不觉得停顿下来等待机器为目前的段落找到匹配的译文。如果该句子恰好已经被翻译过了,软件将立即提出译文。当然,一个软件只能找出与以前译好的段落完全匹配的译文是远远不够的。
因此,MT 软件的第二个显著特征就是能够在翻译记忆中搜索到与要处理的段落相似的范句提供给软件使用者。人们称之为“模糊匹配”(Fuzzy Matching) 。人们用百分数来表示相似程度,设置一个临界值,一旦超过它,计算机就将相似的范句认定为可能的译文。以上两点,即快速搜索和模糊匹配是所有MT 软件的共同特征。另外,不同的软件还有各自的特点。
基于以上两个特征,那些在内容上有很大重复性的原文可以使用MT 软件。许多技术文件(如使用手册) 需要被反复修改,但是内容和形式大体相似。它们的一种译文一旦被储存下来,更新某一部分变得十分简单。翻译这些文件使用MT 软件十分合适,而且篇幅越长,优越性越明显。长达几百页的技术手册用机器翻译时,省力,又能保证风格前后一致,避免了人工翻译中不同的译者选择不同的词汇。人们可以采取一些方法最大限度地发挥翻译软件的能力。能否拿来软件就开始翻译呢? 可以这样说,最关键的步骤是把原文输入软件之前,要适当地对原文加以整理,比如检查错别字和句子语法是否通顺,这样才能节省大量的校对时间。
以下是一些用来帮助人们对原文进行有效处理的迅速、简便的方法。
1 确保原文的计算机可读格式用户可以使用人工录入或扫描仪扫描的方法输入原文。使用扫描仪时,原文的一些字母和标点符号可能会变成乱码。扫描所引起的误差在很大程度上受扫描仪品牌和识别文字的OCR 软件的影响。众所周知,MT 软件如不能识别某一单词或字符必然不能进行正确的翻译。因此,尽管文件原文完美无缺,也有必要对扫描以后生成的文件进行校对。另外,计算机不会识别拼写错误的单词,它或者不能翻译,或者译错,给校对人员造成很大的困难,同时也浪费了时间。与其如此,不如输入之前将原文用拼写检查工具或人工检查一遍,确保没有遗漏拼错的单词。
2 使用控制语言所谓控制语言,指的是使用的语言局限于一些词汇和语法规则。局限于一些词汇可以使MT系统无需总要添加新词,而将更多的效力放在寻找正确的词条上。其次,人们应该检查语法和句子结构,使之更适合于机器翻译。
211 原文句子力求短小尽量避免使用冗长的复句,否则,系统在分析句子时经常会遇到困难,句子越长,越能加重不确定性。
212 句子符合语法翻译人员也许会将一篇很糟糕的文章翻译得很漂亮,但是MT 软件不可能做到这一点。
差劲的原文意味着差劲的译文。无论MT 系统是否使用语言学知识来分析句子,正确、简单的句子总能够避免不必要的问题,因而提高译文的质量。采用语法结构正确,形式简单的语句会使系统工作得更加顺畅,减少歧义,因而大大提高翻译质量。例如:
A. New toner unit s are held level during installation and ,since they do not as supplied contain toner ,must be filled prior to installationf rom a toner cart ridge.
可以改为:
B. Fill the new toner unit with toner f rom atoner cart ridge. Hold the new toner unit levelwhile you put it inthe printer.
B 句中用多个简单句取代A 句中的复句,并按照操作顺序,采用祈使句给予指令,清晰明了,易于翻译。
213 消除或更改歧义句或词组例如: Cleaning fluids can be dangerous. 这个句子有歧义,如果是指清洁液体的行为很危险,可以改成Cleaning fluids is dangerous ;如果想说用于清洁的液体很危险则可以用Cleaningfluidsare dangerous.
3 进行预翻译,扩充用户词典完成上述两个步骤之后,笔者建议还不能马上开始翻译工作,而应该进行预翻译———将原文首次通过MT 软件。虽然软件的结构各有不同,但是大多数软件允许用户在翻译之前选择翻译文本的体裁(比如,是商业文章或是说明书或是个人信函) 。此外,有的科技翻译专业软件为用户提供词汇库的选择,如化工,航天,机械,水利,石油,环境,能源,医学,经贸,计算机或电子通信等。最后而且是非常关键的一步是扩充用户词库。大多数MT 软件都装有允许用户加入新词的自定义库,词汇库,范句库。
正确使用用户自定义词库可以极大地提高当前译文及以后所有译文的质量。较好的软件会让用户建立一个“未知或待发现单词表”由用户添加新词或词组。即使是版本较低的软件,用户也能打印预翻译的译文,人工检索未识别的单词,然后手工录入到软件词库中以备后用。也许有人认为这一步骤过于繁琐耽误时间,但是比起翻译以后逐字逐句修改,以及今后翻译时再添加这个新词到词库中,这种貌似费时的办法还是值得的,正所谓“磨刀不误砍柴功”。
在对原文进行格式上、语言上的改进和对软件词库进行补充后,就可以从容地使用MT软件进行正式翻译了。不难发现,经过预翻译的译文比直接翻译的译文在质量上会有很大提高,软件用户可以收到事半功倍的翻译效果。
天津大学社会科学与外国语学院 天津理工学院国际交流处
贾欣岚 张健青