翻译文献 | 大数据时代译者的搜索能力探究
摘要:本文首先讨论了大数据时代信息化技术发展对翻译能力的影响,引入了"搜商"的概念,指出,搜商是职业译员能力的重要组成部分,进而阐述了译者搜索能力的基本构成。文章最后指出,译者的搜索能力研究为进一步解析翻译能力提供了新的研究视角,拓展了对传统翻译能力的认识,对职业化翻译人才培养具有重要的启示意义。
关键词:大数据时代 翻译能力 搜索能力 搜商
引言:大数据是指无法在一定时间内用常规机器和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。国际数据集团(IDC)的研究表明,2009年全球的数据量为0.8ZB,2020年全球产生和复制的数据量将超过35ZB,是2009年的44倍(Gantze,2010)。在信息量呈几何级数增长的大数据时代,翻译的需求也在激增,对翻译的时间、速度和质量要求也在不断提高,如何在单位时间内获取专业的信息,提高翻译效率和产能,这就对翻译工作者的搜索能力提出了严峻的挑战。
国内外翻译能力研究的缺失
在国外,德利尔认为,除了语言能力外,翻译能力还包括了理解能力、重新表达能力和知识能力。Hatim和Mason认为翻译能力包含:原文处理能力、转换能力、译文处理能力。由于时代的局限性,前人关于翻译能力的论述未能体现大数据时代翻译行业对译员翻译能力的客观要求。PACTE团队认为,翻译能力包含了双语能力、语际能力,翻译知识、工具使用能力、策略能力、生理心理能力这六大方面,较早提出了工具使用能力的概念。EMT专家团队认为,翻译能力包括了翻译服务提供能力、语言能力、跨文化能力、信息挖掘能力、主题能力和技术能力。难能可贵的是,他们提出的信息挖掘能力包含了如何使用工具和搜索引擎获取所需信息这一方面。不难发现,工具使用能力和搜索能力已开始进入翻译能力讨论范畴,但这些讨论鲜有对搜索能力进行深入的研究和探讨。
在国内,文军将翻译能力归纳为:语言/文本能力、策略能力和自我评估能力。苗菊则认为翻译能力应该包括:认知能力、语言能力、交际能力。马会娟认为,由主题知识、百科知识和文化能力构成的语言外能力和查询工具的能力是保障翻译质量的外围条件。刘和平将翻译能力划分为四大组成部分,即双语能力、分析综合抉择能力、语篇处理能力和职业能力。其中,职业能力主要包括翻译工具和翻译资源的使用能力和译员的职业道德。冯全功指出,在职业翻译能力中,不仅有翻译工具(软件)的运用能力,还有译员信息检索能力。
综上所述,虽然不少学者提到了信息检索在翻译过程中的作用及其应用策略,但并没有明确指出搜索能力是译者翻译能力的一部分。由于时代的限制,传统意义上的翻译能力都集中于译员的语言、知识思维能力上。对搜索能力鲜有深入、系统的探讨。另外,为数不多的关于检索技术是如何辅助译员进行翻译工作的讨论,也都基本集中在利用搜索引擎、学术数据库辅助翻译的具体实践上,并没有站在译员翻译能力的高度,对译员搜索能力的内涵及培养进行系统的论述。
笔者在对翻译能力经过系统研究之后,首次明确提出了翻译技术能力这一概念。并指出搜索能力是翻译技术能力的重要组成部分。在大数据时代,如何提升译者的搜索能力或者搜商,在单位时间内快速获取所需要的信息知识,是当代翻译教育工作者必须面对的问题。
新时代译者的"搜商"研究
2.1译者的"搜商"
搜商的全称是搜索智力,是人类通过某种手段获取新知识的能力。搜商的本质特征是搜索,搜索使得搜商明显地区别于智商和情商。搜商是知识和时间的商数,其更关注于获取有效知识的效率。而效率问题也正是传统的智商和情商所不能度量的问题。因此,搜商是一种与智商、情商并列的人类智力因素,也是人类在信息时代需要具备的第三种能力。
大数据时代,信息更新速度和信息量同步剧增。翻译水平不仅取决于译者自身知识储备以及语言水平高低,还取决于从海量的信息中获取所需信息和知识的快慢。在语言服务全球化背景下,译者通常要在紧急的时间中面对自己不熟悉,甚至是完全陌生的任务。这时候查阅纸质词典根本无法解决问题,而译者高效利用信息平台,搜索、提取和总结信息的能力便成为关键。在互联网和本地计算机上快速、准确查找自己所需要的资源已经成为一个译者必备的基本素质。上述这些是译者进行翻译活动所具备的定向的搜索能力,这就是译者的"搜商"。
2.2"搜商"对翻译的作用
译者的搜商直接关系到他在翻译中通过搜索获取有效信息的效率,是决定译者在现代翻译行业中是否具备核心竞争力的关键。对于大数据时代的译者而言,其搜商的高低直接影响其翻译能力,对其翻译工作具有十分重要的作用。
2.2.1查找翻译背景知识
译者在项目执行中,常常会碰到因为背景知识不了解而不能准确翻译的情况。这时,译者就可以通过选择适当关键词和查询方法,利用搜索引擎检索背景知识。
2.2.2查找人名、地名、专有名词和术语的译法
长篇累牍的术语或专业名词常常让译者感到棘手。有经验的译者会利用搜索引擎快速、高效地找到最为可信的相关专有名词和术语。
2.2.3确认文本真实性和可靠性
译员在翻译中,也经常碰到原文有误的情况。当译员判断原文中某事实描述或表达方式有错误,但又不能完全确定时,可利用搜索引擎、专业数据库、语料库等资源搜索原文错误处,或者搜索译员认为的正确表达,从而验证原文文本的真实性和可靠性。
2.2.4检验译文是否准确地道
如果涉及译者比较陌生的领域,容易造成表达不地道或不正确。此时译者就可以借助搜索引擎或语料库对译文进行检验,确定译文的准确度。
当然,网络搜索在翻译中的作用绝不仅限于此。搜索实际也是译者大脑的延伸,只要有助于解决疑难问题,有助于改善译文的质量,译者都可以根据实际需要诉诸于网络搜索。
译者的搜索能力培养
提高译者的搜商,需要培养译者应用搜索工具、使用搜索技巧和掌握搜索资源三个方面的能力。
3.1综合应用多种搜索工具
3.1.1搜索引擎
译员常用的搜索引擎有Google、百度、Bing等。他们都需要通过关键词进行搜索。有一些专业搜索引擎,如百度法律、MBA智库百科、patentscope等还能提供专业领域内的搜索结果。例如在一篇专利文献翻译中,遇到"圈梁模板"一词,查询patentscope,可以找到相关专利,打开相关专利,可看到对应英文为"ring beam formwork"。
3.1.2桌面搜索
桌面搜索工具是一种无需借助互联网、在本地电脑硬盘中执行搜索的工具。常见的桌面搜索工具有Google桌面、百度硬盘搜索、Search and Replace、Everything。前三者可进行全文搜索,而Everything则可快速搜索硬盘资料的文件名。译员在自己电脑上积累了许多专业的术语表,使用桌面搜索工具可对术语表进行快速查找。本地术语表一般都是经过译员筛选确认的,专业性强,可信度高,因而和搜索引擎相比更加快捷高效。
3.2熟练使用多种搜索技巧
译员除了熟悉常见的搜索引擎之外,还需要掌握高级搜索语法、诱导词查询法等搜索技巧。
3.2.1Google高级搜索语法
Google提供了许多高级搜索语法。善用搜索语法可以提高搜索的准确性。
1)逻辑检索符号-"AND"、"OR"和"-"
"AND"符号,表示前后两个关键词都要出现在检索结果中,在Google检索中可用空格来代替。如需要搜索bulk carrier一词,直接在检索框中输入bulk carrier即可。"OR"表示前后两个关键词中出现一个即可。如需要了解panamax bulk carrier和capsize bulk carrier两者中任意一者的信息,只需在检索框中输入panamax OR capsize bulk carrier即可。"-"表示检索结果不出现"-"后的结果。如只需了解panamax bulk carrier的信息,但直接检索会发现中间夹杂着许多capsize bulk carrier的信息,那么只需要在检索框中输入panamax bulk carrier-capsize即可。
2)英文双引号("")
将检索词包含在英文双引号中,可以保证在检索的结果中目标检索词连续出现。如需搜索robust standard errors这个专业词汇,若不加双引号,搜索引擎会把在一个页面上同时出现这三个词的网页也给罗列出来,降低了搜索质量和效率。而将搜索词变成"robust standard errors"效果就会好很多。
3)site
这个检索命令能够限定检索结果的来源网站可以被用来检验译文表达是否地道。例如,译员查到足球术语"后腰"的对应英文是"defensive midfielder"。为了验证这一表达是否地道,在谷歌检索栏输入:"defensive midfielder" site:us。这个检索式的目的是限制检索结果只出现在美国的网站中,然后查看检索到的结果数即可,有效结果数量大,则译文相对可靠。但译者必须知道,不能把互联网搜索引擎提供的词频和词频比较作为翻译选词唯一标准。对检索结果的甄别判断、乃至反向验证也是译者搜商的重要体现。
4)filetype
这个检索命令可限制搜索结果的格式类型。例如一名译员要翻译静脉注射相关内容。为了熟悉静脉注射的相关背景知识,这名译员在谷歌检索栏输入"静脉注射"filetype:pdf以及"Intravenous Injection" filetype:pdf。就可以快速获取关于静脉注射的英文和中文的PDF文件,学习静脉注射的相关双语表达。
3.2.2诱导词查询法
诱导词查询法是最常见的搜索技巧之一。通过诱导词可以缩小搜索引擎的检索范围,利于快速找到需要的内容。例如,在一篇战地救援的英文中有一句话:If he has a CamelBak on him,I may not be able to access this.在这句话的翻译中,难点就在于CamelBak这个词如何翻。用谷歌搜索CamelBak,会发现这是一家生产Hydration Packs(装水的背包)的公司。其中还有关于Military/Tactical(即军事)的产品。初步确定该产品应该就是文中所指的设备。将已知信息"水"和"军事"作为诱导词,与CamelBak一起进行搜索。搜索结果的最前面几条就为我们展示了一些军事论坛上,关于CamelBak的称谓,如"驼峰水袋、驼峰水囊"等。
3.2.3通配符和正则表达式
Microsoft Word定义了一套通配符,对通配符的支持使得Word的查找/替换功能大大增强。但通配符只是正则表达式体系的一个小的子集。正则表达式是一种语言,也是一种高级搜索方法,可以实现文本的查找、定位和替换功能。在翻译中,利用正则表达式强大的查找/替换功能,可以实现对文本内容的批量修改,对非译元素(例如网址、电话以及客户要求的免译内容等)进行标记或隐藏。总之,从译前排版到译后审校,正则表达式都可以发挥巨大的作用。掌握和灵活运用正则表达式的实用方法,可使翻译中繁琐而又易出错的工作变得有趣。
3.3掌握多元化的搜索资源
译者通常会接触各种专业领域,对于专业知识背景、专有名词、人名、地名等搜索,还需要借助学术数据库(如Springer、中国知网、万方数据等)、专业数据库(如专利数据库、医学数据库等)、专业门户网站以及单语或双语语料库(COCA语料库、CCL汉英双语语料库)等资源。
3.3.1学术数据库和专业数据库
学术数据库和专业数据库较之互联网搜索引擎的搜索结果而言,更具有权威性和科学性,可信度更高,可以很大程度上提高译员的搜索效率。例如,在一篇与煤化工有关的文章中,出现有ash content一词,在中国知网的词典中进行检索可以发现,在相应的精细化工等专业词典中被译为"灰分、灰分含量、含灰量"等。将这些译文再在知网的期刊栏目下作为关键词进行检索,可以发现相关的论文中灰分、灰分含量这两个词汇出现频率极高,而含灰量则很少。所以基本可以确定,在煤化工领域中,ash content一般译为灰分。
3.3.2语料库及平行语料
译者可以利用目标语单语语料库去验证译文表达是否地道,或搭配是否适当等。例如,"晚期胃癌",湘雅医学专业词典将其译为advanced carcinoma of stomach和late gastric cancer,译者在翻译时很难辨别哪一个是准确译法。在COCA官网,分别输入这两个译法,都没有找到对应的例句,但查询advanced gastric cancer时,显示出例句"There is less certainty regarding the resection D2 in patient with advanced gastric cancer(recommendation grade C/D)"。为进一步验证该译法,用Google或必应检索"advanced gastric cancer",可以找到多篇本族语作者撰写的相关文献。由此可见,advanced gastric cancer是晚期胃癌的准确译法。这是利用语料库解决翻译疑难的一个实例。
3.3.3双语句库
双语句库是利用信息检索技术,在海量的双语例句对中提供双语的互译信息。比较出色的中英双语句库有"Bing词典、百度词典、有道句库、爱词霸句库、句酷"等。由于这些双语例句对主要是人工翻译而成,且涉及各行各业,对于翻译从业人员与学生,是一种重要的辅助翻译手段。当译员碰到一些词组、搭配需要查询时,利用双语句库是一个不错的选择。需要注意的是,由于双语句库的语料直接来源于互联网,其语料质量不能得到保证。在利用双语句库辅助翻译的基础上,还应该配合其他的手段来验证翻译的正确性。此外,译者可以利用的搜索资源还有很多,例如在线词典、在线近义词反义词词典、在线百科等等。总之,译者可充分调动网络资源高质高效地完成翻译项目。
总结:
网络资源无所不包,提高搜商是译者提升译者翻译能力的重要方法。但是,网络资源参差不齐,因此,译者还必须具备相应的甄别能力,对网络搜索得来的结果去伪存真,这也是译者搜索能力的体现。搜索能力(搜商)是翻译能力的重要组成部分。译者的搜索能力是对传统翻译能力的拓展。翻译搜索能力的研究,为深度解析翻译能力提供了新的研究视角,为翻译能力研究打开了一扇新窗户,也为翻译教学实践提供了新的依据。
作者简介:
王华树:翻译学博士,副教授,北京外国语大学高级翻译学院硕士研究生导师,兼任世界翻译教育联盟翻译技术研究会会长,中国翻译协会本地化服务委员会副秘书长,中国英汉语比较研究会外语教育技术专业委员会副秘书长,《中国科技术语》编委等。多年来致力于推动翻译技术产学研的生态融合,在《中国翻译》《外国语》《外语电化教学》《上海翻译》等期刊发表论文六十余篇,主持国家级、省部级及校级科研项目十多项,出版《人工智能时代翻译技术研究》《计算机辅助翻译概论》《应用程序本地化》《翻译与本地化项目管理》等十多部著作。研究领域:翻译技术、外语教育技术、语言服务管理。
张成智:马来西亚理科大学翻译学博士,副教授,硕士生导师,河北大学外国语学院MTI中心执行副主任,河北省翻译协会常务理事,中国翻译协会本地化服务委员会理事;研究方向:翻译技术、语料库翻译;代表作《翻译与搜索教程》,参编《翻译搜索指南》、《翻译技术教程》等著作。
特别说明:本文发表于《中国科技翻译》2018年第4期,第26-29页,推文分享限于篇幅,此处省略参考文献,引用请以期刊版为准。