互联网搜索引擎----翻译相关
使用互联网搜索引擎去获取信息可以说是最重要、最直接又最快捷方便的方式,这便决定了互联网与翻译、翻译服务等之间的密切联系,那么该如何使用互联网搜索引擎做好翻译呢?
要想充分利用搜索引擎快速准确检索到需要的信息,首先需要了解搜索引擎的基本工作原理及主要分类,并熟悉和掌握高效便捷的搜索方法和技巧。
搜索引擎的基本工作原理是:系统根据我们输入的关键字,与索引库中文字标志作匹配,进而输出相关信息。但输出的过程存在一个关键问题:如何对相关结果进行处理或排序来更好地满足用户的感觉和需求?例如,如何排除虚假信息,将有价值的信息放在网页前端?以Google为例,其对输出结果排序的基本算法是以网络链接的关系来决定的——链接越多的网页重要性就越高,排序便越靠前。这样的算法思想能让一些人通过增加网页链接来“提高”重要性,从而产生许多虚假信息。经过改进,那些网站标题或是url数据链中包含所输关键字的页面重要性更高。事实上,无论以何种算法都不可能完全满足用户的需求,且搜索引擎对自然语言分词、词形变化、形态变化、词根、复数等问题的处理还远远不能满足用户的基本需求,这就要求我们掌握恰当的搜索方法和关键词来获取准确信息。
从不同的角度考虑,搜索引擎可以有不同的分类,而具体选择哪一类搜索引擎则完全要根据自己的不同需求来选择。
根据搜索引擎的组织方式,可以分为全文搜索引擎和目录式搜索引擎。大部分的搜索引擎属于全文搜索引擎,例如,Google、百度、搜狗等,它们根据用户输入的关键词输出与关键词相关的几乎所有信息;而目录式搜索引擎,像早期的YAHOO,不需要用直接的词汇,可以从分类体系入手,但最终找到的是网站,进一步的搜索信息就比较困难。
根据搜索范围,搜索引擎分为元搜索引擎和独立搜索引擎。元搜索引擎是根据用户输入的关键词引入其他搜索引擎的相关结果,这样的搜索引擎有META Search、WebCrawler、dogpile等,虽然这类搜索引擎可以输出更广泛的数据,但在当今的互联网时代,独立搜索引擎的数据已经可以满足用户的基本需求,再引入其它搜索引擎的结果帮助并不大。
根据信息内容,搜索引擎又可以分为综合搜索引擎和专业搜索引擎。综合性搜索引擎不限制信息类型和范围,检索比较全面,内容宽泛,在生活中使用频率较高,可以满足用户较高的需求,但同时也存在较多错误信息的干扰。专业搜索引擎属于垂直搜索引擎,它是针对具体一类或几类信息,命中率较高但结果相对较少。
关于搜索引擎的使用技巧,主要包含三方面:选对搜索引擎、用准关键词、运用语法和高级检索。
我们需要了解到:不同的搜索引擎有不同的特点,同一关键词会得到不同的结果;同一搜索引擎的不同语言或版本之间搜索结果也不相同。比如Google中文版与Google香港版对同一关键词的输出结果就可能存在不同。
对于所输入的关键词,为了确保高效快捷的得到目标信息我们应当确保关键词“用准”了。因此在选择关键词时要注意以下几点:
1、关键词应当为主题限制词;
2、可以从多角度选词;
3、避免口语词汇;
4、适当使用双语检索。
使用主题限制词的目的是限制搜索领域范围,排除有歧义的检索词;在不明确主题限制词的情况下,我们可以尝试先搜索得到相关文章,通过正确分析检索主题来得到关键词,还可以经过多方面提炼反映该主题的词汇以提高查全率;口语化的词语,像一些没有意义的虚词,往往对搜索对象没有帮助作用,有时甚至会有“误导”作用,所以在搜索时要慎重考虑这些词是否有必要加入到关键词中;双语检索是指使用源语言和目标语言的部分或全部词来检索,通过双语检索我们能更容易找到相关词汇的准确翻译。
为了得到准确的信息,使用语法和高级检索也是必不可少的。
我们可以通过使用逻辑符号来增加或减少检索内容,从而提高检索精度。逻辑检索符包含逻辑“与”(使用×,AND表示)、逻辑“或”(+,OR)、逻辑“非”(-,NOT)。除此之外,使用Google检索语法能完成更加精确的检索。Google中检索与法包括:
site: link:
filetype: define:
intitle: related:
inurl: intext:
inanchor: ……
例如,“关键字[空格]site:网站”搜索结果便局限于某具体网站,site后还可以接某域名范围,“[空格]-网站/域名”等来实现不同范围的搜索;“关键字[空格] filetype:文件类型”用来限制检索结果的文件类型,其支持的文件格式包括Microsoft
office的xls/ppt/doc、adobe的PDF、shockwave的swf文档等;“define:关键字”可查询包含关键词定义的页面;“inurl/allinurl :关键字”用来查询url中包含指定词语的页面;“intitle/allintitle:关键字”查询网页标题中包含指定词语的页面;“intext/allintext:关键字”查询网页正文中包含指定词语的页面;“inanchor/allinanchor:关键字”导入链接锚文本文字中包含搜索词的页面;“link:网址”搜索所有链接到某个URL地址的网页;“related:网址”搜索与要查询的网站结构内容类似的其他网站……
使用搜索引擎自带的高级搜索功能通过设置高级选项,缩小搜索范围,精确检索结果。如对应部分搜索语法,还可为不熟悉高级搜索愈发的使用者生成所需的关键词。
但在很多情况下,译员在翻译中需要了解的专业背景知识与源语言文本的专业性成正比,若只通过地毯式的全网搜索,简直就是大海捞针,不但难以找到专业性的信息,准确度也令人担忧。而通过使用学术数据库,译员们则能够快速准确的获得规范、科学、可靠又具有针对性的专业知识,从而大大提高翻译的效率和质量。
那么如何通过使用学术数据库来帮助翻译呢?首先我们要了解学术数据库的具体分类。学术数据库可以分为中外文电子期刊、电子图书和电子报纸、学科信息门户、专利资源、科学报告、标准文献等不同类型。其次、要注意使用学术数据库的一般技巧——翻译问题识别(确定问题类型à确定查询对象)、中外文资源之间的相互借鉴和使用,要选择与学科专业相关或所查文献类型相对应的数据库。(资源列举见文末)
无论是使用普通的搜索引擎还是专业的学术数据库,我们应该学会灵活变通,学会不同的关键词、搜索方法、不同的互联网工具之间的相互切换与使用,学会顺藤摸瓜与“曲线”查询。同时还要注意时刻牢记查询目标,不可本末倒置——应当专注于解决翻译问题本身,并不一定要深入了解该学科知识。
国外:
1.与纸本期刊并行的电子期刊,如著名的《科学》杂志(http://www.nature.com/)等;
2. 纯电子期刊数据库,如 Elsevier、Springer、John Wiley、 Project Muse、JSTOR、Nature、Science、IOP、ACS、 AMS、AIP、ACM、RSC
3. Google Scholar 谷歌学术搜索引擎:http://scholar.google.com.hk/;
国内:
中国期刊网-中国知网、万方数字化期刊、维普电子期刊等;
开放获取(Open Access)电子期刊,有影响的OA 站点:
1. HighWire:斯坦福大学图书馆创立于1995年http://highwire.stanford.edu/
2. DOAJ:Directory of Open Access Journals,瑞典 Lund大学,2003 http://www.doaj.org/
3. 中国科技论文在线:http://www.paper.edu.cn/
4. 开放获取期刊列表http://zh.wikipedia.org/wiki/%E9%96%8B%E6%94%BE%E7
%8D%B2%E5%8F%96%E6%9C%9F%E5%88%8A%E5%88 %97%E8%A1%A8
常见国外专利数据库
1. 欧洲网上专利数据库:http://www.espacenet.com/index.en.htm
可检索近两年内由欧洲专利局和欧洲专利组织成员国出版的专利,世界知识产权组织WIPO出版的PCT专利的著录信息以及专利的摘要。
2. 美国专利全文数据库:http://www.uspto.gov/
3. 日本专利网上检索:http://www.jpo.go.jp/
•中国专利信息中心-专利之星检索系统:http://search.patentstar.cn/CPRS2010/cnSimpleSearch.aspx#
•中国专利数据库(知网版):http://dbpub.cnki.net/Grid2008/Dbpub/Brief.aspx?ID=SCPD&sub Base=all
科技报告
•美国商务部国家技术情报服务处NTIS数据库
•http://www.ntis.gov
•国务院发展研究中心调查报告•http://edu.drcnet.com.cn/DRCNet.Channel.Web/Educati onVersion/
标准文献
•国际标准(ISO):http://www.iso.org
•中国标准:http://www.chinastandard.com.cn