EC Innovations - 您的专属翻译和本地化服务专家
您现在的位置:首页 » 关于我们 » 新闻资讯
文章详情

专业本地化翻译之语料库分类

文章来源: 创思立信   发布时间:2015-10-7   

语料库在翻译公司的本地化翻译中都会用到,语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。人们通过语料库观察和把握语言事实,分析和研究语言系统的规律。语料库已经成为语言学理论研究、应用研究和语言工程不可缺少的基础资源。

语料库一词在语言学上意指大量的文本,通常经过整理,具有既定格式与标记;语料库的分类根据其标准不同,会有不同的语料库类型。

原创语料(original)和翻译语料(translational)

原始语料库是指以某种原创文本集合而成的语料库,比如收集用汉语写的文本所建成的语料库,原创文本能够真实反应相应的语言;翻译语料库是指由翻译文本,而非原创文本构成的语料库,比如,收集由外语译成汉语文本所构成的语料库,翻译语料库是一种语言变体的反映,翻译文本毕竟和原创文本有差别,所以翻译文本不能代表原创文本。一般翻译公司在为企业翻译服务之后,会将积累的语料库分享给客户。

正如前面所述,不同的语料库有不同的用途,原创语料库和翻译语料库的作用各不相同,如果我们想求证一种的地道而可靠的译法,用中国人自己翻译的英文来模仿,很可能会有问题,而英语原创文本,也就是native speaker撰写的文本要可靠得多。

通用语料库(general)和专门语料库(specialized)

通用语料库是用于一般性的语料库研究,建库的标准和要求比较严格,各种类型的语料变体都要有反映,所以,取材非常重要;专门语料库是某个特定领域语言变体的反映,比如说,我们自己为了研究广告,所建立的广告英语语料库等。使用什么样的语料库取决于我们的目的。

学习者语料库(learner corpus)

即学习者产出文本组成的语料库,而不是native speaker产出的作品。比如,中国英语学习者语料库就是由中国学习英语的人所写的文章组成的语料,该语料库是为了研究和反映中国学生学习英语的中的问题的语料库,当然里面有不少“问题”,不适合用来供其它学习者模仿,只供研究人员研究中介语之用。

平行语料库(parallel corpus)

平行语料库是指由原创文本和其对应的翻译文本构成的语料库。平行语料库收集某种语言的原创文本和译本,研究者可以通过平行语料库来对比两种文本在词汇上、句子上和文体上的差异来总结语言翻译行为中的特征,归纳出其中的等值关系,研究翻译产生的原因和特点等。平行语料库最典型的应用范围是译者培训、机器翻译、双语词汇教学和词典编纂。

可比语料库(comparable corpus)

可比语料库是由具有某些相同属性的文本构成,双语可比语料库是由具有某些相同属性的文本构成,双语可比语料库是由某些具有相似性的两种语言文本构成,比如,不同网站同一天、同一主题的中文和英文新闻,其中中文和英文均为原文,双语可比语料库的两种语言的文本,完全是不同撰稿人或记者用母语对事件的描述。可比语料库不存在平行语料库中译文受原文限制的缺点,极有希望从双语可比语料库中提取真正对应的双语词对。

关闭

登录