corpus-based translation studies

39
Corpus-based Translation Studies S0900030 仲仲仲仲仲仲仲

Upload: lawson

Post on 25-Feb-2016

205 views

Category:

Documents


3 download

DESCRIPTION

Corpus-based Translation Studies. 语料库翻译研究. 仲夏阳 S0900030. The introduction of Corpus-based Translation Studies. Corpus-based Translation Studies (CTS). The theory of Corpus-based Translation Studies. The findings of Corpus-based Translation Studies. Definition of CTS. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Corpus-based Translation Studies

Corpus-based Translation Studies

仲夏阳 S0900030

语料库翻译研究

Page 2: Corpus-based Translation Studies

The introduction of Corpus-based Translation Studies

The theory of Corpus-based Translation Studies

The findings of Corpus-based Translation Studies

Corpus-based Translation Studies (CTS)

Page 3: Corpus-based Translation Studies

Corpora: a new methodology in translation studies

Two main sources of CTS

Definition of CTS

Introduction of CTS

Page 4: Corpus-based Translation Studies

Definition of Corpus-based Translation Studies

• Corpus-based Translation Studies (CTS), a new paradigm, can be defined as the branch of the discipline that uses corpora of original and/or translated text for the empirical study of the product and process of translation, the elaboration of the theoretical constructs, and the training of translators.

• The main content of Corpus-based Translation Studies (CTS) is to study translation as the features of social and cultural phenomena by using the corpus linguistics approach.

Page 5: Corpus-based Translation Studies

Mona Baker(1993) fist put forward the idea of exploiting the analytical tools of corpus linguistics to study the product and process of translation from a descriptive rather than a prescriptive point of view.

She predicted that the availability of large corpora of both original and translated text, together with the development of a corpus-driven methodology, would enable translation scholars to uncover “the nature of translated text as a mediated communicative event”.

她借用语料库语言学的研究方法,对翻译问题展开另类调查,即广泛收集真实存在的翻译材料,借助现代化的手段建立大型资料库,挑选出各种资料样本进行分析,以此来描述翻译的真实面目和性质,揭示可能存在于翻译中的规律,并为翻译操作提供范式 .

Page 6: Corpus-based Translation Studies

Corpora: a new methodology in translation studies.

• 语料库和翻译研究的结合产生了“一种连贯、综合和丰富的研究范式,它涉及了翻译理论、描写和实践等方面的诸多问题,已成为当代描述翻译研究中的一种新范式” (Laviosa 1998 : 474) 。这一新范式——基于语料库的翻译研究 (Corpus—based Translation Studies) 是一门运用原文文本和翻译文本的语料,对翻译结果和过程进行实证研究的学科。

Page 7: Corpus-based Translation Studies

Two main sources of CTS

Corpus Linguistics

Descriptive Translation

Studies (DTS)

Corpus-based

Translation Studies (CTS)

Page 8: Corpus-based Translation Studies

• 描述翻译学的基本思想与语料库语言学不谋而合。语料库语言学坚持在真实的社会文化环境中研究实际的语言行为,同样采取描写和实证的方法。语料库语言学方法为描述翻译行为提供了强有力的支持。从语料库的研究目的来看,把语料库应用于描述翻译研究非常合理且很有必要 .

• 一方面,描述翻译研究的框架便于在翻译研究中应用大规模的描述性分析;另一方面,翻译研究中的语料库也提供了大规模真实的描述性语料,在此基础上可以作进一步的分析,来促进描述翻译研究的理论发展。语料库的发展使描述翻译研究得以充分展开,语料库翻译学基本上就是语料库语言学加描述翻译研究。

Two main sources of CTS

Page 9: Corpus-based Translation Studies

Corpus-based Translation Studies: the theory

Why we study translation through corpora

What we study translationthrough corpora

Types of corpora (parallel corpus / multilingual corpus / comparable corpus)

The theory of Corpus-

based Translation

Studies

Page 10: Corpus-based Translation Studies

1. Why we study translation through corpora

• A. The advantages of the use of large quantities of authentic text, which permits the identification of translational norms and the assessment of the probability that a given relationship found between source and target text is representative of the equivalence established by the parent population of which the corpus is a sample.

• B. Authentic texts can be invaluable to the contrastive linguist who wishes to investigate differences and similarities in language use.

Page 11: Corpus-based Translation Studies

2. What we study translation through corpora

语料库主要通过探讨某种意义从一种语言转换为另一种语言,通过比较译语文本和其对应的母语中的语言特征及其出现的频率来研究翻译过程。

语料库为翻译培训提供了工作平台,同时也为开发机器翻译 (Machine Translation) 和机器辅助 (Machine—Aided Translation) 等应用软件打下了基础。

实践性研究

理论性研究

Page 12: Corpus-based Translation Studies

平行语料库 (parallel corpus) 是收集某种语言的原创文本和相应翻译成另一种文字的文本。形式:单向平行语料库,含一种语言的文本和该文本的译本;双向平行语料库,指 A 语言的源文本和译入语 B 的译文本。 B 语言的源文本及其译入 A 语言的译文本。用途:平行语料库可用来进行语言对比研究。如语言学家可对两种文本在词汇、句子和文体上的异同进行对比分析。通过比较原文文本和译文文本在词汇、句子和文体上的差异,研究者能发现两个文本在词汇和结构上的对应关系。贡献:平行语料库最重要的贡献在于它使人们认识到翻译研究应从规约性研究向描述述性研究过渡。平行语料库的建立,对翻译培训、翻译教学、双语词汇教学、双语词典编撰和机器翻译等尤其具有实际价值。

平行语料库 (parallel corpus)

Page 13: Corpus-based Translation Studies
Page 14: Corpus-based Translation Studies
Page 15: Corpus-based Translation Studies

回答下列问题 :1. “so that’’⋯ 在汉语译文中如何处理 ?2. 表面看来与“ so that’’⋯ 最相近的“如此⋯以致”是不是汉译文中的典型结构呢 ? 该文以为参照项 ,在英汉和汉英语料库中均使“ so that⋯ ” 为关键词 , 通过软件检索英语原文或译文中的“ so that”⋯ 结构及其汉语译文或原文平行对应索引。 检索时该文使用了关键词 (key word) “so +20+ that’’,即 so 与 that之间的跨距 (span) 为 20个词形,能够检索子库中所有相关的索引。 在对索引进行统计时使用了以下统计项目( 1)频次:指语料库中与“ so that’’⋯ 结构对应的汉语某一形式的出现次数 ;( 2)构成比例:指各对应形式在总频次中的比例 ;( 3)频率指某一形式在百万字 /词中出现的次数。

Page 16: Corpus-based Translation Studies

3. How we study translation through corpora

• the classification of corpora

Page 17: Corpus-based Translation Studies
Page 18: Corpus-based Translation Studies
Page 19: Corpus-based Translation Studies
Page 20: Corpus-based Translation Studies

它按照类似设计标准建立两个或多个不同语言单语种语料文本组成的复合语料库。其中的文本完全是原文文本,不收集翻译文本。用途:它对翻译研究的关系较为间接,研究者可以通过对这些文本的比较,分析出它们在各自语言里文本的类型和风格,从而为分析或评论可能存在的相应翻译文本建立有效的参照系数。

多语语料库 (multilingual corpus)

Page 21: Corpus-based Translation Studies

可比语料库 (comparable corpus)

它收集某种语言如英语的原文文本,同时也收集从其它语言翻译成英语的文本。但这两种文本语料在使用范围、语言变体和时间跨度上都应该相似,而且在长度上也要具有可性。用途:可比语料库的大多数翻译研究旨在比较翻译文本和非翻译文本的特定结构 (patterns) 差异。通过可比语料库两种文本的比较分析,我们可以探索在特定历史、文化环境中翻译的规范,发现翻译文本的一些特殊规律,即翻译的普遍性。

Page 22: Corpus-based Translation Studies

英国翻译英语语料库 (Translational English Corpus, TEC)

• 在英国科学院 (British Academy) 的资助下 , 英国曼彻斯特大学科技学院语言工程系的翻译研究中心于 1995 年开始创建世界上第一个可比语库———翻译英语语料库。该语料库收集的是由英美翻译家从世界其他国家语言的原著翻译成英语的文本。• 翻译英语语料库下分四个子库 , 现容量如下 :

小说   4846369    81.15 %传记   836445   14.11 %报纸   79725     11.34 %杂志   184016    3. 09 %

Page 23: Corpus-based Translation Studies

译者

每一文本还附带以下一些信息

方向 ( 翻译成母语 / 翻译成外语 / 翻译成惯常使用语言 ) 、形式 ( 翻译中使用的特定写作方式 ,书面语还是口语 ) 、类型 ( 全译 / 概译 / 选译 / 翻译要点 )

姓名、性别、性别倾向 (仅限文学作品 )

方式 ( 文本内容处理方式 ) 、篇幅 ( 字数 ) 、出版社、出版地、出版时间、版权所有者、赞助人、评论评述

姓名、性别、性别倾向 (仅限文学作品 ) 、民族、职业、身份 (全职 / 兼职 ;自由翻译/ 职业翻译 )

翻译翻译过程

作者

Page 24: Corpus-based Translation Studies
Page 25: Corpus-based Translation Studies

TEC的标注有两种形式:文本标注和元数据标注。对于翻译文本, TEC只是做了简单标注,其目的是确保翻译文本自身的整体性 (integrity). 出于研究的需要, TEC 的元数据 (metadata)详细记录了翻译文本的以下超语言特征 (extralinguistic features) :译者的姓名、性别、国籍、职业、翻译的方向、译文的源语、出版社/商名、文本的范畴和字数、原文作者姓名、性别、国籍、地点和年代等。 这些标注支持以下一些方面的翻译研究,如比较实词/虚词比率 (lexical density) 、句长、词语搭配规律、具体词语在男女不同译者译文中的使用频率,同一分库中译自不同源语的译文差异和具体译者的翻译特点等。

Page 26: Corpus-based Translation Studies

与 BNC (the British National Corpus) 的字库一起进行译文与自然语言的对比研究对 TEC 翻译文本的特征研究

TEC 与 non-TEC 的文本对比研究

TEC 与 CTF 的并列研究

基于 TEC 的描述性翻译研究

Page 27: Corpus-based Translation Studies

• TEC 的原来网址http://www.ctis.umist.ac.uk

• 现在网址为 http://www.art.man.ac.uk/SML/ctis/research/ 或者 http://ronaldo.cs.tcd.ie/tec/

• BNC 的网址是 http://www.bnc.org.uk

Page 28: Corpus-based Translation Studies

TEC 与 BNC 的对比研究 Olohan& Baker利用 TEC 的文学分库与 BNC 的文学体裁分库对 sa

y/tell +that 这种结构进行了量化研究,她们发现:与 BNC 相比, TEC里 that 使用得较多。后来 Olohan 分析了动词 promise +that 结构,其结果也大体相同。

Hansen—Schirra 把 TEC 中记叙性文体英语译文与 BNC 中的英语原文进行比较,结果发现非典型小说特色的名词化现象 (nominalization) 在译文中比原文要多,这表明英语译文并没有符合译语规范,这使得译文名词化现象严重,从而使译文比原文更显得抽象、难懂。

Olohan使用关键词分析法 (keywords analysis) 来研究译者的选词特点。她把 TEC中的译文与 BNC比较,其目的在于揭示译文的主题和译者的翻译风格特点。研究结果表明:不同的词汇选择与文学语体和译文的叙事结构 (narrative structure)密切相关。

Page 29: Corpus-based Translation Studies

Corpus-based Translation Studies: the findings

对翻译普遍性的研究 对翻译规范的研究

基于语料库翻译研究的理论贡献

Page 30: Corpus-based Translation Studies

明朗化简略化 规范化 整齐化和集中化

Baker 在 1993年就明确地界定了翻译普遍性 (translational universals) ,“在译文而非原文中展现的典型特征,这种特征不是特定语言系统相互作用的结果”。 (1993 : 243) 。翻译普遍性是翻译语言特有的,是受原文影响而产生的译语的不自然化,俗称翻译腔 (translationese) 。 Baker 提倡使用可比语料库来研究翻译的这些固有特征,即通过翻译语料库的总体语言特征与非翻译语料库的总体语言特征的比较发现翻译本身的特征。

Page 31: Corpus-based Translation Studies

简略化 (simplification) 就是“译者无意识地简化语言或信息或两者兼而有之的思想” (Baker , 1996 : 176) 。简略化主要表现在词汇、句法和文体三个方面。• Leviosa 通过词汇变化 (lexical variety) 、信息容载 (information

load) 、句长 (sentence length) 等三大指标来考察翻译文本的简略化倾向。• 她的研究证实了 :• (1) 翻译文本的词汇范围比非翻译文本的词汇范围窄。• (2) 翻译文本实词与语法功能词的比率低于非翻译文本中实词与连接词的比率 ( 即词汇密度更低 ) 。• (3) 翻译文本的句子平均长度比非翻译文本的句子平均长度短。

Page 32: Corpus-based Translation Studies

• 明朗化 (Explicitation) 指对原语中暗含的,但可以从上下文中推导出的信息在译语中加以明确介绍。• Vanderawera(1985) 描述了各种明确化的方法:使用插入语;扩展浓缩的篇章;增添修饰词、限定词和连接词以提高透明度;增添额外信息;增添解释语;重复先前细节;明确暗含或模糊的信息等。此外 Baker(1992)还提到增添背景信息以填补文化空缺等方法。• Olohan and Baker(2000) 对翻译和非翻译英语语料库中陈述词 that 的省略或增添现象进行了语言学比较分析,发现在翻译文本中 that 与各种形式的陈述动词 say 和 tell的连用明显高于非翻译文本。

Page 33: Corpus-based Translation Studies

• 规范化 (Normalization) 指译者有意识或无意识地将原文独特的文本特征翻译为与译人语传统文本特征一致,即消除原文的独特性使译文更加规范。• 例如:范德沃维拉 ( Ria Vanderauwera )利用语料库发现,从德语翻译成英语的文本中,标点的使用、措辞的选择、文体、修辞、句子结构和文本组织都存在着变更,存在一个普遍的趋势,即向文本读者“明显接受的文本习惯靠近的”倾向。

Page 34: Corpus-based Translation Studies

• 集中化 (Convergence) 指翻译文本在诸如简略化等翻译普遍性特征上显示出的更高的一致性。• 整齐化 (leveling out) 指的是在口译和笔译中在口语体与文学文体之间或其他事先定义的两个维度间的变化更为规则。

Baker 的研究表明,翻译文本有“向连续体中间聚集”的倾向,换句话说翻译文本在特定的语言学特征上倾向于彼此相似。• 例如:在对英语可比语料库 (ECC) 中翻译与非翻译报纸文本比较研究中,人们发现报纸文章的译文在简略化的三个指标上都倾向于一致,即实词与语法功能词比率、词汇密度和平均句长三个方面都显示出高度的统一特点。

Page 35: Corpus-based Translation Studies

• 翻译规范 (norms of translation) :由于特定的社会历史文化环境中价值观念的差异,翻译活动会表现出一些规律,会有一些为大家所接受的规定或者内在化的限制 (regularities of behavior or internalized behavioral constraints). 利用语料库我们能发现和分析某些翻译规范。例如:

• 1. 图里发现,在将外国小说翻译成现代希伯来语的过程中,译者常常大量使用熟悉的宗教文本的表达方式和语言结构,而且特别喜欢用直接引语。• 2. 范德沃维拉从 50多部德语小说语料库中发现,原文中的外来词都被替换或者淡化。• 3. Mona Baker 在分析当代非文学英语作品的翻译时发现,日语文本对翻译中的外来词汇容忍程度高于法语和阿拉伯语。从中可以看出,翻译规范因社会文化的不同而大相径庭。

Page 36: Corpus-based Translation Studies

Corpus-based Translation Studies: the findings

语料库与译者培训 机器翻译

基于语料库的应用翻译研究

Page 37: Corpus-based Translation Studies

语料库与译者培训• Bowker(2003)介绍了两类语料库在译员培训方面的用途。一是

CCBT (corpus created by translators) ,即出自译者 ( 翻译受训学员 ) 的译语文本库。库中的语料可供受训译员调用,使用检索软件便能同时提取原语和多个目的语对应译文。甚至还可建立—个跟踪性的 CCBT ,以考察受训译员的翻译能力在某段受训时期内发生了多大程度的发展和变化。另一类语料 CCFT (corpus created for translators) 这类语料库实际上没有译文语料,它只提供相似题材的资料供翻译参考。

• 平行语料库在译员培训中具有重要意义。它不仅是词汇和术语的重要资源,而且能提供有关话语结构、语篇类型惯例等信息,也为译员提供其他译员的惯用翻译策略。

Page 38: Corpus-based Translation Studies

summary

• 翻译语料库为翻译研究提供了新的武器,扩展了翻译的研究范围,提出了新的研究思路,克服了传统翻译研究的不足,并取得了令人瞩目的成果。• 但是语料库翻译研究也有明显的局限性。如在使用平行语料库时,词语索引有时不能提供足够的语境,会妨碍对语义现象的分析;语料库翻译研究的实证主义倾向可能会导致研究者过份强调翻译规范,忽略译者的主观创造性等。• 因此我们在充分利用语料库所带来的巨大优势的同时,也要高度重视其弊端和局限性。只有把语料库与翻译研究有效地结合起来,才能促进各自的理论发展,使其更好地指导实践。

Page 39: Corpus-based Translation Studies