...

英汉翻译质量评估标注指南

Annotation Guidelines for English-Chinese Translation Quality Assessment

总览

引言

第一步:标注可接受度

下一步的文本准备工作

第二步:标注忠实度

第三步:确认标注

引言

翻译质量评估是一项非常复杂的任务,评估的目的不同,评估的方式也会不同。本次翻译质量评估的目的是对比不同翻译模式下(人工翻译、机器翻译和机器翻译译后编辑)的翻译质量有何异同,尤其是在细粒度方面(fine-grained),即翻译错误类型上的异同。传统翻译质量评估在错误罚分(severity score)上往往比较主观,且局限于句子层面,忽视了衔接、连贯等语篇方面的评分。本次翻译质量评估错误类型分类(categorization of translation errors)和错误权重(error weights)是基于英汉语言特征、Daems et al.(2017)的英-荷翻译质量评估模型和Burchardt & Lommel(2014)的MQM1多维度翻译质量评估模型;本次翻译错误类型标注模式参照Daems et al.(2017)2的两步翻译质量错误类型标注模式(a two-step TQA approach)和基于用户定义的错误类型权重(user-defined error weights)分类标准。

翻译错误类型分类

本次翻译错误分为两大类:忠实度(Adequacy)和可接受度(Acceptability)。

错误权重(Error weights)

错误权重的分类和判定工作由研究者确定,而非由标注员(annotators)确定。本课题参照Daems et al.(2017)所制定的翻译错误权重层级,并根据本课题的文本类型(科学类新闻)和英汉之间的差异,将术语错误和术语不一致等错误权重作出适当修正。忠实度和可接受度中不同错误类型的错误权重可参见忠实度(Adequacy)和可接受度(Acceptability)。以下是本课题的5级错误权重分类标准:

UAM Corpus Tool的基本操作

1. 先将UAM Corpus Tool安装到本地计算机,然后将TQA_PhD-rater1/2压缩包“解压到当前文件夹”,随后双击打开TQA_PhD-rater1/2.ct3文件。

2. 请先完成Acceptability_001~143的所有语料标注工作后,再开始Adequacy_001~118的语料标注工作。

3. 用鼠标选择一个您认为的翻译错误,标注框下方会显示所有主类别,鼠标双击主类别的某一项(如Grammar),则该项会移至Selected栏中。此时,请务必选择右侧的子类别!

4. 如发现选错类别,请在Selected中双击该类别;如想删除该词的所有错误类型标注,则选择该词后,点击Delete。

5. 请务必在每一个子类别下的Comment栏中填写标注的理由,以便后期统一标注类型。

6. 您可以多次选择同一个汉字或词语,因此您可以把不同的错误类型赋予同一个汉字或词语。

总体标注规则

1) 除非另有说明(如漏译),一般情况下请在汉语译文中标注错误类型。

2) 请同时选择主类别(如Meaning shift、Grammar、Lexicon和Cohesion & coherence等)和子类别(如Contradiction、Word sense和Cohesion)。

3) 请在标注完每一个错误类型后,都务必在Comment栏中注明标注理由(中英文皆可)。

4) 如果一个元素包含不只一个错误,则它包含几个错误,就选择几次,每次代表一个错误(例如,一个词既包含术语错误,也包含术语不一致的错误)。

5) 仅在没有更合适的错误类型的情况下,选择标注为“Other”。

6) 如果您不确定某一标注是否准确,请在Comment栏中注明问号“??”,以表示不确定。

7) 如果同一错误重复出现,则一一标注这些错误。Muñoz Martín(2016: 359)认为,译文的读者是“人”,而非“机器”,即译文中反复出现的错误对读者的影响是不同的。经与评分员协商,我们在给错误类型的严重程度赋权重时,作出以下决定,即当同样的错误出现n次时(n≥2),将第2至第n次的错误类型权重均标注为1分(轻微问题)。通过调整重复出现的错误类型的严重程度,可以一定程度上控制“激活效应”。

8) 如果某一问题影响了整个句子或某一问题无法在句中标注,则标注句子编号。其它情况下,均在句子内部进行标注。

当您不确定时:资源推荐

If you are not sure whether or not something is an error, don't be afraid to consult external sources. You are perfectly allowed to use a dictionary or a search engine to look things up. Some useful sites that you could consult for acceptability issues are:

https://www.ldoceonline.com/

https://www.merriam-webster.com/

https://www.oxfordlearnersdictionaries.com/us/

http://bcc.blcu.edu.cn/

http://corpus.zhonghuayuwen.org/

http://ccl.pku.edu.cn:8080/ccl_corpus/


第一步:标注可接受度(Acceptability)

您将标注的文本为英译汉的翻译产品。翻译质量错误类型标注将围绕以下两个重要的维度展开:忠实度(Adequacy)和可接受度(Acceptability)。忠实度关注原文和译文的关系,而可接受度关注目标语文本和语言层面。目前您的任务是标注翻译产品的可接受度层面的错误类型。忠实度层面的错误类型须在此步骤完成后单独进行。为了确保您在标注可接受度错误类型时,只关注目标语文本和语言层面的错误,您在此过程中仅有汉语译文供您标注,而没有英语原文,目的是为了避免您在标注可接受度层面的错误时受原文的影响。

可接受度指译文遵循目标语的语言和文化规范。优秀的译文需要读起来像是汉语本族人写得文章一样。这里的规范包括:语言层面(语法、词汇、拼写)、文章结构(衔接与连贯)和文本类型层面(如:新闻报纸的文章风格与用户手册的风格不同)。

作为标注人员,请以出版级别的质量要求来标注译文的可接受度错误。请将不符合汉语语言规范、不符合汉语新闻文体结构要求的错误标注出来。请在UAM Corpus Tool中完成标注工作,忠实度错误的主类别是语法(Grammar)、词汇(Lexicon)、技术性细节(Mechanics)、风格和语域(Style & register)、衔接与连贯(Cohesion & Coherence),其子类别已事先确定。各类别的定义和层次结构可通过UAM Corpus Tool中的LayersEdit Scheme查看。

可接受度错误类型

语法(Grammar)

词汇(Lexicon)

技术性细节(Mechanics)

风格和语域(Style & register)

衔接与连贯(Cohesion & coherence)

时体态错误(Tense-mood-aspect)

搭配问题(Collocation)

错别字
(Spelling)

语域问题(Register)

衔接问题(Cohesion)

多余成分(Superfluous - superfluous word or constituent)

命名实体(Named entity)

打字错误
(Typo)

重复问题(Repetition)

逻辑问题(Logical)

成分缺失(Missing - missing constituent)

不存在的词(Word non-existent)

标点符号(Punctuation)

不地道(Unidiomatic)

不一致(Inconsistency)

其它语法问题(Grammar other)

词汇/短语歧义(Lexical/phraseological ambiguity)

拗口
(Awkward)

其它衔接与连贯问题(Cohesion & coherence other)

程式表达(Formulaic sequences)

句段过短(Short sentence segments)

文本类型(Text type)

其它风格和语域问题(Style & register other)

语法(Grammar)

定义 :“不符合汉语语法和结构规则的错误。”

Definition : 'This does not follow the grammatical or structural rules of the Chinese language.'

时体态错误(Tense-mood-aspect)

定义 :“动词形式的时、体、态的呈现存在错误。”

Definition : ‘A verbal form displays the wrong tense, mood, or aspect.’

标注方式 :选择错误的动词形式。

Annotation : Select the incorrect verb form.

多余成分(Superfluous - superfluous word or constituent)

定义 :“该句因存在多余成分或词,导致语法不正确。这一成分可以是该句中先前出现过的成分或者连续出现两次的词。”

Definition : 'The sentence is grammatically incorrect because there is a superfluous constituent or word. This can be a constituent that already appeared earlier in the sentence or a word that has been written twice in a row.'

标注方式 :选择多余的词或成分。如果该词出现两次,删除任意一个词都可以使该句的语法正确,则选择第一次出现的词。

Annotation : Select the superfluous word or constituent. If the word appears twice and either one of them can be deleted to make the sentence grammatically correct, select the first occurrence of the word.

成分缺失(Missing - missing constituent or preposition)

定义 :“该句语法不正确,是因为句子结构中必要的结构缺失,比如介词或句子的直接宾语。”

Definition : 'The sentence is grammatically incorrect because a necessary part of the structure is missing, this can be a preposition or an entire constituent such as an obligatory direct object.'

标注方式 :如果介词缺失,则选择缺失的介词后的相应名词短语。如果缺失主语或宾语,则选择动词。

Annotation : If a preposition is missing, select the noun phrase following the missing preposition. If an essential subject or object is missing, select the verb.

其它语法错误(Grammar other)

当您发现某一处语法错误不属于以上任何错误类型时,请选择此类别。请务必给出您选择此类别的理由。

Choose this category when you encounter a grammatical error that does not belong to any of the abovementioned categories. Always explain why you choose this category.

词汇问题(Lexicon)

定义 :“根据汉语特征,此处存在词汇问题或错误。”

Definition : 'This is a lexical problem/error when looking at the Chinese language.'

搭配问题(Collocation)

定义 :“该词在汉语中存在,但在使用方面存在错误或突兀,例如两词的组合不常见,在固定表达中存在错误。”

Definition : 'The word(s) exist(s) in Chinese, but is/are used in the wrong or in a strange way: uncommon combinations of words, errors in fixed expressions,…'

请注意!如果词的组合在词汇层面正确,但在语境中不符合逻辑,则选择“衔接与连贯问题-逻辑问题”,而不选择“词汇问题-搭配问题”。

Be careful! If the combination of words is lexically correct, but not logical in the context, select 'Cohesion & coherence - Logical problem', not 'Lexicon - Wrong collocation'.

标注方式 :选择用法错误的词或成分。如果是固定表达存在问题,则选择整个表达(包括介词!)。如果一个名词和不恰当的动词或形容词搭配,则选择整个动词或形容词。

Annotation : Select the word or constituent that is used in a wrong way. If there is a problem with a fixed expression, select the entire expression (prepositions included!). If an inappropriate verb or adjective is used with a noun, select the entire verb or adjective.

命名实体(Named entity)

定义 :“命名实体(地理位置、人名、公司、机构等)使用不正确:(有部分)未译;(部分)翻译出来了,但在汉语中不存在。”

Definition : 'Incorrect use of named entity (geographical location, name, company, organization, etc.) in Chinese: (partially) untranslated named entities that have an official Chinese equivalent, (partially) translated named entities that do not exist in Chinese, etc.'

请注意!译文中命名实体没有翻译成汉语,而是保留英语原文,则此类错误归为忠实度->未译。

Be careful! If the named entity in an English text translated into Chinese is left untranslated, select 'Adequacy - Untranslated', not 'Lexicon - Named entity'.

标注方式 :选择命名实体。

Annotation : Select the named entity.

不存在的词(Word non-existent)

定义 :“该词在汉语中不存在。如果某词未译,且在汉语中没有任何意义,则也归为此类。”

Definition : 'This word does not exist in Chinese. This category also includes untranslated words that make no sense in Chinese. '

请注意!如果某词不存在是因为语法错误,则选择“语法和句法错误(Grammar & Syntax)”,而非“词汇-不存在的词(Lexicon-Word non-existent)”。

Be careful! If the non-existent word is the result of incorrect grammar, select the appropriate category in the 'Grammar & Syntax' section, not 'Lexicon - Word non-existent'.

标注方式 :选择该词。

Annotation : Select the word.

词汇/短语歧义(Lexical/phraseological ambiguity)3;

定义 :“该句在词汇或短语层面存在语义上的歧义。”

Definition : 'The sentence is ambiguous in its meaning at lexical or phraseological level. '

标注方式 :选择该词或短语。

Annotation : Select the word/phrase.

程式表达(Formulaic expression)4

定义 :“该多词单位并不属于程式化的表达。”

Definition : 'The multiword units are not formulaic sequences '

标注方式 :选择该多词单位。

Annotation : Select the multiword unit.

技术性细节(Mechanics)

定义 :“不符合汉语的拼写和标点符号或存在打字错误。”

Definition : 'This does not follow the rules of spelling and punctuation of the Chinese language or this is a typo.'

错别字(Spelling)

定义 :“某一汉字的拼写存在错误。”

Definition : 'Wrong spelling of a single Chinese character.'

打字错误(Typo)

定义 :“这一错误很有可能是因为打字太快,导致汉字错位,或缺失一个汉字,或多输入一个汉字,或存在多余的空格。”

Definition : 'This error was probably caused by typing too fast: characters have been switched; there is a character missing or too many, there's a superfluous space,… '

请注意!不用混淆拼写错误和打字错误。仅在某一错误无法归类时,选择“typo(打字错误)”,否则选择“Spelling mistake- single-character spelling mistake(拼写错误)”或其它恰当的类别。

Be careful! Do not interpret spelling mistakes as typos. Only select 'typo' if the error cannot be classified elsewhere, otherwise select 'spelling, typos & punctuation - single-word spelling mistake' or the appropriate category.

标注方式 :选择整个词,而不仅仅是一些需要调整的汉字。

Annotation : Select the entire word, not just the few characters that need to be changed.

标点符号(Punctuation)

定义 :“该句的标点符号使用错误或者缺失。”

Definition : 'The punctuation of the sentence is wrong or missing.'

请注意!“如果存在引号错误,则同时选择标点符号和被引的词,而不仅仅是标点符号本身。”

Be careful! If the punctuation mark is a quotation mark, you should select 'punctuation' and select the entire word, not just the punctuation mark. 标注方式 :选择标点符号。

Annotation : Select the punctuation mark.

风格和语域问题(Style & register)

定义 :“文章存在风格和语域层面的问题。”

Definition : 'The text has stylistic problems or problems in terms of register.'

语域问题(Register)

定义 :“两个词或表达意思相同,但该词或表达过于正式或过于非正式,因为这样的表达所属的语域不完全适合目标受众。”

Definition : 'The words have the same meaning, but the chosen word/expression is too formal/informal/... for the text or belongs to a regional variety of the language that is not entirely suitable for the target audience.'

标注方式 :选择不符合语域的词或表达。

Annotation : Select the word(s) or expression from the inappropriate register.

重复问题(Repetition)

定义 :“同样一个词或表达使用过于频繁或出现距离过近,建议使用近义词。”

Definition :'The same or a very similar word/expression is used too often or is too close to the previous occurrence of the word/expression, it's better to use a synonym.'

标注方式 :选择重复出现的第一个词/表达,在Comment区注明为何/在何处该词/表达使用过于频繁。

Annotation :Select the first occurrence of this word/expression and specify why/where it has been used too often in the Comment section.

不地道(Unidiomatic)

定义 :“这句话/成分并非存在语法错误或长句,而是受英语原文的影响,导致可读性差,需要使用更加地道的译文。”

Definition : 'The sentence / constituent is not grammatically incorrect nor syntactically long, but it is influenced by the English source text, which leads to low readability. It could be translated in a much more idiomatic way.'

标注方式 :选择影响译文可读性的成分。

Annotation :Select the constituent that affects readability.

拗口(Awkward)

定义 :“这句话包含过多的嵌套从句,或太冗长,虽然可以理解语义,但十分笨拙或冗长,理解起来有难度。”

Definition : 'A sentence is written with many embedded clauses and an excessively wordy style. While the meaning can be understood, the text is very awkward and difficult to follow.'

标注方式 :选择整个句子。

Annotation : Select the entire sentence.

句段过短(Short sentence segments)5

定义 :“该句段包含过多短句段,影响了可读性”。

Definition :'This segment contains too many short sentence segments, which affects the readability.'

标注方式 :选择拆分该句,使其成为超过两句的标点符号,如逗号或分号。

Annotation :Select the punctuation marks, such as commas or semicolons, that separate the sentence into more than two sentence segments.

文本类型(Text type)

定义 :“这未必是一个问题,但因为文本类型的关系,需要不同的句子结构或删除一些内容。”

Definition :'This is not necessarily a problem, but the text type allows or requires different constructions or deletions.'

其它风格和语域问题(Style & register other)

当您发现某一处文体问题不属于以上任何错误类型时,请选择此类别。请务必给出您选择此类别的理由。

Choose this category when you encounter a style/ register problem that does not belong to any of the abovementioned categories. Always explain why you choose this category.

衔接与连贯(Cohesion & coherence)

定义 :“译文的衔接或连贯性存在问题,比如缺少指代词、连接词、逻辑结构存在问题、表述不一致等。”

Definition :'There is something wrong with the coherence of the text: lack of reference, conjunctin/linking words, and logical structure, inconsistency,…'

衔接问题(Cohesion)

定义 :译文中必要的照应、替代、省略、连接或词汇衔接手段缺失,或使用不正确,导致译文无法很好地理解。

Definition : 'Portions of the text needed to connect it into an understandable whole (e.g., reference, substitution, ellipsis, conjunction, and lexical cohesion) are missing or incorrect.'

标注方式 :如果衔接词用法错误,则选择该衔接词。如果衔接词缺失,则选择本应该包含照应词的成分。

Annotation : If there is a conjunction/linking word, select the characters. If the conjunction/linking word is missing, select the constituent that should have contained the conjunction/linking word.

逻辑问题(Logical problem)

定义 :逻辑问题是指译文选项根据文本的语境无法理解,或不符合事实常理。

Definition : 'Logical problems are those choices that do not make sense in the context of the text, or the world at large'

标注方式 :如果逻辑错误局限于句子的某一个词或一部分,则选择这个词或成分。如果整句话都存在逻辑错误,则选择整句话。

Annotation : If the logical problem is situated in one word or a part of the sentence, select this character/constituent. If the problem is situated in the whole sentence, select this sentence as a whole.

不一致(Inconsistency)

定义 :“术语或符号通篇使用不一致。”

Definition : 'Terms or notations are used inconsistently throughout the text.'

标注方式 :选择第一次出现不一致的词。

Annotation : Select the first inconsistent occurrence of the word.

其它衔接连贯问题(Cohesion & coherence other)

当您发现某一处衔接或连贯问题不属于以上任何错误类型时,请选择此类别。请务必给出您选择此类别的理由。

Choose this category when you encounter a cohesion or coherence problem that does not belong to any of the abovementioned categories. Always explain why you choose this category.

  • 例:  根据对一项为拯救红狼而建立的濒危物种项目的审查 ,联邦政府试图阻止 该狼在野外消失的努力陷入了困境,红狼是北美仅有的独特物种。(TT02)
  • 此例中前半句都在介绍联邦政府试图防止红狼灭绝,但遭遇了困境,后半句突然过渡到红狼属于北美仅有物种,前后半句的连贯性上略有不足。

    下一步文本的准备

    当您完成文本可接受度(Acceptability)的标注工作后,您需要为忠实度的标注工作做准备。为了确保您在标注忠实度时不受之前可接受度标注的影响,您需要在UAM Corpus Tool中上传Adequacy的文件夹,将所需标注的文档一一导入,即每标注完一份文件,导入下一份.txt文件。然后点击“TQA_Adequacy”,您会看到原文在上,译文在下,随后即可开始标注。

    第二步:标注忠实度(Adquacy)

    在标注完可接受度(Acceptability)方面的错误后,目前您要做的工作是标注译文的忠实度方面的错误。

    忠实度指译者确保译文与原文所包含的信息一致。这意味着所有的语义矛盾、词义错误、增译、漏译问题都是潜在的忠实度错误。作为标注人员,请以出版级别的质量要求来标注译文的忠实度错误。请在UAM Corpus Tool中完成标注工作,忠实度错误的主类别是意义偏离(meaning shift),其子类别已事先确定。各类别的定义和层次结构可通过UAM Corpus Tool中的LayersEdit Scheme查看。

    忠实度错误类型

    以下为忠实度纬度下具体的分类和具体子类别的定义、标注方式、注意事项和举例。

    语义偏离(Meaning shift)

    词义错误(Word sense)

    命名实体错译(Entity)

    术语错译(Terminology)

    上义词(Hyperonymy)

    下义词(Hyponymy)

    过于直译(Overly-literal)

    语义矛盾(Contradiction)

    歧义(Ambiguous translation)

    代词错译(Pronoun)

    数量错译(Quantity)

    量词错译(Classifier)

    修饰错误(Misplaced word)

    时间错译(Time)

    衔接错译(Cohesion)

    功能词错译(Function word)

    增译(Addition)

    漏译(Deletion)

    未译(Untranslated)

    其它词汇错译(Other lexical mistranslation)

    其它(Other meaning shift)


    词义错误(Word sense)

    定义 :某一汉语词汇是原文中某一词汇的汉语翻译之一,但这一汉语翻译并不适用于原文的语境。

    Definition : 'The Chinese characters are a possible translation of the word in the ST, but not of the meaning the word has in this context.'

    标注方式 :选择译文中相应的词。

    Annotation : Select the character(s).

    命名实体错译(Entity)6

    定义 :人名、地名或其它实体机构名称与原文不匹配。”

    Definition : 'Names, places, or other “named entities” do not match.'

    标注方式 :选择实体名称,详见附录1:英汉命名实体表

    Annotation : Select the named entity. Please refer to the Appendix 1: English-Chinese Glossary_Named entity.

    术语错译(Terminology)

    定义 :没有遵循特定的术语规范:原文中的词为一个术语词条,但译者选择另外一个词作为译文。

    Definition :'Non-adherence to the specified terminology guidelines: The source text word was an entry in the glossary, yet the translator chose a different word as a translation. '

    标注方式 :选择这个术语,详见附录2:英汉术语表

    Annotation : Select the term. Please refer to the Appendix 2: English-Chinese Glossary_Terminology.

    请注意: 如果存在术语翻译错误,请同时标注该错误为“词义错误”或其它错误(根据错误的性质决定)和“术语错误”。

    Be careful! (1) If the translation is an incorrect translation of a word that was present in the glossary, annotate it both as a 'wrong word sense' or 'other' problem (depending on the nature of the incorrect translation) and as a 'terminology' problem.

    请注意: 如果某一术语翻译也存在,但不符合此处的语境,选择“词义错误”,而不选术语错误。

    Be careful! (2) If the translation is one of the possible translations of the word according to the glossary, but not the one needed in this context, select 'wrong word sense', not terminology.

    上义词(Hyperonymy)

    定义 :“译文采用的是上义词或表达,而没有根据原文处理地更加具体或明确。”

    Definition : 'The translation contains a superordinate term or expression even though it could have been translated in an equally specific/explicit way.'

    标注方式 :选择上义词。

    Annotation : Select the hypernym.

    下义词(Hyponymy)

    定义 :“译文中使用了原文中某一词的下义词,而没有根据原文一样将译文处理地宽泛一些。”

    Definition :'The target text contains a hyponym of the word/expression used in the source text, even though it could have been translated in an equally specific way.'

    标注方式 :选择下义词。

    Annotation : Select the hyponym.

    过于直译(Overly-literal)

    定义 :译文过于直译,原文的隐含意义缺失。

    Definition : The translation is overly literal and the implied meaning of the source text is missing.

    标注方式 :在译文中选择该成分。

    Annotation : Select the constituent in the target text.

    请注意: 过于直译的译文为字对字的翻译,字对字的直译。

    Be careful! The overly-literal translation is the word-for-word translation.

    语义矛盾(Contradiction)

    定义 :目标语和源语所表达的语义有矛盾

    Definition : 'The target text contradicts the source text.'

    标注方式 :选择译文中存在矛盾的成分或句子。

    Annotation : Select the entire constituent / section of the sentence that contains the contradiction.

    歧义(Ambiguous translation)

    定义 :原文没有歧义,但译文有歧义。

    Definition : 'An unambiguous source text is translated ambiguously.'

    标注方式 :选择译文中存在矛盾的成分或句子。

    Annotation : Select the entire constituent / section of the sentence that contains the ambiguous translation.

    代词错译(Pronoun)

    定义 :“该功能词(如:人称代词、不定代词)在译文中的使用改变了原文所传达的意义。”

    Definition : "The chosen translation for the pronoun (e.g., personal pronoun, indefinite) leads to a change in meaning between source and target text.

    标注方式 :选择该代词。

    Annotation : Select the pronoun.

    数量错译(Quantity)

    定义 :译文所表达的数字或数量与原文所表达不同。

    Definition : 'The number or amount mentioned in the target text is different from that in the source text.'

    标注方式 :如果数字不同,则选择数字,如果数量不同,则选择量化单位。

    Annotation : If the number is different, select the word. If the amount is different, select the quantifying element.

    量词错译(Classifier)

    定义 :“译文中所使用的量词改变了原文所传达的意义。”

    Definition : ' The chosen classifier in the target text leads to a change in meaning between source and target text.'

    标注方式 :选择该量词。

    Annotation : Select the classifier.

    修饰错误(Misplaced word)

    定义 :"译文中的某一成分所修饰的词或成分与原文某一成分所修饰的词或成分不同,因此改变了原文的意义。"

    Definition : 'The element in the target text modifies a different word/constituent than the one in the source text, thus changing the meaning.'

    标注方式 :在译文中选择影响原文意义的错位词/修饰词。

    Annotation : Select the misplaced word (or the modifier) in the target text that changes the meaning of the ST constituent.

    时间错译(Time)

    定义 :"译文所表达的时间与原文所表达的时间不同,译文改变了原文的意义。这也许是因为动词时态的错误使用或者错误使用表示时间的元素导致。"

    Definition : 'The time of the target text is different from the one in the source text, which changes the meaning. This can be caused by an incorrect verb tense or temporal element.'

    标注方式 :选择动词或时间元素。

    Annotation : Select the verb or the temporal element.

    衔接错译(Cohesion)

    定义 :“译文中的连接成分表达的关系与原文不同。”

    Definition : 'The conjunction expresses a different relation in the target text than in the source text.'

    标注方式 :选择译文中与原文所表达的关系不同的句子。

    Annotation : Select the sentence in the target text that has different relation than in the source text.

    功能词错译(Function word)

    定义 :“该功能词(如:介词、助动词、冠词、指示词)在译文中的使用改变了原文所传达的意义。”

    Definition : 'The chosen translation for the function word (e.g., a preposition, "helping verb", article, determiner) leads to a change in meaning between source and target text.'

    标注方式 :选择该功能词。

    Annotation : Select the function word.

    增译(Addition)

    定义 :“一个元素虽然有意义,但并未在原文中提及,却出现在译文中。”

    Definition : 'A meaningful element that cannot be derived from the source text is added in the target text.'

    标注方式 :选择增译的部分。

    Annotation : Select the added information.

    漏译(Deletion)

    定义 :“原文中的元素或关系在译文中被删除。”

    Definition : 'A meaningful element of the source text or relationship present at the lexcial/synactic level in the source text is deleted in the target text.'

    请注意 :请不要将“上义词”错误标注为“漏译”错误。

    Be careful! :Cases of hyperonymy must be annotated as such, not as cases of deletion. 标注方式 :在英语原文中选择漏译的元素。

    Annotation : Select the elements that are deleted in the English source text.

    未译(Untranslated)7

    定义 :“原文中的内容理应翻译,但在译文中仍是原文的内容,并未翻译。”

    Definition : 'Content that should have been translated has been left untranslated.'

    标注方式 :选择未翻译的内容。

    Annotation : Select the untranslated content.

    其它词汇错译(Other lexical mistranslation)

    定义 :“该错译是指词义错误以外的词汇错译。”

    Definition : 'The target word is a mistranslation of the ST word, but it is not a possible translatin of the word in the ST.'

    标注方式 :选择译文中错译的词汇。

    Annotation : Select the mistranslated target word.

    其它(Other meaning shift)

    当您发现某一处语义错误不属于以上任何错误类型时,请选择此类别。请务必给出您选择此类别的理由。

    Choose this category when you encounter a meaning shift that does not belong to any of the abovementioned categories. Always explain why you choose this category.

    确认标注阶段:制定“统一标准”

    制定“统一标准”

    针对笔者与其中一位外部评分员之间存在分歧的标注信息,须由笔者与另外一位外部评分员进行商讨,直至达成一致为止。如果某一问题重复出现多次,可将该问题纳入标注指南中或在错误类型中增加新的类别。可邀请30名及以上的翻译专业本科生(母语为汉语)对评分员难以达成一致的译文进行了可接受度评判。根据kappa值的分级标准(Landis & Koch, 1977: 165),设定可接受度错误阈值为60%,即如果60%的学生认为某一译文存在可接受度的问题,则就认定此问题存在可接受度层面的问题。

    附录1:英汉命名实体表”

    Atacama Trench

    阿塔卡马海沟/秘鲁-智利海沟

    U.S. Fish and Wildlife Service

    美国鱼类及野生动(植)物管理局8

    Alligator River National Wildlife Refuge

    鳄鱼河国家野生动物保护区/阿利盖特河国家野生动物保护区

    Outer Banks

    外滩群岛/北卡州外滩

    Xochimilco

    (赫)霍奇米尔科

    Aztec

    阿兹特克人

    Norwegian island of Spitsbergen

    挪威的斯匹次卑尔根岛/斯匹茨卑尔根岛


    附录2:英汉术语表”

    snailfish

    狮子鱼

    deep-sea lander

    深海着陆器

    red wolf

    红狼/赤狼

    coyote

    郊狼/丛林狼/草原狼

    tilapia

    罗非鱼

    carp

    鲤鱼

    global seed vault

    全球种子库/国际种子库

    permafrost

    永冻层/永久冻土层/永冻土/永久冻土


    参考文献

    Burchardt, A., & Lommel, A. (2014). Practical guidelines for the use of MQM in scientific research on translation quality. Retrieved from Berlin, Germany: http://www.qt21.eu/downloads/MQM-usage-guidelines.pdf

    Chen, H.-H. (1994). The contextual analysis of Chinese sentences with punctuation marks. Literary and Linguistic Computing, 9(4), 281-289.

    Daems, J., Vandepitte, S., Hartsuiker, R. J., & Macken, L. (2017). Translation methods and experience: A comparative analysis of human translation and post-editing with students and professional translators. Meta, 62(2), 245-270.

    Halliday, M. A. K., & Hasan, R. (1976). Cohesion in English. London: Longman.

    Landis, J. R., & Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics 33(1): 159-174.

    Muñoz-Martín, R. (2016). Of minds and men—Computers and translators. Poznań Studies in Contemporary Linguistics 52(2): 351–381.

    Yamashita, J., & Jiang, N. (2010). L1 Influence on the Acquisition of L2 Collocations: Japanese ESL Users and EFL Learners Acquiring English Collocations. TESOL Quarterly, 44(4), 647-668.

    施栋琴. (2002). 英汉进行体结构用上的两个差异及其对翻译实践的启示. 中国科技翻译(2), 23-27.

    赵秋荣、王克非. (2013). 英译汉翻译语言的阶段性特点——基于历时类比语料库的考察. 中国翻译(3), 15-19.

    朱永生、郑立信、苗兴伟. (2001). 英汉语篇衔接手段对比研究. 上海: 上海外语教育出版社.



    1. MQM最新的翻译错误类型分类参见:http://www.qt21.eu/mqm-definition/definition-2015-12-30.html 返回正文.

    2. Daems et al.(2017b)的翻译质量评估错误类型分类和标注方法参见:https://users.ugent.be/~jvdaems/TQA_guidelines_2.0.html 返回正文.

    3. 在表达层面的歧义与MQM中忠实度层面的歧义不同,是因为前者强调的是原文可能有歧义,而导致译文表达存在歧义;后者强调原文没有任何歧义,而译者在译文中引入了歧义:http://www.qt21.eu/mqm-definition/issues-list-2015-12-30.html#ambiguous-translation 返回正文.

    4. 程式化表达和搭配虽然都属于多词单位,但前者的词汇组合强度要大于后者(Yamashita & Jiang, 2010, p. 249)。 返回正文.

    5. 根据语料库数据,汉语句子中约75%的汉语句子包含两个以上的句段,这些句段由逗号或分号分开(Chen, 1994)。本研究借鉴赵秋荣、王克非(2013, p. 17)的做法,将句段定义为由“逗号、冒号、分号、叹号和问号”这些切分标记切分而得的句子片段。 返回正文.

    6. 参考MQM:http://www.qt21.eu/mqm-definition/issues-list-2015-12-30.html#entity 返回正文.

    7. 参考MQM: http://www.qt21.eu/mqm-definition/issues-list-2015-12-30.html#untranslated 返回正文.

    8. 此处不能处理为“服务局”。 返回正文.