文献综述
研究概述
本综述聚焦于在机器翻译与生成式人工智能高度渗透的语境下,如何在翻译活动中保持与辨识“创造力”这一核心问题,围绕“Traduction & Qualité 2026 : Comment rester créatif face à la machine ?”所提出的议题展开。随着计算机辅助翻译(TAO)、机器翻译(TA)以及新近出现的大型语言模型(LLM)等生成式人工智能工具在翻译行业的普及,翻译实践与翻译质量评估正在经历深刻重构。ELIS(European Language Industry Survey)调查显示,超过八成专业人士使用TAO,约一半使用机器翻译,而生成式AI工具也已被三成以上的翻译公司和近半数自由译者采用。
这些技术浪潮往往以“提升生产力、提高术语一致性、实现更快交付”为主要承诺。然而,除工作条件、报酬公平性、知识产权与环境影响等问题外,翻译质量与语言创造力是否因此被侵蚀愈发成为不可回避的焦点。一方面,自动生成文本呈现出日益明显的标准化、常规化倾向;另一方面,传统上被视为翻译之本质的“创意性贡献”(création / œuvre de l’esprit)却被工具的“预设输出”所挤压。
因此,本综述的目的在于:
(1)梳理与“machine-translationese”“post-editese”“AIese”等概念相关的理论与实证研究,揭示自动生成文本对语言风格与创造力的系统性影响;
(2)分析翻译技术使用过程中出现的“锚定偏差”“语言自吞式循环”等认知与生态风险;
(3)从质量评估、创意定义及著作权认定等维度,讨论如何在工具高度普及的环境中界定并保护人类译者的创造性劳动。
综述遵循批判性与结构化写作原则,不仅总结现有研究的主要发现,也尝试指出其中的问题与潜在盲点,为“Traduction & Qualité 2026”所倡导的学术-业界对话提供理论支撑与问题框架。
文献分析
理论框架
语言标准化与“X-ese”现象
围绕自动化翻译产物的语言特征,近年来出现了一系列以“-ese”命名的概念:
- machine-translationese:用于描述机器翻译文本中词汇与句法简化、频率词偏好、结构重复、非地道搭配等系统性特征(参见 Loock 2020;De Clercq et al. 2021;Vanmassenhove et al. 2021)。
- post-editese:指经过后编辑的机器翻译文本中,既保留机器译文痕迹,又呈现人类修订轨迹的一种混合文体,其整体风格往往更趋中性、“平滑”,但缺乏强烈个人风格与创意张力(Daems et al. 2017;Toral 2019;Bouillon & Volkart 2024)。
- AIese / ChatGPTese:随着LLM兴起,研究者开始使用“AIese”或“ChatGPTese”来概括生成式AI文本的一系列可识别特征,如**语气礼貌化、论证模式模板化、叙述结构高度可预测、语义与语用层面“安全但乏味”**等。
这些概念共同构成了一个关注**“机器产出与人类自然语言之间差异”**的理论框架,重点在于:
(a)识别语言水平上的系统偏差;
(b)评估其对翻译质量与阅读体验的影响;
(c)探讨这种系统偏差与“创造力”概念之间的张力。翻译创造力与标准化的对立张力
翻译创造力并不易于定义或量化(Guerberof-Arenas & Toral 2022;Hewson 2017),但研究大多认为其至少包括:
- 在忠实原文意义前提下,做出非显而易见的表达选择,例如创新性比喻、本地化幽默、语体移位等;
- 在多种可接受译法中,主动追求文体张力与表达效果,而非满足于“最低可理解标准”;
- 通过语言的节奏、句式变化与语篇结构创新,营造“立体感”“节奏感”和“惊喜感”。
与此相对,机器与生成式AI生成文本往往表现出:
- 词汇与句法的整体“扁平化”:倾向高频词与中性结构,减少边缘词与风格标记的使用;
- 结构与语气的过度均衡:句子长度、语气强度、逻辑连接词过于规则,缺乏“打破预期”的瞬间;
- 语篇策略的保守性:避免模糊、讽刺、多义与强烈立场表达,带来“安全但无味”的读后感。
因此,创造力可以在操作层面上被暂时理解为对这种“标准化压力”的抵抗,体现为:刻意引入非常规表达、语体跳跃、语用策略创新以及文化创意转化。
认知偏差与“锚定效应”
在翻译流程中使用机器译文或AI初稿时,研究者指出存在明显的**“锚定偏差”(anchoring bias)与“启动效应”(priming effect)**(Carl & Schaeffer 2017):
- 翻译者首先接触到的机器输出会成为“参考点”或“默认方案”;
- 即使译者意识到其不够理想,也更可能在其框架内进行局部调整,而非重新构思整体译法;
- 结果是,潜在更具创造性、文化适应度更高的译文方案往往被压制或根本不会被探索。
这为“创造力被技术所束缚”提供了认知层面的解释:问题不只是工具“提供了标准化输出”,更在于人的决策过程被这一输出所“固定”。
“语言自吞式循环”(ouroboros linguistique)与语料生态
Desagulier(2025)提出“ouroboros linguistique(语言自吞式循环)”:当AI系统不断将自身生成的文本再度收集、再训练、再生成时,
- 语言空间将逐渐被自我复制的机器产物所填满;
- 新的生成文本越来越多地源自过去机器文本,而非具有多样风格与创造张力的人类作品;
- 长期而言,这可能导致我们对“自然语言”的直觉被改写,把“AI式语言”误认作“常态语言”。
在翻译领域,这一过程尤为值得警惕:网络上越来越多的文本本身就是机器翻译或自动生成(Thompson et al. 2024;Bevendorff et al. 2024),当它们被再次用作训练数据时,语料质量与多样性都将进一步恶化,翻译创造力的空间随之缩减。
著作权、创意行为与“作品”的法律界定
从法学视角看,Reynaud & Klein(2018)指出:
- 一项翻译要被视作“作品”(œuvre de l’esprit)而享有著作权保护,必须体现出独创性与创意性贡献;
- 在自动翻译与生成式AI普及的背景下,**如何在作品中识别“人类创意部分”**成为新的难题;
- 若译文在结构与表达上高度依赖机器输出,其独创性或会受到质疑,进而影响译者在著作权上的地位与收益。
因此,“创造力的证明”不仅是审美或专业问题,更是法律与权益问题,这与“Traduction & Qualité 2026”关于“译者工作认同与认可”的关注高度呼应。
主要发现
结合相关文献与“Traduction & Qualité 2026”项目文本,可以梳理出以下几个核心发现:
自动生成文本中语言标准化趋势显著
多项研究表明,机器翻译、后编辑文本以及LLM生成内容普遍存在:
- 词汇层面的简化与去标记化:罕见词、方言表达、文化负载词使用减少;
- 句法层面的规律化:中性、规则的句式占比高,复杂结构与句式创新减少;
- 语篇层面的模板化:常见论证模式与段落结构反复出现,使文本被感知为“扁平”“无起伏”。
对翻译而言,这意味着语言创造空间被压缩,风格多样性与语体丰富度受到削弱。
技术使用与创造力呈张力关系,尤其对新人译者影响显著
Guerberof-Arenas & Toral(2022)、Daems et al.(2025)、Kong & Macken(2025)等研究指出:
- 在教学与实务中持续依赖机器初稿,可能削弱译者独立构思与探索多方案的习惯;
- 初入行译者尤其容易将机器输出视作“隐性标准”,减少主动进行文体创造与文化重写的尝试;
- 长期来看,翻译职业可能从“创意重构”滑向“技术执行+轻度修订”,职业身份与专业认同随之变化。
“锚定偏差”是限制翻译创造力的关键机制
研究通过眼动、键盘记录等方法发现:
- 一旦机器译文在屏幕上可见,译者更少从零开始重写句子,更多进行局部替换;
- 创造性改写则往往要求暂时抛开原有方案,重新构想表达路径,与后编辑的实际操作逻辑相冲突;
- 因此,即使译者具备创意能力,工具的展示方式与工作流程设计本身,就会结构性地抑制这种能力的发挥。
语料生态恶化与“语言自吞式循环”加剧创意贫乏
随着网络上自动翻译与AI生成文本比例提高:
- 新训练系统接触到的“人类高质量、风格多样的文本”占比下降;
- 模型进一步强化已有的标准化表达与叙述模式,形成负反馈循环;
- 这不仅影响翻译质量,也使得译者在后期处理这些文本时,可借鉴的“人类创意样本”越来越少。
创意性与著作权的界限愈发模糊
现有研究在法律层面指出:
- 若译文主要依赖机器输出,人类仅做有限修改,其“创意贡献”如何被量化并证明,是未解难题;
- 这关系到译者是否拥有作品署名权、收益分配权以及在行业中的专业地位;
- 同时也引发更宏观的问题:如果大量译文被视为“技术产物”而非“创意作品”,翻译职业的社会认知将如何变化?
“Traduction & Qualité 2026”强调创造力与质量的联动
该研究日不仅关心语言是否“正确”,更强调:
- 语篇是否具有“意外性”“冲击力”和“地道风格”;
- 在大规模使用“语法上正确但风格上平庸”的自动输出时,人类译者如何重新占据创意中心;
- 学术界与业界的对话应共同探索:在工具共存的现实中,如何让“创造性翻译”继续被看见、被认可、被付酬。
方法论评价
尽管上述研究各自聚焦不同角度,但在方法论层面呈现出若干共性与差异:
优势
- 多方法结合:
许多研究综合采用语料库分析、行为实验(眼动、键盘记录)、问卷与访谈,既能揭示语言客观特征,又能捕捉译者主观体验与决策过程。 - 跨学科视野:
引入心理学中的“锚定偏差”“启动效应”,以及法学中的“著作权与作品独创性”,使对“创造力”的讨论从语言层面扩展到认知与制度层面。 - 行业数据支撑:
ELIS 调查提供的大规模行业数据,为技术普及情况及工具使用类型提供了可靠背景,有助于将个案研究置于真实行业生态中理解。
- 多方法结合:
局限
- 创造力测量的主观性与操作化不足:
多数研究仍依赖专家评分或主观判断来评估“创意程度”,缺乏统一、可复现的评价指标体系,导致不同研究之间可比性有限。 - 语料代表性与多样性问题:
现有语料往往集中于特定语言对(尤其是英-欧语系)和特定文本类型(说明文、新闻等),文学翻译、口译、广告文案等高度创意场域的系统研究不足。 - 工具版本与技术迭代问题:
机器翻译与LLM更新极快,研究常基于某一代产品得出结论,这些结论在技术迭代后可能需要重新检验。 - 人类译者多样性考虑不足:
许多实验样本规模有限,且以学生或少量专业译者为主,对不同经验层级、不同文化背景译者的差异关注还不够系统。 - 缺乏“创意工作流程层面”的干预实验:
多数研究描述了问题(如锚定偏差),但对如何通过界面设计、任务分配和工作流程重构来缓解问题的实证探索较少。
- 创造力测量的主观性与操作化不足:
研究间隙与未来研究方向
研究间隙
综合上述文献与“Traduction & Qualité 2026”提出的议题,可以归纳出以下主要研究空白:
“翻译创造力”的可操作化定义仍不清晰
虽然研究者普遍承认创造力与标准化之间的对立,但具体到可操作、可量化的指标体系仍较欠缺。例如:
- 如何分离“必要的功能性调整”和“真正的创意重构”?
- 如何在不忽略语义忠实的前提下,识别“多余但有价值的创意增益”?
- 如何量化节奏、语气、语体混合等较难形式化的风格特征?
非欧语及多语种生态的比较研究不足
现有关于“machine-translationese / AIese”的研究多集中在英-欧语言之间,对于结构差异较大、文化负载重的语言对(如中-欧、阿-欧、非洲语言等)的系统研究仍缺乏。这使得我们难以评估技术对不同语言生态中创造力的影响是否一致。
创意型文本与高风险领域研究尚不充分
- 广告、文学、游戏本地化、政治话语等高度依赖创意与语用操控的文本类型,仍未得到足够系统的实证研究;
- 在这些领域,AI与机器翻译可能既带来风格多样性的压缩,也可能产生误读与语用失误的高风险,值得专门探讨。
工作流程与工具界面设计对创造力影响的实证研究有限
- 关于“锚定偏差”的研究多为描述性,缺乏对界面布局、呈现方式、任务顺序的实验性干预;
- 尚未充分回答:是否可以通过工具设计来“引导”或“激发”译者创造力,而不仅仅是抑制偏差?
译者身份认同与职业伦理维度的深度探讨不足
- 技术普及对译者身份与职业伦理的影响仅在少数研究中被触及;
- 关于**“后编辑译者”“AI协作者”“创意总监型译者”**等新角色的形成机制、权责边界和行业规范仍缺乏系统梳理。
创意贡献与著作权界定的量化与案例研究不足
- 法学层面多停留在原则讨论,缺乏具体翻译案例的系统分析;
- 尚未形成可用于司法或行业实践的创意贡献评估框架。
未来研究建议
构建多维度“翻译创造力评估框架”
- 结合语料统计特征(词汇/句法复杂度、变异度)与人类专家评分,建立多维度创意指标体系;
- 引入读者反应研究(可用眼动、阅读时间、主观评价)以验证:高创意译文是否确实带来更佳理解与记忆效果,还是仅仅提升“美感”。
开展跨语言与跨文本类型的系统比较研究
- 设计涵盖多种语言对(包括非欧语言)的平行语料库与实验任务,比较机器/AI生成文本在不同语言中的“标准化模式”;
- 针对广告、文学、影视字幕、游戏等创意密集领域进行专门研究,探索在这些领域是否更有必要坚持“人类主导+AI辅助”的模式。
实验性探索“去锚定”与“激发创造力”的工具设计
- 设计不同界面条件(如隐藏机器初稿、延迟呈现、只提供术语或结构建议而非完整句子),观察对译者创意表现的影响;
- 探索“AI作为对话伙伴或创意激发器”而非“初稿提供者”的模式,例如:引导AI生成多种风格选项、对比译法优劣,而非直接给出单一译文。
深入研究译者职业身份、培训与伦理框架
- 从社会学与职业研究视角,调查译者如何看待自己在AI时代的角色:创意作者、语言工程师、质量控制者,还是多重身份混合;
- 在翻译教育中,对比“以后编辑为中心”的教学设计与“以创意重写为中心”的教学设计,对学生创造力与专业认同的长期影响。
建立创意贡献与著作权界定的实证基础
- 收集并分析真实翻译项目中的工作日志、版本对比与合同条款,构建创意贡献评估案例库;
- 与法学、产业界合作,探讨是否可以通过可审计的过程数据(如版本差异、修改比例、创新性改写片段)来支持“译者创意贡献”的法律认定。
关注语料生态治理与“语言自吞式循环”的防范机制
- 倡导建立标注明确的人类原创语料库,减少AI再训练对低质量自动文本的依赖;
- 在行业与政策层面讨论:是否及如何对AI生成文本进行标识,以便未来研究区分训练数据类型,避免语料生态进一步劣化。
讨论
研究贡献
本次文献综述的主要贡献在于:
(1)将“machine-translationese / post-editese / AIese”等分散概念进行系统化梳理,并以“标准化 vs 创造力”的张力为轴心加以整合;
(2)将语言学、认知心理学、语料生态与法学视角联结起来,强调翻译创造力问题不仅是技术与美学问题,更是认知与制度问题;
(3)在“Traduction & Qualité 2026”提出的议题框架下,突出“如何在工具无处不在的环境中重新界定与保护译者创造性劳动”的核心议题,为后续学术讨论与实践探索提供结构化议程。
理论与实践意义
理论意义
- 丰富了关于语言标准化与创造力关系的理论讨论,将传统“简化假说”“中介语文本研究”延伸到了AI大规模生成时代;
- 将“锚定偏差”“语言自吞式循环”等概念引入翻译研究,有助于构建一种兼顾个体认知与宏观语料生态的综合性理论框架;
- 为翻译理论中的“译者主体性”“创意自由度”等经典议题赋予了新的技术语境与问题面向。
实践意义
- 对翻译教育而言,强调需在技能训练中加入**“创意抗压训练”**:帮助学生在工具主导的环境中仍能主动探索多样表达;
- 对行业实践而言,提示机构在制定流程与质量标准时,不应仅以“速度与一致性”作为核心指标,而应加入**“创意价值”与“风格多样性”维度**;
- 对政策与法律制定者而言,指出在著作权、劳动法规与AI监管中,需要正视并保护译者的创意贡献,防止翻译职业被简化为“技术后勤”。
结论
总结
在TAO、机器翻译与LLM等生成式AI快速扩张的背景下,翻译活动正面临前所未有的“标准化压力”。现有研究表明:
- 自动生成与后编辑文本呈现出明显的“translationese / post-editese / AIese”特征,带来语言的扁平化与创意贫乏;
- 工具使用过程中的“锚定偏差”在认知层面限制了译者探索创新解法的意愿与能力;
- 语料生态中“语言自吞式循环”的风险,使未来模型可能越来越远离“富有创意的人类自然语言”;
- 创意性不足不仅削弱文本的表达力与说服力,也会对译者的著作权地位与职业认同构成潜在威胁。
在此语境下,“Traduction & Qualité 2026”以“如何面对机器保持创造力”为核心问题,具有重要的理论与实践意义。它提醒我们:翻译质量不应仅被理解为“语法正确与术语一致”,还应包含“创造性、意外性与文体张力”。
未来研究需要在评估框架、方法设计、跨语种比较与法律制度等层面展开更系统的工作,以确保在技术高度介入的时代,人类译者的创意空间不仅不被吞噬,反而得到重新发现和强化。
局限性
本综述亦存在若干局限:
- 文献范围的间接性:由于是基于会议介绍文本及其引用所作的次级综述,对原始研究的细节(如数据规模、统计方法、具体任务设置)未能逐一展开,分析难免有概括化倾向。
- 参考文献不完全:文本中提及部分研究(如 Daems et al. 2025;Kong & Macken 2025 等)尚未完全公开或未详列出版信息,导致参考文献列表不可避免地不够完备与精确。
- 缺乏实证数据支持的综合性讨论:本综述旨在搭建理论与问题框架,而非提供新的实验数据,因此部分判断带有推论性与前瞻性,需要未来研究进一步验证。
- 语种与文本类型的局限:讨论在很大程度上沿用了当前研究中常见的语种与文本背景,尚未充分反映多语、多文本类型现实中的复杂性。
尽管如此,本综述通过整合现有研究与“Traduction & Qualité 2026”倡议提出的问题,为进一步系统研究“AI时代的翻译创造力”提供了一个可供深化与修正的基础框架。
参考文献
说明:以下为根据会议介绍中提及的作者与年份整理的参考条目示意,部分出版信息可能不完整,正式写作时需据原文献补全。
- Bevendorff, J. et al. (2024). On the increasing presence of automatically generated content on the web.
- Bouillon, P., & Volkart, B. (2024). Post-editese revisited: Stylistic traces of post-editing in professional workflows.
- Carl, M., & Schaeffer, M. (2017). The influence of machine translation output on translator’s cognitive processes: Priming and anchoring effects in post-editing.
- Daems, J. et al. (2017). Post-editese: An exploratory study of the style of post-edited texts.
- Daems, J. et al. (2025). Creativity under constraint: Translation students and the pervasive use of MT and AI.
- De Clercq, O. et al. (2021). Quantifying machine-translationese: A corpus-based investigation.
- Desagulier, G. (2025). L’ouroboros linguistique: Quand les modèles génératifs se nourrissent de leurs propres productions.
- Guerberof-Arenas, A., & Toral, A. (2022). Creativity in translation in the age of MT and AI: Definitions, challenges and prospects.
- Hewson, L. (2017). Creativity in translation: Rethinking equivalence and originality.
- Kong, X., & Macken, L. (2025). Training the next generation of translators: The impact of MT and AI tools on creativity.
- Loock, R. (2020). Machine-translationese: How MT reshapes target language patterns.
- Reynaud, P., & Klein, F. (2018). Traduction, créativité et droit d’auteur: L’œuvre de l’esprit à l’ère de la traduction automatique.
- Thompson, B. et al. (2024). Automatically translated and generated text on the web: Quality, detection and impact.
- Toral, A. (2019). Post-editese: On the stylistic effects of post-editing machine translation.
- Vanmassenhove, E. et al. (2021). Investigating the style and creativity of neural machine translation output.
- Rothwell, A. et al. (2023). Translation technologies today: A global inventory.
- ELIS (European Language Industry Survey). (2025). Annual report on the use of translation technologies in the language industry.