腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”

xxn 阅读:92165 2024-12-26 10:02:00 评论:0

IT之家消息显示,腾讯研究院最新推出了DRT-o1系列模型,通过长链思维(CoT)提高文学作品翻译质量,更能理解比喻和隐喻等。

项目背景

IT之家指出,神经机器翻译(NMT)在处理日常文本翻译上取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临挑战。

这些表达常常包含深层文化和语境含义,简单直译难以准确传达内涵,而由腾讯开发的DRT-o1系统提供新思路解决这一难题。

项目介绍

研究人员从古腾堡(Project Gutenberg)计划中选取400本公共领域英文书籍,提取577600个句子,并筛选出63000个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。

DRT-o1采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供建议,评估员根据预设指标对翻译质量评分,通过反复迭代提升翻译质量。

工作流程包括三个主要步骤:

  • 关键词翻译:翻译者识别句子中关键词并提供翻译。

  • 初步翻译:翻译者根据双语对应关系提供初步翻译。

  • 翻译精炼循环:顾问评估翻译并提反馈,评估员根据评分标准给出评分。翻译者根据反馈和评分提供新翻译。当评分达到阈值或达到迭代次数,循环停止。

最终翻译结果由GPT-4o润色,确保流畅性和可读性,数据集包含22264个深度思考的机器翻译样本。

开发者举例说明,原文是:

母亲双脚支在凳子上,似乎在尽力参透那答案,那个女性特有的深刻性让她心头一阵骇然。

这句话中的“心头一阵骇然”是个成语,表明某事对她产生了强烈影响。DRT-o1模型通过长链思考最终将其翻译为:

母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。

这翻译不仅传达了原文意思,还保留了原文情感色彩。鉴于此,IT之家列出了谷歌翻译,如下所示:

母亲双脚支在凳子上,似乎在尽力理解这答案,那女性的深刻性让她吃惊不小。

Deepl的翻译如下:

母亲将脚支在凳子上,似乎在努力弄清楚这答案,而答案的女性化深刻性让她恍然大悟。

性能

DRT-o1共有DRT-o1-7B和DRT-o1-14B两个规模版本。

实验证明,与Qwen2.5-7B-Instruct相比,DRT-o1-7B的BLEU分数提高了8.26分,CometScore提高了3.36分;与Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU提升了7.33,CometScore提升了1.66。

DRT-o1-7B的性能甚至超过更大的模型QwQ-32B,BLEU分数高出7.82分,CometScore高出1.46分,展现了其在处理复杂语言结构方面的强大能力。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容