腾讯推出 DRT-o1 系列 AI 模型:长链思考推理实现文学翻译“信达雅”
IT之家消息显示,腾讯研究院最新推出了DRT-o1系列模型,通过长链思维(CoT)提高文学作品翻译质量,更能理解比喻和隐喻等。
项目背景
IT之家指出,神经机器翻译(NMT)在处理日常文本翻译上取得显著进展,但在翻译文学作品时,特别是隐喻和明喻等修辞手法时,仍面临挑战。
这些表达常常包含深层文化和语境含义,简单直译难以准确传达内涵,而由腾讯开发的DRT-o1系统提供新思路解决这一难题。
项目介绍
研究人员从古腾堡(Project Gutenberg)计划中选取400本公共领域英文书籍,提取577600个句子,并筛选出63000个包含明喻和隐喻的句子,用于训练模型进行“深度思考”。
DRT-o1采用了一种创新的多智能体框架,包含翻译员、顾问和评估员三个角色。翻译员负责初步翻译,顾问提供建议,评估员根据预设指标对翻译质量评分,通过反复迭代提升翻译质量。
工作流程包括三个主要步骤:
关键词翻译:翻译者识别句子中关键词并提供翻译。
初步翻译:翻译者根据双语对应关系提供初步翻译。
翻译精炼循环:顾问评估翻译并提反馈,评估员根据评分标准给出评分。翻译者根据反馈和评分提供新翻译。当评分达到阈值或达到迭代次数,循环停止。
最终翻译结果由GPT-4o润色,确保流畅性和可读性,数据集包含22264个深度思考的机器翻译样本。
开发者举例说明,原文是:
母亲双脚支在凳子上,似乎在尽力参透那答案,那个女性特有的深刻性让她心头一阵骇然。
这句话中的“心头一阵骇然”是个成语,表明某事对她产生了强烈影响。DRT-o1模型通过长链思考最终将其翻译为:
母亲将双脚搭在凳子上,似乎在努力探究那个答案,那答案中女性特有的深刻性令她猛然心生震撼。
这翻译不仅传达了原文意思,还保留了原文情感色彩。鉴于此,IT之家列出了谷歌翻译,如下所示:
母亲双脚支在凳子上,似乎在尽力理解这答案,那女性的深刻性让她吃惊不小。
Deepl的翻译如下:
母亲将脚支在凳子上,似乎在努力弄清楚这答案,而答案的女性化深刻性让她恍然大悟。
性能
DRT-o1共有DRT-o1-7B和DRT-o1-14B两个规模版本。
实验证明,与Qwen2.5-7B-Instruct相比,DRT-o1-7B的BLEU分数提高了8.26分,CometScore提高了3.36分;与Qwen2.5-14B-Instruct相比,DRT-o1-14B的BLEU提升了7.33,CometScore提升了1.66。
DRT-o1-7B的性能甚至超过更大的模型QwQ-32B,BLEU分数高出7.82分,CometScore高出1.46分,展现了其在处理复杂语言结构方面的强大能力。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考。
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。