千年甲骨文、一朝 AI 解:我国厦门大学团队探索新方法

xxn 阅读:81127 2024-12-05 10:01:48 评论:0

IT之家 12 月 5 日消息,厦门大学官方公众号昨日(12 月 4 日)发布博文,宣布该校团队正在尝试利用人工智能(AI)多模态大模型,结合甲骨文的音、形、义等多元信息,帮助专家更高效地进行甲骨文考释工作。

甲骨文简介

IT之家援引博文介绍,甲骨文又称为“殷墟文字”,距今已有三千多年历史,是世界四大古文字之一,也是现代汉字的根基。

传统的甲骨文字考释工作非常耗时费力,依赖专家进行人工释读,通常利用字形分析、辞例研究等方式,需要考古专家具备丰富的知识积累和大量文献阅读,结合多方面知识来破译甲骨字,这已经难以为继。

借助 AI 破译甲骨文

近年来,AI 技术得到迅猛发展,利用深度学习模型的强大语义表征能力来辅助破解甲骨文,优势已经显现。

该团队研究人员针对甲骨文数据稀缺、图像质量不一的问题,系统整理相关古文字数据,构建了更大规模且更高质量的甲骨文多模态数据集,提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案。

该项目将设计一系列与实际考释过程紧密相关的任务和评估方法,例如跨字体图像映射、跨字体 IDS(表达结构的部首偏旁序列)解码以及甲骨字现代字对译关系等,从而有效训练多模态大模型。

该团队利用其强大的跨模态理解能力来辅助破解甲骨文。借助大模型提供的语义嵌入基础,该项目还将设计一种综合考释模型,融合音、形、义等多元信息,通过字形结构、语义关联、同音通假和用法聚类分析,开发一种更轻量的考释系统,以适应资源有限的实际考释场景。

广告声明:文内包含的对外跳转链接(可包括超链接、二维码、口令等形式),用于传达更多信息,节省挑选时间,仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容