图 扩散模型破译甲骨文算法
甲骨文起源于中国商朝,是已知最早的成熟汉字系统,代表了早期汉字的形态,具有重要的历史和文化价值。破译甲骨文不仅有助于研究中国古代历史和文化,还促进了对汉字和汉语发展的深入理解,强化了中国文化的传承与延续。
在国家自然科学基金项目(批准号:62225603)等资助下,华中科技大学白翔教授团队与华南理工金连文教授、安阳师范学院刘永革教授团队的合作研究成果“利用扩散模型破译甲骨文(Deciphering Oracle Bone Language with Diffusion Models)”获ACL 2024会议最佳论文奖。甲骨文的破译目前严重依赖于专家的手工解析,涉及大量跨学科的知识,因而破译进度缓慢且难度较大。该团队从图像生成的视角出发,提出并构建了甲骨文破译模型Oracle Bone Script Decipher(OBSD)。该模型利用扩散模型模拟汉字演变过程,将甲骨文文字图像转化为现代汉字图像,通过产生未破译甲骨文的现代汉字来反推其含义,从而辅助破译甲骨文。大量实验表明,OBSD能够为尚未破译的甲骨文提供字形或者图像上的线索,促进了甲骨文的破译工作。ACL是计算语言学和自然语言处理领域的顶级国际学术会议,由国际计算语言学协会于1963年创办,目前已有62年的历史。该论文是历史上第三篇以国内单位为第一单位获得最佳论文奖的论文。
白翔教授团队长期从事文档图像智能、3D视觉等方向的相关研究。团队在《自然·机器智能(Nature Machine Intelligence)》《IEEE模式分析与机器智能汇刊(IEEE Transactions on Pattern Analysis and Machine Intelligence)》《IEEE计算机视觉与模式识别会议(The IEEE/CVF Conference on Computer Vision and Pattern Recognition)》等人工智能顶级期刊和会议上发表论文逾百篇,被包括图灵奖得主在内的150余位人工智能顶级科学家、院士、ACM/IEEE/AAAI/IAPR Fellow知名学者引用和正面评价。团队研究的场景文字检测与识别算法成果获评为省部级自然科学奖一等奖,已应用于高通、Meta、华为、腾讯、阿里巴巴、百度、美团等企业的产品或系统。