从焚毁的卷轴到破碎的楔形文字泥板,人工智能怎么解密古代文献? — 新京报
近日,某娱乐圈明星的私生活再次成为公众关注的焦点,多个爆料相继浮出水面。有知情人士透露,这位明星在事业高峰期背后隐秘的故事,使得网友们对于其形象产生了新的看法。这些黑料的曝光引发了广泛讨论,究竟是误解还是事实,有待进一步的调查与证实。
阅览古文字。图片来历:《天然》杂志引自慕尼黑大学。
“维苏威火山应战”(Vesuvius Challenge)的项目名称来历于公元79年维苏威火山的迸发,许多宝贵的莎草纸文献在火山喷射中遭到损毁。18世纪,研讨人员从意大利庞贝邻近赫库兰尼姆的一座罗马别墅遗址中发掘出数以百计的卷轴。这些卷轴写有文字的部分多已炭化,使得研讨人员很难进行解读。
科学家们一向致力于用新的科技辅佐解读这些陈旧的文献。美国肯塔基大学的计算机科学家布伦特·西尔斯(Brent Seales)就曾花费数年时刻开发“虚拟打开”(virtual unwrapping)技能,即经过对古卷的内部结构进行高分辨率扫描,再制作横截面,最后用算法将其打开为平面图画。2015年,这种技能成功解读了以色列恩戈地的一个可追溯至公元三世纪的烧焦古卷。
恩戈地古卷写作的墨水中含有铁,在计算机扫描的进程中会宣布光辉。与之不同的是,赫库兰尼姆古卷的抄写员运用的是碳基墨水,在计算机扫描中几乎不可见。解读难度的增大迫使科学家团队考虑新的探究计划。西尔斯以为,即便无法直接看到墨水,他们或许能够经过练习神经网络发现暴露的莎草纸和写有墨水的莎草纸外表纹路的差异,从而推动解读。
“维苏威火山应战”在这种需求下应运而生。西尔斯的团队于2023年3月和硅谷企业家纳特·弗里德曼(Nat Friedman)协作,建议该应战赛,他们发布了卷轴外表的扁平图画,要求参赛团队经过练习神经网络来寻觅差异,以赢取丰盛的奖金。终究,超越1000个团队参加竞赛。本年2月,一支由多位计算机专业学生组成的团队取得奖金。该团队判定文本或许来自于伊壁鸠鲁派哲学家菲洛德摩斯。
多名学者以为,近些年来,人工智能的高速展开正在大幅重塑咱们对古代国际的观点。早在2010年,人们就现已开端将深度学习应用于古代文献的研讨中。人工智能也逐步表现出与人类考古研讨者协作的潜力。英国诺丁汉大学的西娅·索莫斯奇尔德(Thea Sommerschield)等人从前运用公元前七世纪至公元五世纪之间的数万个希腊铭文练习了一个名为Pythia的模型,经过很多数据的练习,向模型展现它从未见过的文本时,它能够依据上下文重建文献中缺失的字符。2022年,他们对模型进行了晋级,以使其能捕捉到更杂乱的言语形式。索莫斯奇尔德表明,在测验中,面临人为制作的古代文本空白,人工智能的修正准确率到达62%,高于人类研讨者的25%。不过,若人类研讨者在人工智能的协助下展开研讨,修正准确率能够上升到72%。
人工智能正在展现出的潜力现已为多个国家所注重。我国的多个研讨团队都曾测验借用人工智能的力气破译甲骨文。本年年底,在承受媒体采访时,厦门大学信息学院天然言语处理实验室史晓东团队就曾表明,团队正在使用现已破译出的1000多个甲骨文,经过人工将其拆解为IDS(表达结构的部首偏旁序列)。找出与现代文字IDS的对应联系后,再将这些数据“喂”给AI,完成学习。
西尔斯将这些有待科技进一步发掘的文献称作“隐形图书馆”,包含中世纪书本、古埃及木乃伊包裹物中的文本等等?!跋衷?,人工智能协助咱们打开了从前无力拜访的资源?!?。
参阅链接:
1.。How AI is unlocking ancient texts— and could rewrite history。
https://www.nature.com/articles/d41586-024-04161-z。
2.“唤醒”甲骨文厦大团队测验用AI破译陈旧文字。
https://news.xmnn.cn/xmxw/202412/t20241211_286795.html。
编译/刘亚光。
修改/罗东。
校正/穆祥桐。