认出莎草纸10个字母就赚30万-这么刺激的挑战敢来吗(即将截止)

凝旋谈历史 2023-10-13 04:09:01

截止日期12月31日,还不速速来挑战!

公元79年10月24日,意大利南部的维苏威火山突然爆发。滚烫的熔岩、火山灰和碎裂的火山石以每秒150万吨的速度猛烈喷出,喷射高度达33千米,同时释放了10万倍于广岛和长崎原子弹爆炸的能量,让白昼中的古罗马陷入黑暗。数座城镇被埋在几米深的火山灰下,其中就包括著名的庞贝和赫库兰尼姆古城。

在维苏威火山爆发中覆灭的庞贝古城(图片来源:维苏威火山挑战赛)

1750年,一名意大利工人在挖井时意外发现了一条精美的圆形大理石路面。当时正在研究赫库兰尼姆古城的瑞士建筑师卡尔·韦伯(Karl Weber)得知此事,立即组织团队在路面周围集中挖掘。原来,这是一座豪华别墅花园里的圆形大厅。随后,人们又在这里发掘出了更多精美绝伦的青铜雕像。

又过了两年,挖掘团队挖到别墅的一个小房间时,在一个已经碳化的架子上发现了许多像木炭块一样的卷状物体。起初,工人并未在意,把它们丢弃在一边。但发掘工作的负责人很快注意到,一些“木炭”上有文字!这些黑乎乎的玩意竟是一千多年前的莎草纸卷轴,它们在维苏威火山爆发的过程中碳化了。这个房间很可能是古罗马时代的阅览室。

位于美国的盖地别墅(Getty Villa)按照赫库兰尼姆的纸莎草别墅建造(图片来源:Bobak Ha'Eri, CC BY 3.0, via Wikimedia Commons)

由于这些珍贵的古代书籍已经完全碳化,几乎不可能翻阅,人们只能用各种奇招窥探其中内容。意大利画家卡米洛·帕德尼(Camillo Paderni)曾尝试将卷轴切成两半,一层层去除莎草纸并誊写尚可辨别的文本。但这种方法同时也会毁坏文物,几年间,数百个卷轴都葬身于此。

无奈之下,这项重任交到了意大利学者安东尼奥·比亚乔(Antonio Piaggio)手中。比亚乔把牛犊的肠膜粘在卷轴边缘,然后用一个特殊的机器,让卷轴在重物的作用下逐渐展开。这种方法极其缓慢,每小时只能展开一厘米,仅展开第一个卷轴就花了大约四年时间。而且,这种方式还容易把卷轴撕成窄条,就像撕宽胶带时常常只能撕下一小条那样。于是,又有数百个卷轴因此成了碎片,成功获得的卷轴文本却极其有限。

在这些成功破译的文本中,大部分都是古希腊哲学著作。其中一些是著名古希腊哲学家伊壁鸠鲁的作品,例如早已失传的《论自然》(On Nature),但更多作品出自伊壁鸠鲁派哲学家菲洛摩斯(Philodemus),包括他对伦理、诗歌和音乐的观点,甚至还有他未完成的手稿。因此,一些人认为,这个房间可能是菲洛摩斯本人工作用的阅览室。

比亚乔的机器(图片来源:维苏威火山挑战赛)

19世纪以来,人们再也没有尝试过暴力展开这些脆弱的黑色宝藏,转而去解读那些已经获得的文本信息。但美国肯塔基大学布伦特·西尔斯(Brent Seales)教授的工作再次点燃了历史学家的希望。

1970年,以色列希伯来大学考古研究所的团队在以色列恩盖迪的一座古代犹太教堂中发现了一个羊皮纸卷轴,时间能追溯至公元1至4世纪。它在公元600年左右的一场大火中严重损毁,已经完全碳化。

2016年,西尔斯带领的团队利用基于X射线的显微计算机断层扫描(micro-CT)和计算机视觉,在保留文物完整性的条件下,虚拟展开了恩盖迪卷轴。由于卷轴中的每种材料都会以不同方式吸收X射线——羊皮纸的吸收程度最低,而墨水的吸收程度最高——文本便能在扫描过程中显现出来。经研究人员破译,这份卷轴是希伯来圣经的五部经典之一——《摩西五经》(The Pentateuchal)。

西尔斯团队虚拟展开的恩盖迪卷轴,右侧是碳化的卷轴实物(图片来源:原论文)

这听上去很容易,实际却很困难。卷轴折叠在一起,而CT机获得的是物体层层截面的图像,并不能直接从中获得文本信息。因此,研究人员需要首先从CT图像中区分出羊皮纸的每一层,分割出卷轴的单层图像。然后,再根据CT信号的强度,定位羊皮纸上的墨水位置,得到一张写有文本的单层卷轴。但这依然是立体图像,还需进一步通过软件将其可视化为二维图片。为保证最佳效果,这种方法每次只能虚拟展开一小部分卷轴,因此最后还要将所有图像拼接起来,才能得到完整的卷轴图像。

从CT数据中获得单层卷轴(图片来源:VisCenter via Youtube)

当西尔斯尝试将处理恩盖迪卷轴的方法直接应用到赫库兰尼姆卷轴上时,却无法奏效了。恩盖迪卷轴上的墨水含有金属元素,纸张是羊皮纸,用X射线照射有较好的成像效果。而写在赫库兰尼姆卷轴上的墨水由烟灰制成,成分主要是碳,卷轴本身由纸莎草制备,成分也主要是碳。因此,二者对X射线的吸收几乎没有差异,用原来方法虚拟展开的赫库兰尼姆卷轴几乎是一张白纸。

而且,赫库兰尼姆卷轴比恩盖迪卷轴长得多,卷起来的层数也更多。再加上莎草纸本身通常由两层或多层植物纤维压制而成,而碳化又会导致这些原本紧密粘合的单层分开,这就让CT扫描下的赫库兰尼姆卷轴层数格外多。此外,每一个卷轴中还包含许多小卷,被火山灰覆盖并碳化时,这些小卷紧紧地压在一起,变得扭曲、褶皱。这些都使得虚拟展开赫库兰尼姆卷轴极为困难。

西尔斯只好从新的角度切入解决这一难题。结合莎草纸本身的纤维结构,优化分割方法后,CT数据中就能提取出单层的卷轴信息。至于墨水问题,由于此前帕德尼和比亚乔等人的破坏性展开试验留下了许多赫库兰尼姆卷轴的碎片,西尔斯团队便利用这些碎片,结合机器学习,让计算机学习如何从虚拟扫描呈现为近乎白纸的卷轴中识别出对比度极低的墨水。就这样,原本不可见的信号变得可见了。不过,这一方法目前只在碎片中使用过,还没有为识别卷轴进一步优化。

利用机器学习从赫库兰尼姆卷轴碎片中识别墨水(图片来源:维苏威火山挑战赛)

2020年初,著名网站GitHub的前首席执行官奈特·弗里德曼(Nat Friedman)因疫情被迫隔离。读了《古罗马二十四小时》(24 Hours in Ancient Rome)后,他对庞贝等古罗马遗址产生了浓厚的兴趣。他得知赫库兰尼姆卷轴的存在,便联系了西尔斯。美国企业家丹尼尔·格罗斯(Daniel Gross)对此也很感兴趣,今年3月,他们三人联合发起了一个名为“维苏威火山挑战赛”(Vesuvius Challenge)的项目,鼓励全世界一起探寻赫库兰尼姆卷轴中的秘密。

挑战赛设有多个奖项,奖金总计100万美元(约合人民币730万元)。其中大奖奖金70万美元(约合人民币510万元),获奖团队要在今年12月31日前解析出两卷赫库兰尼姆卷轴中至少4个单独的段落,且每个段落至少包含140个字符的连续文本,每段中缺失或难以辨认的字符不超过15%。获奖者所用的计算机代码会在赛后开源,便于其他人使用。

此外,挑战赛还设立了“字母奖”(First Letters Prize)。第一个在任意一卷的4平方厘米区域内找到10个清晰字母的团队将获得4万美元(约合人民币30万元,平均一个字母3万块啊!),第二名将获得1万美元(约合人民币7万元)。项目组将把参赛者提供的方法运用到一个秘密的卷轴碎片上,以验证方法是否可行。自从3月开赛以来,该项目已经颁发了20万美元(约合人民币146万元)奖金,奖励那些在分割单层卷轴和墨水识别方面做出了卓越贡献的团队。

维苏威火山挑战赛网站(图片来源:维苏威火山挑战赛)

项目组会为参赛者提供5.5TB的卷轴扫描文件和400GB的卷轴分割片段文件,以及用于训练墨水检测模型的卷轴碎片X射线扫描、红外图像和手工标记了文本的文件。项目网站还提供了扫描、分割、墨水检测等每一个步骤的详细教程,包括步骤原理和软件使用说明。因此,参赛者很容易就能开始挑战。

如果你觉得一个看不见摸不着的卷轴过于抽象,无从下手,项目组也鼓励你自己制作碳化的卷轴,用于模型训练。只要上网买点莎草纸,随便写点什么再卷起来,密封进金属罐内加热即可,网站上提供了制备的图文教程。不过,缺点是你还得找人用CT扫描这堆黑炭,才能获得原始数据。

目前,人们已经从纸莎草别墅中挖出了近1000个卷轴。这座建筑还有两层尚未发掘,主阅览室依旧不知所踪。历史学家推测,别墅下还埋有数千甚至数万卷古罗马时代的藏书。古希腊和古罗马思想是西方文明赖以建立的基础,而现代人对此的了解几乎全部基于中世纪抄写员誊写的少量作品。因此,一旦这种虚拟展开手段能高效且准确地大规模应用于赫库兰尼姆卷轴,将极大程度改变我们对西方古代文明的认知。

最后,让我们来一睹参赛卷轴的芳容吧:

维苏威火山挑战赛中使用的两个卷轴(图片来源:维苏威火山挑战赛)

祝你成功!

0 阅读:51

凝旋谈历史

简介:感谢大家的关注