古生物学是探讨生命演化的传统学科,其主要研究对象就是保存在地层中各种化石。化石是全球分布的,所代表的远古生物也是多种多样的。
在全球古生物学家的共同努力下,人们对于地层中的化石记录已经形成完善了理论与知识体系,保存在化石中的各种生命形式可以参照现代生物学的研究方法,开展形态学和系统分类学研究。
当然,化石生物与现代生物的区别也是非常明显的,比如古生物仅保存有基本的形态学信息,而缺乏现代生物中易于获取的分子生物学信息。
另外,古生物在系统分类方面比现代生物更加多样,古生物中有太多类群已经完全灭绝,化石是它们曾经繁盛的唯一实证。
通过古生物学研究,我们可以了解生命的演变历程,也可以根据化石记录判断地层的地质时代、开展地层对比,甚至辅助矿藏的勘探与开发。
笔石(graptolite),是一类生活在寒武纪至石炭纪海洋中的浮游或游泳型动物,目前已经完全灭绝。笔石的化石通常保存在页岩之中,看起来就像是用笔在岩石上绘制的画迹,也正因此这类生物被称为笔石。
笔石在世界各地均有分布,种类多样,个体一般是几厘米到几十厘米大小。笔石所生活的地质时代范围相对短暂、演化迅速,相同或相似的物种可以在多个区域出现,是判断地层时代、开展地层对比的重要化石。
值得一提的是,笔石通常保存在页岩之中,这些页岩往往也是页岩气(天然气)的赋存层。此前,中国学者发现华南不同页岩层中产出了不同的笔石物种,并将笔石物种与页岩气的赋存丰度之间建立了关联。
如果在勘探钻孔的岩心中确定了特定的笔石物种,就可轻易获得该层段页岩气的赋存丰度,进而确定是否开展进一步开发,从而为勘探开发节省大量成本。这方面的研究是基础古生物学在油气矿藏领域的重要应用之一。
随时信息时代的到来,大数据与信息技术在基础科研领域发挥着越发广泛的应用。近年来,古生物学与地层学这一传统学科在大数据领域取得了一定进展,但大多集中在结构化数据,比如,根据化石的产出记录来分析古生物的多样性变化等。
对于古生物学中的非结构化数据,比如化石图像等却极少得到分析与研究。那么,古生物学能否与人工智能进一步结合,利用计算机对古生物进行分类与鉴定?
中国科学院南京地质古生物研究所徐洪河研究员及其团队,在近期一项研究中致力于解决这一挑战。
图 | 徐洪河在某地质调查单位的岩心库(来源:徐洪河)
基于南京古生物所庞大的化石标本收藏,研究团队详细采集了 1500 块笔石化石标本的科学信息,拍摄了大约 5 万幅化石标本图像,并对这些图像进行像素级标注,创建了笔石化石标本科学权威数据集。
在创建笔石图像数据集时,他们还提出了化石标本元数据标准,并将数据集的规范与标准在国内外同行中进行推广。针对化石标本的多模态数据集,徐洪河团队提出了人工智能古生物学的概念。
本次研究是计算科学、信息科学与古生物学的交叉与融合,其研究思路与方法均为首创,并让他们获得了一项中国发明专利和一项美国发明专利。
古生物化石的识别,属于细粒度的图像识别,有别于常见的图像分类问题。这是因为古生物本身在系统分类上存在层级结构(比如,常见的分类名:门、纲、目、科、属、种等),而且古生物在系统分类时所依据的形态特征往往非常细微,具有极高的专业性。
经过两年多的时间,研究团队完成了数据集准备、标注、模型训练,有针对性地研发了适合于化石图像分类的算法,将这些成果用于笔石化石识别模型之后,针对 113 种奥陶纪和志留纪重要笔石属种,所训练的模型实现了大约 86% 的识别准确率,在准确率和工作效率方面远高于一般的领域专家。
(来源:iScience)
这些研究成果可直接服务于页岩气勘探开发的产业部门。可以说,这个研究主题非常新颖,将最新的人工智能与深度学习算法融入传统的古生物学之中,打造了一种全新的学科交叉形式,具有极大的发展潜力。
日前,相关论文以《使用残差网络以高分类分辨率自动识别笔石》(Automated graptolite identification at high taxonomic resolution using residual networks)为题发在iScience[1],Zhi-Bin Niu 是第一作者,徐洪河担任共同通讯作者。
图 | 相关论文(来源:iScience)
研究过程中,他们曾与世界各地的古生物学家联系,希望能够协助开展人机对比测试。有的专家很高兴开展测试;有的专家却非常直接地拒绝,理由是人类与计算机(机器)没办法比,人类是注定失败的。为什么要去参加注定失败的较量呢?
这种说法不禁让徐洪河反思,如今很多工作都在被机器所替代,科学研究工作的前景又将如何?
他说:“人类从事科学研究是为了认识世界,机器作为一种工具能够在这方面领先人类吗?有智能机器的发明不禁让人反思,人类能认识世界的本质吗?我们是不是在作茧自缚?科学研究中创造性的规划与设计,也要被机器智能所替代吗?虽然目前没有,未来会不会发生呢?
事实上,今天我们对于自然世界的认识仍是极为有限的,在不断的研究与探索中,人类越发认识到人类力量的渺小,或许认识到这一点能让我们更加坦然吧!
正如徐洪河所言:“在古生物学中引入机器与模型,不是为了取代人类——而且这个目标也不是能够轻易实现的。机器与模型是为了更好地辅助科研,协助人类发现新的科学问题,进一步推进这门学科向着更深更广而发展。”
而对于人工智能古生物学这一全新的交叉学科来说,智能识别只是一个起步,未来还有大量工作需要开展。古生物学中有太多专业知识都需要进一步扁平化和普及化,才能更好地与人工智能相融合。
目前,课题组已经在微体化石领域开展了相关工作。未来,他们将继续结合人工智能和古生物学,研究地层中的孢粉、牙形刺等。
这些化石门类多、分布广,不仅可以进一步认识生命演化的谜题,也有助于开展地层判别,将古生物学与地层学的研究成果应用到油气勘探中。
参考资料:
1.Niu Z*, Jia S, Xu H*. 2024. Automated graptolite identification at high taxonomic resolution using residual network.iScience,27. 108549.https://doi.org/10.1016/j.isci.2023.108549.
运营/排版:何晨龙