人类需要Filecoin这样的分散科学!

夕夕说经济 2023-10-31 09:51:43

科学研究是建立在事实之上的,但支撑我们科学机构拱门的基石开始破裂。

我们期望科学机构及其科学家是无懈可击的,他们的实验被证明是事实,以便其他人能够准确地复制并推进他们在人类集体困境中的工作,以找到答案。不幸的是,情况并非总是如此。越来越多的报告目录显示了基于虚假、剽窃或操纵数据的几项具有里程碑意义的研究和重大科学发现。

去年,《科学》杂志发现,几十年来被用作研究和治疗阿尔茨海默病基础的淀粉样蛋白假说部分基于虚假数据和图像。2012年,生物技术先驱安进(Amgen)试图重现53项具有里程碑意义的癌症研究的结果,但以47项失败,成功率为11%。今年夏天,来自杜克大学、斯坦福大学和哈佛大学的三位著名研究人员分别面临对过去研究的数据操纵的指控,这些指控的破坏性如此之大,以至于斯坦福大学研究员兼大学校长马克·泰西尔-拉维尼(Marc Tessier-Lavigne)被迫辞职。

科学界和公众对研究的信任正在减弱,这对我们扩大经济规模、提高生活质量和减轻疾病的能力产生了深远的影响(更不用说将纳税人的资金投入到有问题的研究中了)。

这场危机的原因有很多,包括缺乏激励措施和良好的基础设施,让科学家在他们的出版物中分享基础数据和代码。大多数数据和代码在集中式服务器或云上丢失或无法访问,因此无法检查大多数经验结果的可重复性。

如果我们继续这样下去,科学研究的保真度和可及性不会提高。科学研究对人类来说太重要了;它应该位于一个开放的 Dataverse 中,该索引由人类和机器可访问的可验证索引保护。

集中化的问题

中央集权导致了复制危机和对科学机构和研究的信任的侵蚀。它的缺点包括缺少可扩展性和灵活性、数据主权和单点故障。

集中化还将数据分散到孤岛中,跨团队可见性较低,使信息难以访问、复制和验证。正如我上面所写的,第三方研究人员和内部学术研究人员在访问原始数据方面面临重大障碍,几乎不可能重现结果或发现问题。

Web3 和区块链技术的出现为孤立的数据系统问题提供了令人信服的技术解决方案。IPFS(星际文件系统)和Filecoin等内容寻址存储工具使科学家能够以Web2无法做到的方式重新设计数据存储和可访问性,确保数据完整性符合FAIR原则(可查找、可访问、可互操作、可重用)。在 Web2 中,URL 指向文件的存储位置,如果文件被移动或内容被更改,这会导致链接腐烂或内容漂移等问题,这两种情况都经常发生。然而,在 Web3 中,内容寻址为每个文件生成一个唯一的哈希值,这意味着即使是最微小的内容变化也会导致完全不同的哈希值。使用这些独特的内容哈希作为标识符可以解决链接腐烂和内容漂移的问题。它还允许多个实体将同一文件存储在不同位置,从而实现机构自治并提高内容可用性。这打破了数据孤岛,有利于分布式、开放的系统,保证内容可用性,没有付费墙,并实现机构主权。

仅开放获取科学手稿就是解决复制危机的一步。

我们还必须超越PDF作为发表科学的主导形式,并采用一种基于可版本化的FAIR数字研究对象的新模型,该对象包含所有相关的研究项目组件(手稿,数据,代码,视频等),以实现宝贵信息的可重复性和重用。在去中心化的学术出版系统中,合格的第三方——包括出版商、资助机构、学术团体和领域专家——可以使用加密签名的证明来评估和验证研究的理想特征。例如,数据可用性或计算可重复性的徽章将在研究对象上清晰可见,允许读者过滤他们对此类内容的搜索,从而创建有价值的元数据,可用于提高对科学家的激励。基于IPFS,正在开发一种分散式科学持久标识符(DPIDs)协议。

回答反对开放科学的论点

开放科学实践是科学界最有前途的前进道路,但也面临一些阻力。有一些反对其实现的常见论点,包括:

数据隐私:科学数据通常包含不应也不能合法公开共享的敏感信息,包括基因数据、健康记录和财务历史。随着我们对数字的依赖程度越来越高,威胁信息安全的网络攻击风险显着增加。

缺乏激励措施:研究人员缺乏公开分享数据和代码的动力,因为这样做可能会消除与其他科学家相比的竞争优势。如果没有切实的回报,它就会为研究人员创造更多的工作,而它们的透明度使同事们能够突出错误。

开放科学批评者的反对意见部分源于对变革的抵制,在数字化转型和区块链技术的出现中,变革困扰着许多行业。了解开放科学如何解决这些问题至关重要:

数据隐私:FAIR并没有规定全面的数据可访问性,但对于那些有正当理由寻求访问的人来说,应该有一条途径。IPFS节点可以在具有内容寻址器、来源标识符和身份检查的私人服务器上运行。开放科学可以在有隐私限制的服务器上使用区块链。

缺乏激励措施:资助机构越来越鼓励数据和代码共享。2022 年,白宫科技政策办公室 (OSTP) 要求联邦资助的机构免费公开分享研究、数据和代码。政策制定者鼓励为开放科学创造激励措施,可以通过新的、分散的科学基础设施来实现和支持。

促进进步

科学是关于进步、新的发展,最重要的是,事实。但长期以来,由于存储、保存和获取研究的过时和低效方法,科学界停滞不前。其结果是,这个行业被浪费的时间和可疑的激励措施、欺诈和直接影响真实人物的操纵数据所困扰。

科学研究的重要性太高了,不能在集中式系统中保持孤立和无法访问。开放科学和去中心化区块链工具的出现可以而且将解决这个问题,使科学家能够使用当前 Web2 系统无法比拟的新方法来存储和访问研究。如果没有可靠、可访问和值得信赖的科学研究,我们作为一个物种就会被搞砸。

1 阅读:14

夕夕说经济

简介:IPFS