1982年,图灵奖得主姚期智院士提出了著名的“百万富翁问题”:两位百万富翁如何在不透露自己具体财富的情况下,比较出谁更富有?解决这一问题,需要用到隐私计算(Privacy Computing)技术。
隐私计算是指在不暴露原始数据的情况下,对数据进行处理和分析,从而确保数据的安全性和隐私性。隐私计算作为跨学科技术,以密码学为核心理论, 结合了大数据、人工智能、区块链等多领域知识。这种技术不仅能够保护数据隐私,还能促进数据的安全共享,也是数据共享平台的未来形态。
在汹涌澎湃的数字时代浪潮中,数据已被尊为新世纪的“石油”,它不仅象征着无价的资源,更是推动科研创新和社会进步的核心引擎。数据,如同石油一般,为现代社会注入了源源不断的动力,也为科研领域带来了前所未有的机遇。
科学数据是科学发展的底层基础设施。然而,当前的科学数据共享平台往往采用数据汇交等粗暴的方式开展服务。无视了数据所有者的权益,打击了数据生产者的积极性。数据如果无法安全共享,整个行业将失去诚信与效率;数据所有者的权益如果无法得到保护,整个行业将失去保护与尊重。当前的科学数据管理办法,例如数据汇交,是对行业的一种反向推动。
因此,如何在保障数据的安全性和隐私性的前提下,实现科研数据的顺畅共享,如何构建一个安全、高效、互信的数据共享机制,是一个科研领域亟待解决的重要课题。
为了打破这一困境,松山湖材料实验室打造了一个健康、开放、共享的科学数据开放平台—Open Scientific Data Infrastructure (简写作OSDI),通过隐私计算技术,切实保护数据生产者的权益。目前该平台已上线,网址为 https://www.openscidata.net。
OSDI科学数据开放平台是一个集科学数据获取、存储、共享和分析于一体的综合性服务平台,能够为科研人员提供从数据采集到数据应用的全流程支持,助力科研创新和协作。其核心优势为:
高效的数据共享
OSDI支持多种数据格式和接口,方便科研人员无缝地共享和交换数据,促进协作和创新。
安全的数据存储
OSDI采用先进的加密和隐私保护技术,确保数据在存储和传输过程中不被泄露和篡改。
完善的权限管理
OSDI采用灵活的权限控制机制,确保数据所有权得到尊重,授权用户可以合理使用数据。
友好的操作界面
OSDI提供直观的用户界面,使数据集的创建、管理和使用变得轻松易行。无论是新手还是资深研究人员,都能轻松上手。
多样化的数据工具
OSDI提供多样的数据处理工具,帮助用户便捷地挖掘数据的潜在价值,从而促进科研工作的进展。
OSDI科学数据开放平台致力于在保障数据安全的前提下,为科研人员提供一个无缝、高效的科学数据共享和协作平台,让数据的发布共享、创新、探索发现变得触手可及。
场景案例1
场景:用户开发了一套小分子计算数据集,并通过其开展相应的科研工作,审稿人要求其随科研论文发布该数据集,具体操作如下:
1、用户需要将要发布的数据写入一个便于读取的文件中(例如csv格式),并根据数据内容进行适当命名。
2、用户登录OSDI网站后,进入数据广场页面,通过点击“建立数据集”按钮进行数据集的创建,并完成相关设置。
3、用户根据OSDI提供的样例模板填写数据集的介绍信息,主要包括数据集的整体描述、数据集文件的具体内容介绍,以及参考文献等。
4、用户通过数据集设置中的“可见设置”选项进行数据集的发布。“本地可见”表示数据集会发布在数据广场,而“私有”则表示仅用户自己可见。
5.用户将数据集的介绍信息发送给系统管理员(邮箱:
openscidata@sslab.org.cn)。数据集的详细介绍将显示在网站首页的数据集介绍页面,经相关配置后,可被搜索引擎抓取。
6.用户在论文中注明数据集的发布信息。例如:“Bandgap_MP”数据集发布在 https://www.openscidata.net。
7.其他用户登录OSDI网站后,可以在数据广场中查看“Bandgap_MP”数据集的相关信息。当第三方用户希望使用该数据集时,可以通过点击计算场景页面中的“创建场景”按钮,按照提示申请数据集的使用授权。
场景案例2
场景:A用户在OSDI平台通过数据“可用不可见”的方式对B用户的数据集进行数据挖掘计算
具体步骤如下:
1、A用户创建计算场景,并向B用户提出数据授权申请。
2、B用户在通知页面查看申请消息,并通过一键操作的方式完成数据授权。
3、A用户利用授权过的数据进行数据挖掘计算。
4、A用户得到计算结果,并一键导出结果数据集。
在科研领域,数据是无价的资源。它不仅承载着过去的研究成果,还为未来的科学发现奠定基础。然而,数据的获取、存储、共享和保护一直是一个复杂且具挑战性的系统工程。缺乏科学数据共享平台成为阻碍科研数据高效利用的主要障碍。没有合适的平台,科研人员在发布、查找、获取和使用科研数据方面面临诸多困难。这种局面不仅限制了数据的共享和利用效率,还阻碍了科研创新和跨学科合作的潜力。数据孤岛现象严重,资源浪费和重复劳动频繁发生,亟需解决。
通过构建这样一个健康的科学数据生态系统,科研人员将能够更加专注于创新和发现,而不再被数据管理的琐事所困扰。数据的高效共享和利用不仅能加速科研进程,还能促成更多跨学科的合作,推动科学研究迈向新的高峰。
OSDI科学数据开放平台是一个国际化平台,有英文页面,国际使用者也可登录访问。
OSDI科学数据开放平台由松山湖材料实验室和翼方健数公司合作开发。
撰稿:材料计算与数据库平台
来源:松山湖材料实验室
编辑:ArtistET