澎湃科技(www.thepaper.cn)推出的“第五要素——上海市数据科学重点实验室数据要素产业化系列报道”,由上海市数据科学重点实验室策划的数据要素产业化系列论坛第五期以公共数据运营与智能应用为主题,邀请国内专家共同探讨当前公共数据运营的主要关切和实施路径,并结合智能化应用案例梳理剖析在实践层面存在的痛点。
1
主要观点与建议
在此次论坛上,七位专家对公共数据有效运营从公共数据运营的实施路径和痛点、公共数据应用的机遇挑战、公共数据运营的发展建议三个维度展开了剖析:
(1)公共数据运营的实施路径和痛点:在实施路径方面,实现公共数据资源价值释放,支持数字政府建设,赋能千行百业,需要实现供需两端对接与互相促进,推进公共数据更好地开发利用及交易流通,扶持培育大数据产业,提升本地特色产业的数字化水平,促进政府间共享数据的业务标准化和业务融合。主要痛点是基层政府数据获取难,政府使用数据的动力不足,数据格式、结构不统一,难以满足需求。
(2)公共数据应用的机遇和挑战:在机遇方面,新一代信息技术的发展为公共数据的开发和应用带来了机遇,如人工智能、区块链等技术的应用,为公共数据的整合、知识结构的发展和技术架构的一体化提供了支持。挑战也不少,公共数据的开发和应用需要解决一系列问题,如管理体制、收益机制、激励机制、技术和制度的同步提升等。
(3)公共数据运营的发展建议:建议之一是建立一体化的部门:由具备技术能力的一体化公司和集团来统筹考虑整个省的技术架构,解决政策统一性和技术架构一体化的问题。建议之二是推动数据开放,鼓励企业数据开发,开放社交媒体平台和搜索引擎后台的文本数据,为大数据和大模型的发展提供支持。建议之三是加强技术应用:在公共数据的开发和应用过程中,需要加强技术应用,如隐私计算、联邦学习、数字空间等技术的应用,解决数据融合和开发利用的问题。建议之四是推进基层应用,将公共数据的开发和应用下沉到基层,为基层政府和企业提供数据支持和服务,促进基层政府和企业的发展。
2
大模型梳理的各专家观点与建议
使用大模型工具,对这十一位专家的主要观点做了梳理。
● 肖仰华(上海市数据科学重点实验室主任):公共数据的有效运营需要解决数据获取、使用动力和数据标准化等问题,同时要关注基层应用的鲜活性和迫切性。
● 牛军珏(复旦大学公共绩效与信息化研究中心主任、复旦大学计算机科学技术学院教授):基层政府在数据上面临着核心问题,需要解决数据获取和使用动力的问题,同时要思考如何从数据的特异性中提取共性,并实现标准化。
● 陈思明(复旦大学大数据学院青年研究员):数据要素的使用需要将供和需的概念拿去平齐,需要通过可视化的方式让用户更直观地感知数据的特性,挖掘其中的价值。大模型的本质是知道一个词去预测下一个词,它是一种概率模型,现在各行各业的数据出来,通用大模型有通用能力,把大模型变成领域专家,甚至变成领域顶尖专家,专门把某一个领域训练到 100 分,其实是把每一个领域的数据利用起来,开放各种数据要素,这符合数据应用的本质。
● 赖致远(福建大数据一级开发有限公司副总经理):公共数据的一级开发需要实现供需两端对接与互相促进,需要在制度、产业生态和技术三个关键方向上重点推进。从技术方面来看,有三个关键方面需要考虑,一是确权、登记评估、交易流通等环节需要借助区块链等技术支持,二是在数据融合环节,需要通过隐私计算、联邦学习等方式,以及国外流行的数字空间概念,充分融合社会数据和公共数据,三是在数据开发和利用阶段同样需要运用技术,特别是目前大模型技术的应用
● 吕蔚(税友软件集团股份有限公司数据业务总经理):政府部门在公共数据要素应用方面存在着数据获取、数据开放、数据共享和数据应用等问题,需要建立一个机制,集中采购政府部门需要的第三方数据,并集中管理数据质量和标准。近几年,一直在研究各地政务云和大数据中心,由于建设时间、当时的技术水平和其他原因的差异,各地大数据平台的基础底座存在较大差异,技术壁垒也较大,如果要真正实现全国或全省一盘棋,对数据统一综合应用,就涉及到跨平台建模和运算问题,这些问题需要解决。
● 林中美(易信(厦门)信用服务技术有限公司副总经理):公共数据市场需求非常庞大,作为数据使用方,希望公共数据能够更加开放,同时也希望从数据要素乘数效应的角度出发,结合产业或行业充分运用数据。在技术方面,除了在需要密态情况下进行数据传输,结合隐私计算和区块链技术,今天还谈到了更多关于大模型的应用,在实际业务应用中,对这一领域的需求相当大。
● 郑磊(复旦大学数字与移动治理实验室主任、复旦大学国际关系与公共事务学院教授):管理与供应商、技术、安全、效率和公平性都密切相关,需要考虑管理体制的问题,深入研究各个环节中的机制设计,包括收益机制和激励机制等。
3
一点微思考
笔者观察到,现在数据资源分布高度不均衡,存在“四多四少”的现象,表现为:部委数据资源多,地方数据资源少,国省层级数据资源多,村社乡镇数据资源少,央国企数据资源多,民营企业数据资源少,平台企业数据资源多,个人数据资源少,要实现数据按需分配,高效运营、合规流动,如何才能打破这种数据资源的不均衡,可能需要一些机制模式的突破。