近期,中共中央、国务院印发《党和国家机构改革方案》,提出组建国家数据局,负责协调推进数据基础制度建设,统筹推进数字中国、数字经济、数字社会规划和建设等。这标志着,我国的数字经济在经过二十年蓬勃的自发发展后,进入到了有为政府赋能有效市场的新阶段。数字经济新阶段首要的治理难题,就是数据要素治理。自党的十九届四中全会正式将数据列为生产要素以来,各界关于数据要素理论的思考和讨论日益增多,各行各业已广泛开展试点实践,但仍须从国家层面统一加强对数据的管理、开发和利用。2022年12月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》),从数据产权、流通交易、收益分配、安全治理等方面构建数据基础制度,着力推动我国做强做优做大数字经济,应对科技革命和产业变革,构筑国际竞争新优势。在成立国家数据局的背景下,进一步讨论应如何构建与数字生产力发展相适应的生产关系,不断优化数字生产力的治理框架,就显得尤为重要。
数据流通全价值链治理:
数字经济可持续发展的基石
数据要素治理的体系建设面临着一系列难题:一是线头多但缺系统化的思路。基于数据的经济活动中的利益攸关者众多,其中的问题不仅相互交织,而且还分散在不同行业与领域,因此亟需一个系统化的思路来厘清重点;二是有市场但缺交易。目前数据要素市场上成熟可交易的品类少,市场无法对基于数据的众多经济活动定价,如数据收集和标签、模型构建等还需进一步明确交易标的;三是有理论但缺工具。《数据二十条》已明确数据要素上存在着资源持有权、加工使用权、产品经营权等不同权利,数据流通对信息安全和隐私保护的影响也被广泛研究,但落实治理责任还需要具体的工具和抓手。
笔者认为,数字经济治理要以数据流通为抓手,在数字经济全价值链上对各种要素的投入进行赋权。这一判断基于以下三个理由:首先,数据不是孤立形成价值的,数据只有通过流通进入到社会化大生产,和众多要素相结合才能形成经济价值。因此,对数据要素进行赋权定价不应孤立进行,必须同时对算法建模、数据收集和加工等环节的其他要素投入赋权定价。以人工智能内容自动生成(AIGC)为例,其商业化运作不仅要对数据定价,也要为数据清洗和标签定价赋权,还要为模型定价和赋权。其次,数据要素贯穿整个数字经济。数据要素的流通串联起了其他要素、为数字经济价值链构筑了基础。数字经济中的活动就是通过资本、劳动、知识要素的投入,不断在数据要素上形成附加值的过程。因此,以数据流通为线索,能够溯源数字经济价值链上的利益攸关方,厘清数字经济的有效激励机制。最后,数字经济治理的一系列关键问题,例如信息安全和隐私保护等,都发生在数据流通的全价值链上。因此,对全价值链的要素投入进行赋权,也就赋能了定责和风险节点管理等治理环节。
数据流通的全价值链赋权是一个完整的治理体系,包括数字经济发展所需要的新型基础设施规划和建设、数据流通中的各类无形资产赋权和市场定价机制构建、数据安全和侵权审计等一系列制度构建。数据作为信息的载体,具有多方可以同时使用、使用后自身不减少、产生新数据等特征,具有明显的非竞争性和非排他性,缺乏工具就无法赋权。同时,数据的外部性也阻碍了对数字经济中其他要素投入的赋权和定价,阻碍了信息安全等的定责和风险防范。因此,数据流通的全价值链赋权需要构建相应的基础设施,并在基础设施之上形成完整的治理体系。
全价值链的多种
资产赋权和监管是数据治理的基础
数据流通是数字经济价值链的基础。数字经济是基于数据要素流通及多要素、多主体分工合作的复杂经济。从数据产生到服务和产品的供给,整个过程通常涉及数据产生、数据采集、数据加工、数据使用等不同环节。在每个环节中,劳动要素、资本要素、知识要素和数据要素相结合,形成各种与数据相关的服务或中间产品。数据价值链提供了一个框架图景,将这个过程中的数据流向、参与主体和要素投入清晰展现,形成了由数据产生至应用结果记录的完整链条。过程中的每次附加价值加入对应数据价值链上的一次劳动(或智力劳动)要素、知识要素或技术要素的加入。图1展现了数据流通价值链的基本模型。其中每个节点是一个数据记录,数据记录A指向数据记录B(A的一个加工结果);每条边对应一份合约和对该合约的不可伪造、不可篡改的记录,如智能合约与一个要素投入记录或一个应用提案记录。数据价值链就是在数据流通过程中,不同要素通过组合增加附加值的过程。
图1 数据要素流通的价值链示意图
数据流通的全价值链管理是政府赋权和治理的基础。数据价值链各环节的各个要素必须先赋权才能实现可估值、可定价。由于多要素、多主体构成的复杂性,他们共同构成数据价值链的利益攸关者(见图2)。数据价值链上的这些利益攸关者主要存在自身权益的保护需求,包括资源持有权、加工使用权、产品经营权等。数据流通可能涉及国家安全或公共安全,也可能影响他人的隐私安全等数据权益。因此,政府需要制定数据流通的审查和定责框架。与此同时,数据外部性治理的定责也必须建立在权属明晰的基础上。
图2 数据要素流通的利益攸关者结构图
在这些要求下,数字经济治理需要政府基于数据流通全价值链,形成三项制度:数据权限许可证制度、利益攸关者/分红凭证管理制度、数据合规证明制度(见图3)。数据权限许可证,是许可相关市场主体参与数据要素流通交易的准入证,类似于市场管理部门的工商登记证明。利益攸关者/分红凭证则是数据要素、劳动要素、资本要素、知识要素等要素持有者参与数据要素流通交易后,凭凭证获取回报的权证。数据合规证明文件是数据提供方、结果使用方在数据流通过程中,其业务符合国家相关法律法规的证明文件。通过这三项制度,政府一方面保护了数据全价值链上利益攸关方的权益、保障了数字经济市场的有效性和盈利性;另一方面也能管理好信息安全风险等数据外部性,明确数字经济中各个主体的责任边界,做好定责、追责工作。
图3 基于数据价值链梳理的治理流程
数字经济的发展需要多层次的要素流通体系:其中既要有市场化流通如数据交易,以货币为对价,以市场供需为基础的定价机制;也有非市场化流通方式如公开、赠与、继承、划拨及司法判决等。数据流通的全价值链赋权是构建和支撑数字经济估值体系的基础,这体现在三个方面:第一,赋权有凭证,市场主体之间在此基础上才能形成交易,基于此构建数据流通交易市场;第二,权益可溯源,数据流通全价值链上的要素价值才能够被评估;第三,可溯源的赋权能够厘清不同要素的贡献,明确权益分配和归属,从而支撑市场化的议价和定价,由此才可以支撑数字和数据资产的股权化和债券化,形成更具流通性,且由价格发现和市场化定价的更为敏锐和灵活的机制。
全价值链的多种
资产赋权和监管需要新型基础设施
数据要素的特点造成了数字经济治理的复杂性,因此基于数据流通价值链的数据赋权需要特殊的基础设施。数字经济治理的复杂性主要在于三个方面:一是数字经济涉及多种要素组合和多利益主体,每种要素投入和每个利益主体都期待确保自身投入的回报,这需要具备完整的要素流动和组合的记录和追踪系统。二是数据的非竞争性、非排他性的要素特点导致了数据要素和其他数据价值链上的要素投入的赋权,需要能够有效记录及追溯数据权利的技术手段,如区块链和非同质化通证等数字赋权记录技术。敏感数据的计算和使用还需要多方安全计算、零知识证明等可控计算环境的构建技术。三是数据要素负外部性治理的公共服务提供需要智能合约等技术,控制数据用途和用量,不伤害相关主体、不危害国家安全,并能实现社会利益最大化。因此,以数据流通的价值链上赋权为基础,整个数字经济治理需要一套完整的基础设施体系。
首先,数据流通的价值链特性明确了数字治理基础设施需要具备合同可记录、利益攸关者可追踪的功能。政府对利益分享权益的保护、对数据安全责任的划界、定责、追踪,以及对数据使用权限的保护和滥用的监管,也都发生在要素组合及附加值变化环节。然而,数据流通往往存在全价值链长、合同关系复杂的特点,数字治理的基础设施只有能够记录和溯源数据流通过程中的要素组合和对应的合同,才能够实现全价值链上各种要素投入的赋权,也才能够做好信息安全治理等监管的划界和定责。因此,数据流通的全价值链赋权需要合同可记录、利益攸关者可追踪的数字基础设施体系,区块链和非同质化通证等技术能够支撑上述数字赋权需求功能。智能合约等区块链技术解决了合同可记录、利益攸关者可追踪、要素投入可记录等基本问题。非同质化通证技术能够让不同要素在各个环节的投入方式、特点、合同关系被差异化和可追踪地记录。
其次,数据价值链上的多要素赋权,需要要素投入可控、可计量的数字记录和监管环境。数据价值链上的多要素赋权,首先要能解决数据非排他性造成的数据使用不可控的问题。由于数据的非排他性,在数据要素和其他要素结合后,其他要素也难以被计量和赋权。因此,数据资源持有权、加工使用权、产品经营权等的界定和保护,都需要首先对数据非排他性进行处理。例如,在生成人工智能(AIGC)的版权争议中,大量艺术工作者创作的内容被无偿地用于模型训练,形成人工智能模型的内容生成能力,但是缺乏可控、可计量的工具,无法核算和标记艺术工作者创作内容对模型的贡献,导致艺术工作者们的权益受到损害,无法通过市场化手段定价,也难以保护艺术工作者们的贡献。此类数据的使用应通过数据所有权等权利追溯的技术手段和管理手段,减少其因非排他性造成的用后损害著作人权益的问题。对于敏感数据,可应用多方安全计算和零知识证明等技术构建可控、计算环境,通过分离数据的持有权和使用权,提供让数据使用可控的先决条件,从根本上保障数据全价值链上各种要素的赋权。这些技术应用密码学方法对数据做密文处理,控制数据的使用,使得数据要素可以只被用于根据法规及合同所规定的事项,为数据价值链上的多要素投入赋权奠定基础。具体而言,数据中“可见”的明文数据转化为“不可见”的密文计算因子,使得计算因子和原始数据本身分离,同时又承载着数据的计算价值,从而实现数据计算价值的流通,为数据使用可控、数据要素赋权提供条件。
最后,通过智能合约技术,各参与方可提前约定计算的目的、方式及次数,从而限制可能引起数据要素负外部性的用途,鼓励引起正外部性的用途。具体来说,智能合约对数据价值链上的交易参与方进行权限控制,把数据使用精确限制到只针对具体的算法和使用次数,同时也可对投入的其他要素价值进行精确的贡献计量,实现了可计量。在这个过程中,辅以全流程存证,对各方操作进行记录并防止篡改,实现数据操作行为的“事后可查”,避免出现风险后的责任不明,实现了可溯源。
图4 基于隐私保护计算、智能合约、区块链等技术构建新型数字基础设施
随着国家数据局筹备工作的推进,新型数字基础设施的顶层设计具有了更加重要的意义。本文提出的基于数据价值链赋权基础设施框架(见图4),既实现了数据要素安全与可信地流通,又可标定数据流通过程中相结合的不同的要素投入,从而使得数据要素具备了和其他要素类似的可交易性、可赋权性和可管理性,为推动数据要素市场建设找到了一些“可行解”。此外,笔者认为,数据全价值链赋权的基础设施也将为《数据二十条》规定的数据三权的进一步证券化提供基础,为市场化定价数据流通全价值链上的多重要素投入形成技术支撑。非同质化通证记录了数据价值链上的要素投入;智能合约技术明确界定和记录了数据价值链上各个要素的定价机制;多方安全计算技术则保证了敏感数据无法被滥用。这使得非同质化通证与智能合约所承载的权益等都可以被估值和证券化。例如,在生成人工智能(AIGC)的案例中,大量艺术工作者创作的内容一旦被人工智能模型使用,就可以被非同质化通证所记录。艺术工作者和模型开发者之间的交易合同则界定了收益分配方案,使记录这一使用关系的非同质化通证有了可估值的依据,从而具备了可交易的属性,由数据要素供需市场衍生出来的数据金融市场由此更值得各方期待。
原标题为【做好数据流通全价值链赋权筑基数字化发展环境】
作者:于洋 杨祖艳 林彦熹 时代,单位:清华大学交叉信息研究院,华控清交信息科技(北京)有限公司,其中杨祖艳系华控清交信息科技(北京)有限公司副总裁