本文主要介绍国外数据资产评估,涵盖博弈论、资产评估理论、人工智能、实物期权理论以及Shapley值法和破产分配法等多个方面。基于博弈论的方法以模拟买卖双方交互为基础,考虑了消费者支付意愿,为数据定价提供了通用框架。人工智能方法通过机器学习实现自动化、动态的定价,但对高质量训练数据和计算成本有依赖。各方法各具特色,但在实际应用时需综合考虑市场因素。最后,基于Shapley值法和破产分配法的方法充分考虑了要素权重,但在确定优先级和计算复杂性方面有挑战。
一、基于博弈论的方法
这种方法考虑消费者的支付意愿,计算出与数据资产最接近的价格。具体来说,首先提出一个基于计算授权数据集定价利润的通用框架。在第一阶段,卖方确定初始价格;在第二阶段,考虑买方的支付意愿,如果买方认为价格太高,则会拒绝购买,卖方需要降低价格以刺激购买量。为拟合这个过程,采用递增函数迭代计算不同价格下的卖方利润,迭代多次后找到利润最大化的平衡价格。这种方法同时考虑了卖方和买方,通过模拟双方博弈来求解最优价格。但是该方法也存在只考虑单一交易的局限性,未考虑数据资产的时效性,也未考虑不同买方的差异化偏好。例如,对于相同的数据资产,个人用户的支付意愿通常低于企业用户。总体来说,该方法为数据定价提供了一个通用分析框架,但实际运用中需要补充更多市场相关因素。
二、基于资产评估理论和博弈论的方法
这种方法区分竞争市场和垄断市场,分别构建不同的数据资产定价模型。对于竞争市场,将数据资产与相关的服务捆绑销售,服务内容可以是利用该数据资产提供的信息服务等。通过捆绑销售的价格差异,来激励服务提供方提高服务质量。并假设市场上有多个提供相似数据资产和服务的企业,在一定范围内可以与消费者协商数据定价。该方法优点是增加了服务质量因素,使定价更合理,同时考虑了一定的市场竞争因素。但是该方法依然存在假定市场竞争是完全竞争的情况,这与现实中企业具有一定议价能力的情况可能存在差距。对于垄断市场,利用传感器采集原始数据,并依托算法技术构建数据集产品、面向消费者创造数据市场。基于博弈论分析数据提供方在市场垄断地位下寻求利润最大化的最优定价策略。但这种方法也面临模型过于理想化,未能充分考虑实际市场的复杂程度。
三、基于人工智能的方法
这种方法利用机器学习算法收集和分析数据集的历史使用时间情况,根据不同时间段的使用情况差异来动态定价和计算数据资产的价格。具体来说,该方法通过构建神经网络等机器学习模型,训练模型预测不同时段的数据资产使用需求。然后根据预测结果,采用如成本加成定价的方法,计算出不同时段的数据资产价格。这种方法的优势在于可以实现自动化、动态的差异化定价,并考虑了数据资产使用时间的影响。但是该方法依赖大量完整和标注精准的历史训练数据,同时训练复杂模型也需要较高的计算成本。而现实中可利用的训练数据经常不完整,标注也不精准,这会降低模型的预测精度。此外,该方法主要依据的是使用需求,没有考虑更多市场定价的影响因素。
四、基于实物期权理论的方法
这种方法是通过收集标的数据资产的各项属性信息,建立数据库。然后基于各要素对总体价值贡献的分析,采用滚雪球式算法迭代计算要素的重要性权重。具体来说,可以通过问卷调查的方式获取样本用户对各项属性的重要性打分,然后利用算法综合所有用户的打分结果,计算出各要素的权重。接着,根据权重,迭代地进行价值分配,最终得到数据资产的价格。优点是可以考虑各项属性的差异化影响,计算相对全面。但是获取充分有效的用户调研样本较难,算法设计也较为复杂。而现实市场中的买卖双方在属性偏好和支付意愿上也会有较大偏差,这也是该方法的一个限制。
五、基于 Shapley 值法和破产分配法的方法
首先,该方法利用 Shapley 值法计算要素对总价值贡献的边际增量,确定各要素的重要性权值。然后,根据破产分配法的思路,将总价值按照要素的优先顺序进行分配。优先级通常按照要素对价值贡献的大小确定。具体来说,可以先假设所有要素都不存在,然后逐个添加要素计算其边际贡献值,从大到小排序后得到优先级顺序。然后按顺序分配总价值,直至完全分配。这种方法充分考虑了要素权重的差异性,分配方式也较为合理。但是确定要素优先级顺序也较为主观,且计算复杂,需要逐个计算所有要素加入对总价值的边际效应。同时,没有考虑到在分配过程中,后续要素的加入也会影响已加入要素的边际效应。这也是该方法存在的一个局限。