为进一步凝聚共识,推动社会各界对数据领域术语形成统一认识,现就《数据领域名词解释》向社会公开征求意见。
此次征求意见的时间是2024年10月21日至11月20日。欢迎社会各界人士提出意见,请通过电子邮件方式将意见发送至gjsjjzcs@126.com
感谢您的参与和支持!
附件:数据领域名词解释
数据领域名词解释起草专家组
2024年10月21日
附件
数据领域名词解释
1.数据。是指任何以电子或其他方式对信息的记录。数据在不同视角下表现为原始数据、衍生数据、数据资源、数据产品、数据资产、数据要素等形式。
2.原始数据。是指初次或源头收集的、未经加工处理的数据。
3.数据资源。是指具有使用价值的数据,是可供人类利用的新型资源。
4.数据要素。是指能直接投入到生产和服务过程中的数据,是用于创造经济或社会价值的新型生产要素。
5.数据产品。是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。
6.数据资产。是指特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资源。
7.数据要素市场化配置。是指通过市场机制来配置数据这一新型生产要素,旨在建立一个更加开放、安全和高效的数据流通环境,不断释放数据要素价值。
8.数据处理。包括数据的收集、存储、使用、加工、传输、提供、公开、删除等活动。
9.数据处理者。是指在数据处理活动中自主决定处理目的和处理方式的个人或者组织。
10.受托数据处理者。是指接受他人委托处理数据的个人或者组织。
11.数据流通。是指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。
12.数据交易。是指数据供方和需方之间进行的,以数据或者数据各类形态为标的的交易行为。
13.数据交互。是指主体之间以数据的形式进行交流和协作的过程。
14.数据治理。是指提升数据的质量、安全、合规性,推动数据有效利用的过程,包含组织数据治理、行业数据治理、社会数据治理等。
15.数据安全。是指通过采取必要措施,确保数据处于有效保护和合理利用的状态,以及具备保障持续安全状态的能力。
16.公共数据。是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。
17.数字产业化。是指新一代移动通信、人工智能等数字技术向数字产品、数字服务转化,数据向资源、要素转化,形成数字新产业、新业态、新模式的过程。
18.产业数字化。是指传统的农业、工业、服务业等产业通过应用数字技术、采集融合数据、挖掘数据资源价值,提升业务运行效率,降低生产经营成本,进而重构思维认知,整体性重塑组织管理模式,系统性变革生产运营流程,不断提升全要素生产率的过程。
19.数字经济高质量发展。围绕加快培育新质生产力,以数据要素市场化配置改革为主线,协同完善数据基础制度和数字基础设施,全面推进数字技术和实体经济深度融合,持续提升数字经济治理能力和国际合作水平,实现数字技术革命性突破、数据要素创新性配置、传统产业数字化转型和适数化改革,通过数字经济创新发展赋能经济社会高质量发展。
20.数字消费。是指数字新技术、新应用支撑形成的消费活动和消费方式,既包括对数智化技术、产品和服务的消费,也包括消费内容、消费渠道、消费环境的数字化与智能化,还包括线上线下深度融合的消费新模式。
21.产业互联网。是指利用数字技术、数据要素推动全产业链数据融通,赋能产业数字化、网络化、智能化发展,推动业务流程、组织架构、生产方式等重组变革,实现产业链上下游协同转型、线上线下融合发展、全产业降本增效与高质量发展,进而形成新的产业协作、资源配置和价值创造体系。
22.城市全域数字化转型。是指城市以全面深化数据融通和开发利用为主线,综合利用数字技术应用和制度创新工具,实现技术架构重塑、城市管理流程变革和产城深度融合,促进数字化转型全领域增效、支撑能力全方位增强、转型生态全过程优化的城市高质量发展新模式。
23.“东数西算”工程。是把东部地区经济活动产生的数据和需求放到西部地区来计算和处理,对数据中心在布局、网络、电力、能耗、算力、数据等方面进行统筹规划的重大工程,比如人工智能模型训练推理、机器学习等高时延业务场景,可以通过“东数西算”的方式让东部业务向西部风光水电丰富的区域迁移,实现东西部协同发展。加快推动“东数西算”工程建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展。
24.高速数据网。是指面向数据流通利用场景,依托网络虚拟化、软件定义网络(SDN)等技术,提供弹性带宽、安全可靠、传输高效的数据传输服务,具有高带宽、低延迟、高可靠性、高安全性、可扩展性、灵活性等特点。
25.全国一体化算力网。是指以信息网络技术为载体,促进全国范围内各类算力资源高比例、大规模一体化调度运营的数字基础设施。作为“东数西算”工程的2.0版本,具有集约化、一体化、协同化、价值化四个典型特征。
26.元数据。关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据。
27.结构化数据。一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。
28.半结构化数据。不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层的一种数据化结构形式。
29.非结构化数据。是指不具有预定义模型或未以预定义方式组织的数据。
30.数据分析。是指利用技术手段,对数据进行分析,发挥数据作用、释放数据价值的过程。
31.数据挖掘。是数据分析的一种手段,是从大量数据中通过算法搜索隐藏于其中信息的过程。
32.数据可视化。是指将数据以图表、图形、地图等可视化形式展示,以便更好地理解和分析数据。
33.数据仓库。是指一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,通常用于支持企业或组织的决策分析处理。
34.数据湖。是指一种高度可扩展的数据存储架构,它专门用于存储大量原始数据,这些数据可以来自各种来源并以不同的格式存在,包括结构化、半结构化和非结构化数据。
35.湖仓一体。是指一种新型的开放式的存储架构,打通了数据仓库和数据湖,将数据仓库的高性能及管理能力与数据湖的灵活性融合起来,底层支持多种数据类型并存,能实现数据间的相互共享,上层可以通过统一封装的接口进行访问,可同时支持实时查询和分析,为企业进行数据治理带来了更多的便利性。
36.隐私计算。是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私计算的常用技术方案有多方安全计算、联邦学习、可信执行环境、密态计算等;常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。
37.多方安全计算。是指在无可信第三方的条件下,通过特殊设计的密码学算法和协议,允许多个参与方在不泄露各自隐私数据的前提下,协同完成计算任务。
38.联邦学习。是指多个参与方在不共享原始数据的情况下协作完成机器学习任务的方法。
39.可信执行环境。是指提供基于硬件级的系统隔离和可信根,支持基于技术信任的数据安全保障能力,保证在安全区域内部加载的代码和数据在保密性和完整性方面得到保护。
40.密态计算。是指通过综合利用密码学、可信硬件和系统安全的可信隐私计算技术,其计算过程实现数据可用不可见,计算结果能够保持密态化,以支持构建复杂组合计算,实现计算全链路保障,防止数据泄漏和滥用。
41.区块链。是指使用密码链接将共识确认的区块按顺序追加形成的分布式账本。
来源:国家数据局
审核:郦陈雪
编发:马 凯
素材整理:吕昕洺、施娇娇