开通VIP,畅享免费电子书等14项超值服
首页
好书
留言交流
下载APP
联系客服
2023.10.03广东
1)供给:有效提升数据质量的厂商,有望在供给环节形成竞争优势。
2)流通:有效提升交易效率的厂商,有望在流通环节形成竞争优势。
3)应用:能实现各个场景与数据深度结合的厂商,有望在应用环节形成竞争优势。
目录
计算机:数据要素:数字经济的核心主线
计算机:数据要素:商业模式探讨系列一
本文逻辑图
01综述:数据要素——基础逐步筑牢,产业变革在即
数据特性:从资源到要素,逐步成为核心。
数据从原始数据到成为生产要素需要经历数据资源化、数据资产化、数据要素化三大过程:
首先是通过整理从无序变为有序,成为具备潜在利用价值的资源,
其次是通过确权等环节成为能够流通的资产,
最后是运用于生产,直接产生价值,成为生产要素。
我们认为当前推动数据从资源变为要素的核心条件正逐步完善。
信息化建设:步入大数据应用阶段,为数据要素发展打下良好基础。
从数据资源的丰富度看,我国产生的数据量从2012年的0.4ZB增长至2021年的6.6ZB,数据量快速累积,数据要素利用的基础已经基本具备。
政策从互联网逐步向数据要素推进。“互联网”政策在推动构建互联网自主技术体系和产业生态的同时推动了数字经济的发展。通过“互联网”的建设,网络、应用、产业、安全基础逐步夯实,为数据资源的积累和利用打下良好的基础,互联网与数字经济、数据要素政策一脉相承。
数据范畴:从政务数据到更广泛的公共数据,应用逐步丰富。
数据类型可以划分为公共数据、商业数据、个人数据。《国务院关于积极推进“互联网”行动的指导意见》中,在创新政府网络化管理和服务中提及推动公共数据资源开放。而近两年的数据条例则从主体、目的、行为角度对公共数据进行了界定。
从数据范畴看,数据资源的开发范畴正从政务数据的领域进一步拓展。如《上海市数据条例》中提出鼓励各类企业开展数据融合应用,加快生产制造、科技研发、金融服务、商贸流通、航运物流、农业等领域的数据赋能,推动产业互联网和消费互联网贯通发展。《重庆市数据条例》中提出鼓励自然人、法人和非法人组织将数据依法汇聚到公共数据资源体系。
法律法规逐步完善,护航数据要素市场发展
2017年颁布的《网络安全法》和2021年颁布的《数据安全法》等基础法律法规明确了数据跨境流动应当进行安全评估。2021年8月,全国人大通过的《个人信息保护法》立足于数据产业发展和个人信息保护的需求,建立了个人信息合法处理的规则。2022年颁布的《数据出境安全评估办法》则进一步明确了数据出境的具体流程和要求,提出应对数据跨境流动采用分层分类管理的治理规则。
各重点应用行业在数据合规基础法律框架基础上,提出针对性规范及指导性文件。
标准持续丰富,涵盖流通、交易等多个环节
标准持续丰富,覆盖多个环节。各地在制定各环节的数据要素标准之前一般会先制定标准体系框架,规定整个标准体系的总体结构与要求,以及基础、数据、技术方法、产品及服务、行业应用、管理、安全和质量与评价等标准分体系的构成与要求。
供给环节标准:侧重提升数据质量。数据要素供给包括数据的采集、整理、聚合和分析等环节,为强化数据要素高质量供给,需要加强数据要素供给标准化、规划化建设。
数据流通环节标准:国家标准侧重提升数据要素流通效率,覆盖多个细分环节。数据要素流通环节包括数据登记、数据定价、数据交易共享和数据服务运营等,建设涵盖各方面的数据要素流通标准可以加快数据要素流通,充分发挥数据要素价值。同时,各省市积极开展数据要素流通环节的标准研制工作。
安全标准较为丰富,涉及数据安全、技术安全、平台安全。除去以上针对细分环节的标准,还有涉及数据要素全生命周期的环节,如数据基础设施、数据安全、数据咨询服务和数据人才培训等,其中我国围绕数据安全、技术安全、平台安全等方面的标准规范较为丰富。
重点行业标准:政务标准较丰富,重点行业持续更新。数据行业应用标准从大数据为各行业能提供的服务出发,是各领域根据其特性研制的专用数据标准,包括政务、金融、工业等领域。
数据流通安全,全生命周期技术体系逐步形成
数据要素技术可按照作用分为4类,分别为维护数据安全、提升数据质量、加强数据标准化、提高交易效率。其中,维护数据安全技术包括隐私计算、区块链、密码技术。
维护数据安全技术:
1)隐私计算:包含三大主流方向
与传统数据使用方式相比,隐私计算的加密机制能够增强对于数据的保护、降低数据泄露风险,并保证在安全的前提下尽可能使数据价值最大化。
隐私计算是涉及密码学、智能科学、硬件技术的交叉融合技术,当前主流的隐私计算技术有三大方向:一是多方安全计算;二是联邦学习技术;三是可信执行环境技术。不同技术往往组合使用。
2)区块链
在数据确权方面,数据确权是数据交易的前提,可以使用区块链技术进行数据登记,实现数据资产的唯一性确权。由于区块链中每一个节点都有一份相同的副本,并且副本的任何改变都要通过所有节点的共识,修改区块链中记录的内容非常困难,因此区块链可以帮助记录数据交易过程中的关键性数据或者证据。
3)密码技术
采用密码技术对信息加密,是最常用和有效的安全保护手段。目前广泛应用的加密技术主要包括:对称算法加密和非对称算法加密。
对称算法加密的主要特点是通过相同的密钥对信息进行加密和解密,最常用的是DES算法。
非对称算法加密避免了对称加密的密钥配送问题,其通过公布出去的公钥加密,自己保有的私钥解密。最常用的是RSA系统。
密码技术可用于数据脱敏,对敏感信息进行数据的变形,实现敏感隐私数据的可靠保护。数据脱敏规则包括使用随机值、数据替换、对称加密、平均值、偏移和取整等,常常多规则配合使用。
4)机器学习:提升数据质量
机器学习使用计算机模拟或实现人类学习活动,从数据中自动分析获得模型,并利用模型对未知数据进行预测。基于学习方式可以分为监督学习、无监督学习、强化学习等。
在数据标注中,使用基于机器学习的半自动标注方法,主要用于提升训练精度、减少整体标注成本、加快模型开发效率。半自动标注方法包括预训练模型和主动学习等。
预训练模型,先对小批量数据进行标注学习训练,得到一个预训练模型,然后以学习结果去标注剩下的数据集,往复循环,逐步提高精度。
主动学习,即网络具有一定自主决策能力,可主动地提出一些标注请求,将经过筛选的数据提交给人类专家进行标注,节约标注成本,提升效率。
02数据:覆盖多环节的产业链逐步清晰
涵盖供给、流通、应用的全方位的数据要素产业链逐步清晰
数据要素从产生到发挥价值,涉及众多细分环节,从《“十四五”数字经济发展规划》中提出“充分发挥数据要素作用”的具体要求看,包括强化高质量数据要素供给、加快数据要素市场化流通、创新数据要素开发利用机制。
我们将数据要素的全价值链总体划分为供给、流通、应用三大环节。
不同环节所涉及的具体能力要求有所不同,在《“十四五”数字经济发展规划》中,针对数据要素供给环节,提出数据质量提升工程,侧重从数据资源、主体、标准化三大维度切入提升数据质量;在数据要素流通环节,提出数据要素市场培育试点工程,聚焦于确权及定价、数据交易平台的试验与培育。
数据要素供给:形成数据资源,为数据从资源向资产转化打下基础。我们认为,有效提升数据质量的厂商,有望在供给环节形成竞争优势。
数据要素流通:数据成为生产要素的关键。数据资源本身具备利用的价值潜力,而要素流通则是其从数据资源变为生产要素,实现价值的关键。
我们认为,有效提升交易效率的厂商,有望在流通环节形成竞争优势。
数据要素应用:数据要素产生价值的具体体现。
从数据类型看,据“十四五”数字经济发展规划,分为商业数据、政务和公共数据,商业数据与场景深度融合的同时,鼓励更多社会力量对政务和公共数据进行增值开发利用。
从应用行业看,重点行业数字化转型提升工程中提及的行业与数字经济及其核心产业统计分类(2021)中所提及的数字化效率提升行业也有一定重合。
我们认为,数据要素应用与数字经济产业互相促进,但侧重点有所不同:
1)数字经济核心产业涉及自动化、智能化等多个领域;2)而数据要素应用则聚焦于数据价值的挖掘,数据服务的丰富。
我们认为,能实现各个场景与数据深度结合的厂商,有望在应用环节形成竞争优势。
数据要素产业链逐步清晰:涵盖供给、流通、应用。
1)围绕提供高质量数据的主题,数据采集、整理(数据标注、数据清洗、脱敏脱密、标准化)、聚合(数据传输、存储、集合汇聚等)、分析等厂商构成了数据要素产业链中的供给环节;
2)围绕提升数据要素交易效率的主题,确权登记、定价交易、交付清算及相应的服务厂商构成了数据要素产业链中的流通环节;
3)围绕数据价值挖掘的主题,各个细分行业的数据应用逐步深入。
我们认为当前涵盖供给、流通、应用的全方位的数据要素产业链逐步清晰。
参与主体:涉及供应商、监管方、需求方等多方
数据供给:数据产出行业集中度高,2021年五大行业占比65%左右。
数据供给可拆分为采集、整理、聚合、分析四个环节,分别对应了数据产品供应商(负责提供原始数据)、数据加工处理服务商(负责数据预处理,将非结构化数据处理成结构化数据)、数据资源集成商(负责数据集合)和数据分析技术服务商(负责数据分析)四大参与主体。
根据中国网络空间研究院发布的《国家数据资源调查报告(2021)》,2021年,我国数据产量高达6.6ZB,同比增长29.4%。
在行业分布上,个人持有的各类设备共产生1.4ZB数据,全国各类行业机构共产生5.2ZB数据,其中,主要分布在政府、互联网、媒体、公众服务及专业服务、交通等行业,上述五大行业数据产量占全国行业机构数量总产量的65%左右。
数据流通:厂商集中在数据产品供应商,数据交易经纪服务商厂商较少。
数据流通可以拆分为三阶段。
1)第一阶段:需要完成数据登记确权,参与主体为数据质量评估商。
2)第二阶段:包括数据产品、挂牌上市、撮合交易三阶段,涉及到数据产品供应商(提供数据产品)和数据交易经纪服务商(负责交易撮合、交易经纪,起到中介的作用)。
3)第三阶段:包括合约交付和交易结算,参与主体仍为数据交易经纪服务商。
数据利用:需求端需求旺盛,涉及行业众多。
从场外的数据交易情况来看,需求侧并不存在需求低迷的情况,尤其数据驱动型的公司对数据有着较大的需求。这些行业主要涉及到政务、工业、互联网、医疗、金融、能源、商贸等领域。
市场规模:2021年达到数百亿元级别
数据供给:当前中国数商行业企业数量为192万家,数据产品和服务供给不足。
从市场规模来看,2021年,数据供给环节(采集、存储、加工)的市场规模达到385亿元。
根据国家工信安全发展研究中心,2021年中国数据要素市场规模约为815亿元(不含数据应用),其中,数据供给环节占比47.2%。从数商企业数量来看,存在明显的供需不匹配问题,缺少标准化和规划化产品。
高质量数据产品的背后是高质量数商。根据《全国数商产业发展报告》,截至2022年11月,中国数商行业企业数量达到192万家。
数据流通:目前仍以场外交易为主,场内交易持续发力。
数据流通规模:
从市场规模来看,根据国家工信安全发展研究中心,2021年中国数据流通(交易、分析、数据服务)市场规模约为380亿元,占中国数据要素市场规模的46.6%。
场内、场外交易占比:
从市场占比来看,根据上海数据交易所研究院,2022年,场外交易占全部交易的比重约为2%。预计到2025年,场内交易占比将达到1/4~1/3。场外交易平台集中度低,场内交易以省市级交易所为主。
03数据供给:以“数据资源化”构筑数据要素产业链起点
数据要素供给是整个数据产业链的基座和起点,主要包括数据采集、数据整理、数据聚合、数据分析四大环节。
我国数据要素供给环节发展较为成熟,数据要素产业基础已基本夯实。据国家工信部统计,2021年我国数据采集、整理、聚合、分析的产业规模分别为45、160、180、174亿元。2022年11月,我国数据采集、整理、聚合、分析四个环节的数商企业数量占比分别49.9%、7.5%、25.5%、17.1%,是数据要素市场中发展较为成熟的产业环节。
数据采集是数据要素供给的首要环节。数据采集是数据整理、数据聚合、数据分析的业务基础,决定了数据要素供给的范围和质量,一般可分为线下采集与线上采集两种方式。
根据数据主体差异,数据采集对象包括公共数据、企业数据、个人数据三类。
公共数据逐步进入要素市场,高价值数据集安全有序开放。我们认为,伴随公共数据的安全有序开放,未来公共数据采集将呈现合法化、共享化、价值化三大特征,公共数据有望加快进入要素市场。
企业数据采集是数据要素市场的重点。企业数据采集主要包括内部数据采集、外部数据采集和定制化数据采集等三种类型。
数据要素型企业,是指自身拥有大量数据且能够提供自身数据给第三方数据采集商、处理商、存储商、分析商的企业,通常来自于金融、互联网、交运、医药健康、能源、工业制造、通信运营等数据密集型行业。
第三方数据采集商以数据要素型企业为采集对象,通过数据采集、处理、分析形成高价值密度的数据集产品,满足数据需求方的外部数据采集需求。
我们认为,伴随数据要素市场的快速发展,数据要素企业与第三方数据采集商有望成为数据要素产品的重要供给源,数据要素型企业、数据采集商将成为主要的数据产品供应商。
数字化转型建设商具备业务一体化优势,大数据厂商数据理解深厚。数据采集的市场主体包括采集设备提供商、数字化转型建设商、数据采集解决方案供应商(即大数据厂商)三类。
数据整理:数据资源化核心环节,搭建数据要素标准体系
数据整理是实现数据到数据资源转变的核心环节。
数据整理是指对采集、存储的数据进行筛选和处理,提升数据的可用性,为数据资源聚合、挖掘、分析奠定基础。主要包括数据清洗、标注、脱敏、标准化治理四大细分环节。以标准化治理为核心的数据要素标准体系构建有望成为该阶段的建设重点。
1)数据清洗:得益于大数据产业的高速发展,2016年起以贵阳大数据清洗基地为代表的多家数据清洗基地相继落成,我们认为,伴随数据要素市场化进程加速,数据质量管理的重要性将更加凸显,数据清洗需求也将加速增长。
3)数据脱敏:数据脱敏可分为静态数据脱敏和动态数据脱敏两大类,静态数据脱敏是指对完整数据集进行大批量、一次性的整体脱敏,多采用ETL技术进行脱敏处理;动态数据脱敏是指对外部申请访问的敏感数据进行实时脱敏处理,多采用中间件技术对外部的访问申请和返回结果进行即时变形转换处理。
4)数据标准化治理:根据2018年发布的首个数据管理领域国家标准GB-36073,数据标准化治理已成为DCMM数据管理能力成熟度评估模型的重要组成部分;截至2022年6月,DCMM贯标已覆盖全国电力、通信、金融、政务、IT、工业制造等领域的252家企业,其中二级企业共124家(占比49%),三级企业共94家(占比38%),四级企业共28家(占比11%),五级企业共3家,数据标准化治理水平仍有较大的提升空间。
数据加工服务商占主导,数据治理服务商有望加速成长。
1)数据加工服务商:专注于数据的清洗、标注、脱敏等加工服务,为数据分析应用提供高质量数据基础;
2)数据治理服务商:主要从数据全生命周期的视角,为企业提供数据的标准化治理服务,提升企业自身的数据管理能力。
根据上海数据交易所发布的《2022全国数商产业发展报告》,截至2022年10月国内数据加工服务商数量(121,598家)远超数据治理服务商(13家),我们认为,随着数据要素在经济活动中逐渐发挥重要作用,企业对数据管理能力的要求将进一步提升,数据治理服务商有望加速成长。从具体细分环节来看,参与厂商构成具有一定差异:
数据聚合:数据资源化枢纽环节,强调数据要素互通共享
数据聚合是数据要素互通共享的枢纽环节。根据聚合范畴的不同,数据聚合可分为数据库、数据湖、数据仓库、数据平台等多种业务形态:
1)数据库:按照数据结构不同可分为关系型数据库、NoSQL数据库、NewSQL数据库。
数据上云成为重要趋势,非关系型数据库快速发展。综合考量数据要素化带来的数据与计算变化,我们认为,面向数据要素的数据库存储将呈现显著的云化趋势,云数据库能够按需分配计算、存储和带宽等资源,具有按需付费、按需扩展、高可用性、存储整合等灵活性优势;同时大量图像、视频、社交信息等非结构化数据高速增长,带动非关系型数据库占比快速提升。
据沙利文预测,2025年我国数据库产业规模将达到682.3亿元,2021-2025年复合增长率约为21.1%,云数据库将成为重要增量。
2)数据仓库:是指用于存储、分析、报告的数据系统,与数据库相比数据仓库中的数据按照一定主题域进行组织;
3)数据湖:是指集中式数据存储库,允许以任意规模存储所有结构化和非结构化数据,解决了数据分散、存储散乱、数据孤岛众多等问题;
湖仓一体成为数据湖、数据仓库的重要发展趋势。普通的数据湖(DataLakes)在数据质量、一致性/隔离性、混合处理追加读取等方面不如数据仓库,普通的数据仓库(DataWarehouses)在多源、异构数据融合方面劣势较为明显。湖仓一体(Lakehouse)兼容了数据仓库和数据湖的优势,在数据湖的低成本存储上实现数据仓库的数据结构和管理功能,包括事务支持、模式执行和治理、商务智能BI(BusinessIntelligence)支持、存储与计算分离、多种数据类型支持、各种工作负载支持等。
国内湖仓一体厂商主要包括云厂商和大数据厂商两大类。
4)数据平台:是指通过内容共享、资源共用、渠道共建、数据共通等形式来进行服务的网络平台。我们认为,数据要素互通共享将成为数据分析利用的重要支撑,云数据库、湖仓一体平台、大数据平台等产业形态有望加速发展。
数据分析:数据资源化应用环节,实现数据价值深度挖掘
2025年数据分析市场规模有望突破1300亿。
数据分析是指通过对数据资源的详细研究、概括总结以实现数据功能的最大化开发,包括商业智能(BussinessIntelligence,BI)分析、知识图谱、边缘计算、智能决策等细分市场。
参考沙利文、艾瑞咨询、亿欧智库、IDC对数据分析细分市场的市场规模预测,2025年BI分析、知识图谱、边缘计算、智能决策的市场规模分别为94、246、629、353亿元,合计市场规模有望达到1322亿元。
BI分析进入智能BI时代,参与者包括BI解决方案商和大数据厂商两大类。BI分析平台的架构自下而上包括基础服务、数据接入、数据处理、数据可视化、内容呈现五个层级;市场参与者包括BI整体解决方案厂商、具备BI功能的大数据厂商两大类。
知识图谱(KnowledgeGraph,KG)围绕大数据知识图谱、行业知识图谱两类产品展开,参与厂商包括图数据存储商与KG建模训练商两大类。
1)通用知识图谱:面向开放领域,强调知识图谱的广度,通常难以形成完整的全局性的本体规范;
2)行业知识图谱:面向特定行业,主要用于辅助各种复杂的分析应用及决策支持场景,已广泛应用于政务、金融、医疗、农业、电力等下游行业。
边缘计算高速发展,产业生态日益完善。边缘计算是指在数据源附近的网络边缘执行数据分析处理以优化云计算系统的方法。
边缘计算产业链上游为服务器、边缘网关、边缘计算终端、边缘计算平台等基础软硬件设施提供商;
产业链中游为云服务厂商、电信运营商等边缘云建设服务商;
产业链下游为行业垂直系统集成商、产业链综合服务商、边缘计算专家等系统集成商。
据亿欧智库统计,2021年我国边缘计算市场规模为427.9亿元,其中边缘硬件市场规模为281.7亿元,软件与服务市场规模为146.2亿元,据亿欧智库预计,2025年我国边缘计算市场规模有望达1,988亿元,其中硬件市场规模1,359亿元,软件与服务市场规模629亿元。
2025年智能决策应用渗透有望超60%,智能决策时代或将加速到来。智能决策是指利用机器学习、深度学习、联邦学习、运筹学等技术,实现精准营销、销量预测、供应链管理、风险控制等业务环节的智能决策,已实现在金融、零售、制造、能源等行业的初步应用。
根据IDC发布的《2021年中国智能决策解决方案市场份额》报告,2021年中国智能决策解决方案市场规模达8.9亿美元,同比增长66.4%,据IDC预测,到2025年,超过60%的中国企业将实现智能决策技术的应用,员工的工作效率和生产力较2021年将提升25%。
04数据流通:“55”构建流通框架与市场环节
数据要素流通市场建设包括政策与法律法规、流通制度、模式、技术和标准五方面。
数据要素流通市场化发展涉及数据权利、登记、定价、交易、监管五个环节。
数据权利与确权:数据要素流通交易的基础
1)数据持有权:根据国家发展和改革委员会《数据基础制度观点》,数据持有权的权能至少涵括自主管理权,具有私益性;
2)加工使用权:是指企业自我使用、处理加工数据的权利;
3)经营权:是指企业对数据的开发、交易和处分的权利。其中,数据使用权和经营权须具有一定的排他性才能够确认为资产,即企业控制的资产必须带来其它企业不能获得的经济收益。
数据的特殊性、数据权利多样性、参与者众多等使得数据确权较为困难。
国内外在数据权属问题上均进行了充分的法律制度探索。国内数据确权尚处于起步阶段。我国数据权属确定基本确立了分割、分类、分级的“三分原则”。总体看来,我国现有的数据确权探索仍处于政策萌芽层面,实际落地尚需时日。
2026年,全球数据量预计达175ZB,数据确权市场前景广阔。目前,国内数据确权暂未形成明确的商业模式。但是从数据量上看,据IDC数据,2025年,全球数据量总和预计高达175ZB(1泽字节相当于1万亿GB)。2017年,中国的数据产生量约占全球数据产生量的23%,按照该占比计算,2025年,中国数据量约为40.3ZB,数据确权市场前景广阔。
数据登记:确认数据合法性的保障
国外尚未明确数据登记概念,国内率先确立数据资源与数据产品两种数据要素。
1)数据资源:指经过初步加工处理后、可以再次开发利用并创造价值的数据要素;
2)数据产品:指再加工后的、可直接交易产生收益的数据要素。
基于两种数据要素类型,衍生出数据资源和数据产品两种登记模式。
1)数据基本信息:包括名称、所属行业类别、数据类型、哈希值等;
3)数据实现收益途径:包括数据用途、稀缺性、开发可行性等;
4)数据权属关系:是否享有使用权或经营权;
5)法律情况:说明数据是否涉密及是否存在法律争议;
6)审计:登记机构通过线上随机采样或现场核验等方式进行审计,核验通过后颁发数据资产证书,完成资产登记。整个环节涉及技术主要包括区块链、哈希技术、知识图谱等,保证了数据登记权力链和流通链安全可追溯。
数据定价&收益分配:量化数据估值,确定数据收益
数据定价指的是依据数据质量、成本、应用评价结果,使用相应方法对被评估数据进行量化估值,我国已初步形成了包含数据评价与价值评估两个环节的数据资产定价基本模式:
1)数据评价环节:包括质量要素、成本要素、应用要素三部分的技术评价;
2)价值评估环节:由于数据资产无实物形态且具有非货币性,可类比无形资产,采用成本法、收益法、市场法对数据资产价值进行评估。
价值评估环节的成本、收益和市场三种评估方法各有优劣。
静态定价策略与动态定价策略相结合的方法,更适合不完全市场下的数据定价实践。国内数据交易平台/交易所更偏向于动态定价,国外更偏向于静态定价。
完善理论框架和实现动态定价或是数据定价模式的研究重点。在数据确权、定价的基础上,交易平台和数据卖方按照收益分配机制实现数据价值。
收益分配机制包含两部分。一部分是数据交易平台收益分配机制,包括:
1)交易分成收益分配机制:在数据交易完成后大数据交易平台与数据卖方按约定好的比例分成相应的中介费用;
2)保留数据增值收益权分配机制:大数据交易平台对数据保留增值收益权并以此为基础收费的方式。
另一部分是大数据交易卖方收益分配机制,包括:
1)一次性交易所有权收益分配机制:在数据交易中一次性转移数据占有权、使用权、处分权、收益权;
2)多次交易使用权收益分配机制:即只针对数据使用权进行反复多次的交易,带来更多收益;
3)保留数据增值收益权分配机制:数据卖方决定是否需要保留对收益权的占有,并决定按多少比例进行合同约定。
南方电网对数据资产实现“明码标价”。2021年3月,南方电网发布《中国南方电网有限责任公司数据资产定价方法(试行)》,实现了对数据资产的“明码标价”。南方电网结合金融、电信等典型行业的应用场景和数据需求,从基本特征、产品类型、成本构成、定价方法等角度对公司数据资产进行规定。据中国信通院,该定价方法已经在南方电网24个分(子)公司应用,服务于63种数据对外服务产品矩阵,支撑4种数据资产变现的商业模式,是数据定价的典型案例。
数据交易:培养数据要素市场的关键
数据交易对象包括“大数据&衍生品”和“传统数据&衍生品”两种数据商品。基于参与数据交易市场的主体和行为,可构造出如下数据交易市场的基本框架图。
数据交易制度包括交易所制度、数据经纪人制度和数据空间制度。
1)交易所制度:数据交易所类似于股票市场的场内交易,是数据交易双方集中交易的市场化场所,能够有效的促成买卖双方的公平交易,降低交易风险,同时,具备不可替代的高效性和规范性。
2)数据经纪人制度:数据经纪人指的是通过匹配、沟通和撮合,促成买卖双方的数据交易并赚取佣金的中介机构或个人。该制度有利于盘活闲置数据资源,匹配市场供给需求,促进数字经济的快速流通。
3)数据空间制度:数据空间是一个虚拟空间,促进受信任的商业生态系统中安全和标准化的数据交换和数据链接。数据空间目前仍处于倡议阶段,提供研究活动、制定标准、构建生态等功能。
数据交易市场模式类比传统要素流通交易市场模式进行探索与发展。主要包括四种模式:直接搜索市场,交易商市场,经纪人市场,拍卖市场。目前国内的数据交易市场纷繁复杂,互有优劣。
1)直接搜索市场在数据量小的交易中具备优势,但存在交易不透明的缺点;
2)交易商市场能容纳较大数额的数据交易,但仍需提升数据增值服务;
3)经纪人市场能够保障数据主体的权益,但是个人隐私权难以保障;
不同的交易市场催生不同的服务运营模式与之相适应,具体可分为数据直供服务、数据加工服务、数据银行模式和数据信托模式。
1)数据直供服务:数据要素流通市场早期形成的服务模式,随着数据服务形态逐步智能化和高效化,这种服务将逐渐退出历史舞台;
2)数据加工服务:随着算法技术的持续发展,逐步衍生出智能、全面、独具中国特色的数据加工服务,能够对数据进行脱敏、去标识化,确保敏感数据交易的安全性;
4)数据信托服务:可以横跨货币市场、资本市场、实业产业,有着广阔的发展空间。
数据交易过程涉及技术包括数据元件技术、数据空间技术、数据隐私技术等。
政策全面化、服务专业化、模式多样化、主体多元化将是数据交易市场未来的发展方向。
1)政策全面化:我国正逐步探索建立国家层面数据交易的法律法规和行业标准,推动我国大数据交易实现标准化、规范化;
3)模式多样化:以现有的交易形式为基础,未来更多交易主体将参与到交易过程中,增强数据流通性和使用价值,多渠道提升数据交易变现能力;
4)主体多元化:未来将逐步形成包含数据产品提供方、数据产品使用方等在内的多元主体。
上海数据交易所已实践了完整的数据交易流程:1)交易准备阶段:2)交易合约阶段:3)数据交付阶段。
数据监管:保障数据要素安全流通流转
欧盟采用统一监管模式,致力于保护数据主体的人格权和隐私权。美国数据立法遵从分散立法模式,寻求数据权利保护与数据自由流通之间的平衡。
风险提示:
本研报中涉及到的公司、个股内容系对其客观公开信息的整理,并不代表本研究团队对该公司、该股票的推荐或覆盖。
01多方共同参与,打造高效、安全的数据要素产业链
高效、安全的流通是数据产生价值的关键。
1)数据资源化环节:需要对数据进行整理、组织,形成能够利用的数据资源,是数据产生价值的基础;
2)数据资产化:需要对数据进行确权、登记,明确其资产的属性,是数据产生价值的前提;
3)数据要素化:需要将数据资产投入具体的生产应用中,在此过程中,高效、安全的流通使数据能够应用于各个细分的应用场景,是数据产生价值的关键。
数据要素从生成到流通,需要多个主体参与。
从参与角色看,总体可分为以下几类:
1)数据供给方(主要指产生数据的部门或企业,包括公共部门、数商、数据采集设备商等);
2)数据加工方(主要指对原始数据进行加工的厂商,包括数商、数据标注厂商、数据元件开发商等);
4)第三方服务方(涉及安全合规、资产评估、金融服务、争议仲裁、确权登记等环节的主体);
5)数据需求方(对数据或数据元件有需求的参与者,包括利用数据进行开发的数据产品开发商、数据产品下游行业客户等)。
02系统是数据要素产业链的重要保障,需求点逐步明晰
系统需求点一:确权登记,评估定价。
系统需求点二:安全、高效的流通与运营。
随着数据要素市场的重要性逐步提升,通过技术手段提升数据流通效率及安全性的探索正逐步进行,并且已经形成一定的产品化成果,具备融合创新、安全可控、先进高效、可信流通特点的整体产品组合已经基本成型。
03系统产品探索成效初显,系统建设方或首先受益
“数据金库数据元件”方案落地,为实现高效安全的数据要素流通打下基础
1)数据金库:是当前落地的数据要素解决方案中重要的安全存储方式。
数据金库用于存储核心数据、重要数据和个人隐私数据,在数据金库之间通过内网进行数据共享、交换;
在与外网通信的过程中,则一方面对数据进行处理,将数据加工为数据元件,实现数据的可用不可见,另一方面通过数据单向网闸、数据摆渡的方式实现安全传输,保障库内数据安全。
2)数据元件:有望成为数据要素市场重要基本单元
数据元件与电子元件类似,即通过一定的规则(合并、连接、特征提取等)将原始数据进行封装,使原始数据和数据应用“解耦”,实现了“原始数据不出域、数据可用不可见、数据不动模型动”具有风险隔离、安全审查、精准监管、可析权、可计量、可定价等属性。
数据元件的特殊属性使其能够满足标准、合规的要求,在实践中数据元件技术往往与数据金库结合,通过数据技术体系标准化流程,以数据金库的数据为原料快速生成安全、可用、标准的数据元件产品。
2022年7月28日,中国信息产业商会正式发布《数据元件的结构要求》、《数据元件安全审核要求》,标准的确立有望推动数据元件技术的进一步推广,数据元件有望成为数据要素市场重要基本单元。
围绕数据元件的环节包括数据元件的生成、管理、交易。我们认为,围绕数据元件的系列解决方案有望加速推广,系统建设方有望首先受益。
商业模式有望随数据要素生态建设逐步丰富。当前通过数据元件技术,结合数据金库已经初步实现了公共数据元件的生成,为数据要素流通打下了良好的基础。我们认为数据要素生态建设也有望经历从公共数据应用于公共服务,到公共企业数据联合开发,应用于公共服务、企业生产的过程。伴随数据要素生态建设的推进,商业模式也有望逐步丰富。
研报:《计算机:数据要素:数字经济的核心主线》2022年12月13日
谢春生S0570519080006|BQZ938
郭雅丽S0570515060003|BQB164
范昳蕊S0570521060004
研报:《计算机:数据要素:商业模式探讨系列一》2022年12月18日