隐私计算﹢区块链:让数据真正成为生产要素

随着数字经济时代全面开启,信息的重要性日渐提升。何宝宏认为,当前,在物质世界和精神世界之外,信息作为“第三世界”正在崛起。《中华人民共和国个人信息保护法》指出,个人信息就是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。“个人信息就是‘你的另一半’,是数字孪生的另一半。”何宝宏提出了这一新颖的观点。

简单理解,个人信息就是我们在数字世界的“孪生化身”,是另外一个世界里的我们。在何宝宏看来,《中华人民共和国数据安全法》和《中华人民共和国个人信息保护法》的落地,意味着国家正在通过个人信息保护立法的方式保护数字世界的“我们”。

“除了法律法规,技术的发展和进步,也将为个人信息保护以及数据生产要素化提供有效途径。”何宝宏以当前正在快速兴起的隐私计算技术为例,隐私计算是在保护数据拥有者个人隐私的前提下,实现数据价值的流通及数据价值深度挖掘的一类重要方法。

当前,各行各业加速数字化转型步伐,数据正在加速生产要素化,即数据的价值属性日渐凸显。何宝宏表示,数据具有既代表信息又代表价值的双重属性,在处理数据时如何解耦信息和价值就变得至关重要。“正是在这一背景下,隐私计算和区块链技术正在加速融合。虽然两者目的不同,但都服务于数据价值的流通,服务于数据生产要素化,可谓天生一对。”他补充道。

“如果将数据比作车,那么网络基础设施就是路。”何宝宏介绍,当前的数据保护技术,更多是在“路”上想办法,比如防火墙、网闸、UTM等技术,就是“断路型”技术。一旦“路通了”,“开”着数据出去了,基础设施就很可能对数据失去了控制。因为担心失控,现在很多本该流动的数据被“圈养”在数据孤岛上,价值无法得到有效发挥,大数据长成了“数据巨婴”。

那么,一方面,是数字化浪潮下亟待数据流动和共享;另一方面,则是数据保护技术不够强健,不敢让数据“跑出去”。如何解决这个矛盾?何宝宏认为,可以尝试从数据这个“车”的本身想办法,即将“车”进行“武装”,将数据的信息属性和价值属性进行剥离,让数据要么“看得见信息但价值不能用”,要么“只是能利用价值却看不见信息”。

“可见不可得”,就是只释放出数据对应的信息,把数据对应的价值仍然控制在自己手里。典型代表技术是区块链,链上的每个人都能够看到链上数据的信息,但只是“吃瓜群众”,该数据对应的价值是控制在区块链上且可以有序流动的。

“可得不可见”,就是只释放数据可以产生的价值,数据对应的信息仍然控制在自己手里不公开。典型代表技术是隐私计算,每个人都可能从数据中获得价值,但数据本身是加密后的“盲盒”,原始数据仍然控制在拥有者手中。

后记:

区块链+隐私计算

数据时代的信任机制与隐私保护

区块链技术是一种通过去中心化、高信任的方式集体维护一个可靠数据库的技术方案。由于具有“去中心化”、“分布式数据存储”、“可追溯性”、“防篡改性”、“公开透明”等优势特点,区块链技术能够有效解决数据领域的数据真实性、安全性与开放性问题,通过建立可信任的数据管理环境,防范和避免各类数据造假、篡改、遗失等数据管理问题,促进数据的高效共享与应用。

一如上文所述,区块链技术具有“信息数据共享和透明”的特点,但无论从市场商业竞争角度还是个人信息安全角度来看,都没有人希望自己的数据完全公开、透明。因此,隐私保护合规成为数据管理领域的一条重要“红线”,一方面保护着数据所有者的隐私安全,另一方面也影响着数据流通共享的效率与发展。

那么有没有一种技术既可以保证信息数据的高效流通共享,却又不会越过隐私保护合规红线?

图片

如果说“区块链”技术建立了数据时代的信任机制,那么“隐私计算”则在数据共享洪流中为数据所有者建立了安全的隐私保护防线。

“隐私计算”,即面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄漏代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。简单来说,隐私计算即是从数据的产生、收集、保存、分析、利用、销毁等环节中对隐私进行保护的技术方法。

同区块链技术一样,隐私计算并不特指某一门技术,而是一种融合了密码学、数据科学、经济学、人工智能、计算机硬件、软件工程等多学科的综合技术应用。隐私计算包括一系列信息技术,如业界较早提出的安全多方计算(MPC)技术、以硬件技术隔离保护为主要特点的可信执行环境(TEE)技术、基于密码学和分布式计算实现多方协作机器学习的联邦学习(FL)技术,以及如同态加密、零知识证明、差分隐私等辅助性技术,都属于隐私计算范畴。

1

安全多方计算(MPC),是一种在参与方不共享各自数据且没有可信第三方的情况下安全地计算约定函数的技术和系统。通过安全的算法和协议,参与方将明文形式的数据加密后或转化后再提供给其他方,任一参与方都无法接触到其他方的明文形式的数据,从而保证各方数据的安全。

2

可信执行环境(TEE),是指CPU的一个安全区域,它和操作系统独立开来,且不受操作系统的影响。在这个安全区域里保存和计算的数据不受操作系统的影响,是保密且不可篡改的。

3

联邦学习(FL),是指在多方在不共享本地数据的前提下,进行多方协同训练的机器学习方式。联邦学习技术支持数据不出域,而是让算法模型进行移动,通过数据训练进而优化算法模型。

隐私计算技术的目的在于让数据在流通过程中实现“可用不可见”,即只输出数据结果而不输出数据本身。这一方面保证了数据所有者的数据所有权不受侵犯,满足数据流通的合规性;另一方面在隐私保护技术加持下,各方主体拥有的信息数据能够高效流通使用,不断扩大数据价值,赋能各个行业领域数据应用。

举例如在医疗数据领域,各类医疗数据的隐私性要求较高、数据量较大,通常只保存在本地机构的信息系统中,很难实现高效的医疗数据流通、共享与使用,无法为医疗领域的各类病理研究、医疗诊断与技术创新形成数据支持,不利于创新医疗技术研发与应用。

但如果能通过隐私计算技术支持,在保证数据“可用不可见”的前提下,实现不同区域、不同医疗机构医疗数据的高效流通使用,持续优化医疗行业的各类算法模型,将为实现医疗行业的精准医疗、远程医疗、智能医疗等医疗技术服务创新形成强力数据支持。

THE END
1.为什么数据是新生产要素?如何在数据要素流通中充分挖掘数据价值?在当今数字化时代,数据已经成为新的生产要素,对经济和社会的影响愈发显著。数据的价值不仅仅在于其数量,更重要的是在于其质量、处理和利用的方式。本文将探讨数据为何成为新的生产要素,并剖析其流通的主要途径,及在当代经济中的重要性。 一、什么是数据? https://www.fanruan.com/bw/bd-sjys
2.张平文:“数据”是新的生产要素新一代信息技术包括5G、物联网、大数据、云计算、人工智能、区块链等技术的融合,是全球创新最为活跃的领域,也是当前发展最为迅猛的科技领域。国家把“数据”定为新的生产要素,数字经济已然成为国家之间竞争的主战场。 数字经济在疫情期间成为经济增长的新引擎,为防疫应急、复工复产等提供了数字解决方案,对社会、经济、https://m.hbskw.com/p/63161.html
3.当数据成为“生产要素”要鼓励勤劳致富,健全劳动、资本、土地、知识、技术、管理和数据等生产要素按贡献参与分配的机制…… 这是不久前结束的十九届四中全会的说法,关键词是“数据”,对了,这是头一遭官方提出:数据可作为生产要素按贡献参与分配。 数据,比如你我的身体、活动、交易数据,产权究竟属于谁?这,其实并非一个容易回答的问题。平台https://www.douban.com/note/740930482/?ivk_sa=1024320u
4.“数据”成为生产要素,区块链赋能正当时51CTO博客形象的说,数据是“新型石油”,虽然它不是一种有限资源,但就像石油需要提炼一样,经过一定的处理,能够被解锁出更大的价值。当前全球经济增长乏力,但数据作为生产要素的重要作用日益凸显,成为中国经济发展的新引擎。本文将为大家解读数据作为一种新型生产要素,被正式写入中央文件有何深意?新型技术又将如何赋能释放数据要素https://blog.51cto.com/u_15634468/5364763
5.如今,数据已经成为重要生产力和关键生产要素,深入渗透到生产如今,数据已经成为重要生产力和关键生产要素,深入渗透到生产、分配、交换和消费的各个环节,引领等要素网https://www.netkao.com/shiti/827103/3155286m147ute92s.html