本文从实体物理空间、人类社会空间和信息网络空间组成的三元空间视角,对数据基础设施的内涵进行剖析。文章基于对信息网络空间运行规律的认识,提出数据基础设施的功能定位是支撑实现数据要素的个体可辨识性、用途可跟踪性和价值可衡量性;最后提出了数据基础设施的建设路径,为后续深入研究和实践提供理论参考与方向指引。
党的二十届三中全会提出,“建设和运营国家数据基础设施,促进数据共享”。2022年12月2日,中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》,提出构建我国数据基础制度体系的“四梁八柱”,以促进数据合规高效流通使用、赋能实体经济为主线,强调促进数据可信流通。构建数据基础设施是促进数据可信流通、激活数据要素价值潜能的关键。国家数据局成立后,提出围绕网络设施、算力设施、数据流通设施、数据安全设施四大方面,以及数据汇聚、处理、流通、应用、运营、安全保障六大能力,推进数据基础设施建设。
当前,数据基础设施的概念范畴、架构体系、关键技术、标准规范等仍然属于开放性研究问题,学术界和产业界尚未形成一致公认的意见,围绕数据基础设施的研究仍在不断推进。构建科学合理的数据基础设施、概念框架和技术体系,对于激活数据要素价值、促进做强做优做大我国数字经济具有重要的理论研究和实践应用价值。
从三元空间的视角认识数据基础设施
当前,人类经济社会运行面对的是由实体物理空间(由原子构成)、人类社会空间(由人构成)和信息网络空间(由0和1的数据比特构成)组成的三元空间。由0和1构成的数据要素特征规律和原子的特征规律完全不同,数据具有非消耗性、可共享性、自增值性。数据资产可无限循环利用、价值可持续;数据越共享,价值越大,数据要素越挖掘,价值越大,并且复制数据几乎没有成本。基于这些特性,面向传统基础设施的规律方法无法解决今天数据要素面临的问题。笔者认为,对于数据要素的基础研究,应创建新的理论、构建新的路径、形成新的能力,由传统二元空间向三元空间升维,构建既适应原子空间运行规律又符合信息网络空间运行规律的新的数据基础设施架构体系。
从本质上讲,数据基础设施是用来规制信息网络空间中由0和1构成的数据要素运行秩序、运行效率、运行安全的基础设施。
第一,数据基础设施规范信息网络空间的数据运行秩序。数据的非法采集、不当共享、违规流动等不仅会引发信息网络空间的失序风险,也会联动带来实体物理空间的失序风险。正如车辆在交通基础设施上运行需要遵循行车规范一样,数据基础设施也需要为在其上运行的数据提供规则规范体系以确保数据有序运行。例如,数据库解决的是数据存储秩序化问题,数据传输协议解决的是数据流动秩序化问题。数据运行秩序强调数据汇聚、处理、流通、应用、运营、安全的全流程合法合规合理性。
第二,数据基础设施提升信息网络空间的数据运行效率。只有打破数据壁垒,使数据像水一样自由流动起来,才能最大化释放数据价值。然而,数据孤岛问题积重难返,制约了数据高效流通。数据基础设施要以“可信互通”为重点,促进跨行业、跨地域数据资源及数据要素流通平台的互联互通,实现跨云、跨网、跨链、跨地域、跨机构的数据互联互操作,支撑业务流、数据流、资金流的有效监管,促进跨行业、跨地域、跨场内外的数据要素流通交易,提升数据运行效率。
第三,数据基础设施保障信息网络空间的数据运行安全。随着技术的发展和业态的创新,数据泄露、虚假信息、算法歧视等数据安全新问题也不断涌现,技术内生风险和系统衍生风险交织叠加。数据基础设施须围绕数据来源、数据产权、数据质量、数据使用等数据运行全过程,通过区块链、隐私计算等技术手段,有效解决互联网基础设施数据安全管控薄弱的问题,帮助各参与方建立数据安全保障体系,确保数据全生命周期的可信性、完整性和安全性。
数据基础设施的功能定位和架构特征
功能定位
作为新型的生产资料,数据具有不同于其他生产要素的特性,比如可以无限复制和无限使用,造成数据流通价值失效。因此,数据基础设施的重要功能是支撑实现数据要素的“三性”,即数据要素的个体可辨识性、用途可跟踪性和价值可衡量性,建立可信体系,以解决数据要素流通面临的确权难、定价难、流通难、监管难等一系列问题。
支撑实现数据要素的个体可辨识性。给数据打上时空标签,通过数据的时间和空间元信息,将同样内容的数据集标识为不同的数据集个体,可以解决数据要素流通中数据集可以被无限复制而难于识别管理的难题。
支撑实现数据要素的用途可跟踪性。对数据要素流通的全过程进行跟踪,将数据流转使用过程可靠可信地记录下来,通过区块链等技术手段确保记录不可篡改,为相关主体维护合法权益和相关机构开展监管提供有力支持。
支撑实现数据要素的价值可衡量性。通过新技术和新机制为数据要素价值的衡量提供工具和动力,支撑构建合规有效的开放数据要素市场,利益相关方可根据数据要素的用途、历史定价、交易次数等获得公正的收益,促进数据价值在数据价值链中不同主体之间的合理分配。
架构特征
当前互联网正面临新的转型。在互联网出现早期,互联和共享是其核心理念,每个人都可以分享自己的信息,而这些信息也可以被其他人访问和使用。而后,在技术和商业因素的共同作用下,互联网上的数据逐渐存储于大型公司的后台数据库,“集中式”“私有化”成为主流。如今,互联网发展到Web 3.0阶段,一种新的IT系统和应用程序的构建方式应运而生,相对于当前主流的由单个实体或公司控制后台的私有IT系统,新IT系统处于公共环境中,由多个具有同等权利的用户共同管理和控制,因此也可以称之为“公共IT系统”。
在“公共IT系统”这种构建方式下,多个用户可以在同等的数据权利下共同管理和控制IT系统和应用程序,不会出现数据垄断的情况,更加公开、透明、开放。未来互联网的格局会呈现“私有”和“公共”并存的趋势,部分数据存储和处理过程部署在私有化环境中,还有部分数据存储和处理过程部署在公共环境中,这就要求数据基础设施的架构要适配集中式和分布式并存的互联网格局,在这种架构特征下,传统的数据存储设备、传输设备等都将发生架构演变。
数据基础设施的建设路径
围绕数据基础设施概念内涵分层级建设。根据数据基础设施提供的能力和功能,可将数据基础设施分为核心层、外围层和联动层。核心层是实现数据要素价值的直接力量和关键设施,例如,存储数据的数据库、处理数据的处理器等。外围层是对实现数据要素价值起支撑作用的设施,比如传输数据的网络等。联动层是将实体物理空间、人类社会空间和信息网络空间进行映射的设施,例如,采集数据的感知设备等。
加快打造技术支撑的数据可信流通体系。在构建以国内大循环为主体、国内国际双循环相互促进的新发展格局背景下,区块链、隐私计算等技术作为全球的通用技术和应用范式,能够有效支撑数据要素“三性”的实现,为数据要素价值化提供基础支撑能力,是构建数据基础设施的基础性、核心性技术。要探索以区块链、隐私计算底层技术为支撑的数据基础设施,建立全球性的数据基础设施平台和联通管道,通过优化履约机制构建数据空间可信管控能力,打造数据来源可确认、使用范围可界定、流通过程可追溯、安全风险可防范的数据可信流通体系。
统筹建设安全可信的区块链公用基础设施。以政府引导、多元主体参与的模式,构建开放兼容、跨链互用、安全可信、公共普惠的区块链公用基础设施体系,改变传统由单一机构提供区块链节点服务的管理模式。基于以多机构联盟模式为基础的区块链服务网络(BSN),推动区块链技术向平台化、组件化和集成化方向演进,提供强大的区块链底层构建能力,支持多节点授权入网、多系统动态互联,配置智能合约、通证与交易、隐私保护、数字身份等基础商业化应用工具,为构建适应数据要素特征、促进数据流通利用、发挥数据价值效用的数据基础设施提供有效支撑。
推动构建公私域结合的数据运行基础环境。一方面,面向当前的私域环境,持续开展区块链、隐私计算等技术推广应用和迭代更新,提升数据运行的安全性和稳定性。与此同时,推进企业、行业、城市、个人、跨境可信数据空间建设运营,提升可信数据空间的跨主体互认、跨空间资源共享和服务共用能力。另一方面,通过技术和应用模式创新,推动构建公共IT系统所需的基础分布式云环境,为公域环境所需的操作系统、通信协议、数据库、开发工具和公共应用的创建提供底层公用基础设施,推进分布式系统向可信网络和可信系统方向不断演进,从而加速元宇宙、Web3.0等数智化发展进程。
致谢:本文受到国家社会科学基金重大项目“智慧城市智能数据治理创新机制研究”(项目号:22&ZD153)资助。
单志广
CCF监事、杰出会员、信息系统专委会执行委员。国家信息中心信息化和产业发展部主任、智慧城市发展研究中心主任。主要研究方向为计算机网络、智慧城市、区块链、数字经济。
王丹丹
国家信息中心信息化和产业发展部工程师。主要研究方向为云计算、智慧城市、区块链、人工智能。
张延强
国家信息中心信息化和产业发展部未来产业(区块链技术与应用)处副处长。主要研究方向为智慧城市、区块链、人工智能。[email protected]
点击“阅读原文”,加入CCF。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...