2022年01月12日,国务院发布了“十四五”数字经济发展规划,充分强调了数据的价值和意义。伴随数据价值化的推进,很多数据安全技术被运用到了数据流通过程中,比如联邦学习、同态加密、差分计算、中介计算等等,这些技术早已发展多年,落地的案例也不少。
然而,我国的数据流通现状并不乐观,一方面国外没有成熟的经验可以借鉴;另一方面缺少数据流通政策的实施细则;还有一个原因就是数据规模化安全流通还面临一些实质性技术问题待解决。
数据想要大规模流通,首先要能大面积互通,大面积互通则需要解决大面积数据统一寻址、隐私存储、便利使用、可控流通、留痕回溯等问题!
1
统一寻址和监管问题
如果数据流通想要形成大市场,要解决的首要问题就是统一寻址和监管问题,只有寻址统一,数据才可能像互联网上的信息一样,形成四通八达的流转态势;而且有了统一的“数据账本”,监管也自然容易很多。在多方共管的思维框架下,其中“一方”要扮演一个很重要的角色,就是:可实现数据要素的统一命名、统一标签和统一寻址,实现了这三个统一,也就能实现互联网或行业网的数据可流转、可控制和可监管,成规模数据的价值化也将有可能因此掀开全新篇章。
2
隐私安全问题
当我们知道了数据名称、类型和位置信息以后,第二个需要解决的问题就是数据存储的隐私安全问题,在电影哈利波特的故事情节中,伏地魔为了实现永生,将自己的灵魂分成7份,分别附着在6个不同地方的物体上,同时,伏地魔自己还守护一份,理论上,这样的安全系数已经非常高了!
在现实生活中,如果一套数据被分成7份,并放在不同的存储方手中,同时“自己”还保管一份,只有“使用方”通过了“多方和自己”的共同授权,才可以读取数据,试想一下,这样的安全性是不是都堪比“碟中谍”的绝密数据了!但如果分那么多份,丢失数据的风险也会大大增加,当然我们可以少分几份或冗余存储(这是后话,不再展开讨论)。
同理,数据的存储是不是也可以采用这种基于零知技术的多方隐私存储和隐私计算架构?零知就是让“存储方/计算方”什么都不知道,实现原理是:“数据所有方”将数据碎片化加密后,分别存放在多个独立的“数据存储方/计算方”,甚至“数据所有方”自己也保管一份碎片密文,这样数据的隐私性和可控性是不是就会高很多?而且数据确权的难题也将迎刃而解(因为缺少数据所有方的这份,其他任何方的数据都不好使),如果未来每个组织、每个机构、每个单位或个人,都能有“多方和自己”共同守护数据资产,谁还能轻易拿走我们的数据呢?
数据一旦可控和可授权,就可能会激活一个不可估量的海量数据流通市场!大量的个人和企业数据也因此可以进入合法渠道流通和销售,这将会产生超乎想象的价值!个人可以自主销售自己的隐私数据用于医学科研或其他领域,企业可以提炼自己的数据给更广泛的消费方,政府也可以开放海量的数据用于社会建设!
当然,密文存储解决了,隐私安全的另一个问题就是:密钥该如何保存?其实,在多方共管的模式下,这个问题非常好解决,一种方式是数据所有者找个安全的地方保管密钥;另一种方式是找个可信的第三方保管密钥;当然还可以把密钥也分成多份,分别发送至不同的存储方保管。无论用哪一种方式,密文和密钥分离存储是较好的选择。
3
便利使用问题
第三个需要解决的问题是数据使用便利性与安全问题,数据是一种极易被“零成本”复制的资产,一套价值数百万,甚至无法用金钱衡量的数据,可能很轻易地就被某些心怀不轨者或不法之徒拷走,小则给个人或组织造成影响,大则危及国家安全!
目前业界流行的虚拟数据沙箱技术,正是解决这类问题的有效手段。
用虚拟沙箱方式处理数据,首先,可以快速对接应用、数据库、大数据、人工智能等业务系统;其次,“数据所有方”可通过沙箱将数据导入,然后碎化加密并分存到前面说的“多个数据共管方”,确保“多方不可见”;再次,“数据使用方/消费方”从“多方”获取密文密钥后,只能在沙箱内存中按需解密,也就是数据不落地,而“使用方”在计算出结果后,也只能回存到沙箱对应的“多个共管方”。
综合来讲,虚拟沙箱的作用就是透明化对接业务系统、获取多方数据、对密文进行加解密操作、对数据防泄露和进行读写边界控制,这样既能实现获取数据的便利性,又能保障数据的安全性!
4
可控流通问题
第四个问题就是数据的可控流通问题,数据既要能流转到“使用方/消费方”手中,又要合规、可授权和可控制,这也是数据使用过程中的一个老大难问题!数据流好比水流,江河中有水,田地间有水,生活中还有自来水,如果这些水想怎么流就怎么流,就会给我们生活造成不便的影响,甚至会危及生命安全。现实中,这些水大多数情况都在按照规划的方式有序流动。数据流转是不是也可以借鉴我们的治水经验呢?数据流转要“分类”,要“引流”,要有“水库”,有“闸门”,要有“河道和管道”,也要遵循“路归路,桥归桥”的原则,还要能按需供给和按量计费。
数据流如果可被治理,有了方向、有了规矩,不再四处乱“跑”,既可“放”,又可“管”,数据流动的可控问题就会简单很多。比如:在零知技术体系中的前端沙箱数据流转,数据流转要设定用户权限和其他规则,数据不能无序流转;后端的数据流转在基于零知技术的多方共管模式下可遵循:密文方只能向对等的密文方流转,密钥方也只向对等的密钥方流转,但决不能将所有碎片密文和密钥交叉流转或流向同一方。这样,一套规范的前后端数据定向流转系统就形成了。
5
留痕回溯问题
第五个问题是数据留痕和回溯问题,如果一些重要数据或交易数据被恶意修改或删除,以及出现法律纠纷时,“存储方”能将数据所有的变化情况记录下来(类似于GIT的版本记录功能),数据便可以回溯到发生改变之前的任意时间点“一探究竟”。这样将会给数据流转的“所有方”和“使用方”避免很多法律风险并降低举证难度,同时还能增加数据资产健壮性。在多方共管模式下,“密文或密钥存储方”都应该具备全量的密文密钥版本记录功能,并具有多方同步回溯功能,这样就可以实现多方隐私数据历史查询和数据恢复了。
结 语
通过对以上几点问题的分析,不难发现,采用基于零知技术的“多方共管”模式就是:通过统一寻址技术解决供需双方对大规模数据进行查找和监管问题;通过多方隐私存储和隐私计算技术解决安全存储、计算、确权、授权和控制问题;通过虚拟碎片化沙箱技术解决与业务系统的透明对接、数据碎化加密、数据不落地以及数据泄露问题;通过前后端数据定向流转技术解决数据合规流动问题;通过多方版本回溯技术解决隐私数据事后追溯和恢复问题。
基于以上思维和技术架构,使用多方共管思维及一系列相关技术,是可以构建一套安全、开放、易用、灵活、可控、可管的数据规模化流通环境!无论是大数据、人工智能、物联网、云计算、区块链等场景,还是数据计算、数据交易、数据监管,都能做到数据在多方可控和多方监管下快速流通和使用。任何组织和个人都可借此拥有对数据所有权的“抓手”,并且有了可以信赖的“多个数据共管方”,相信这样的数据安全系统也一定会对数据的规模化流通产生积极而深远的影响。
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...