在国家“十四五”规划中明确指出要发挥数字经济的优势,发掘海量数据中所蕴藏的巨大价值,同时党的十九大和十九届历次全会精神也指出,要立足新的发展阶段和格局,以数据为关键要素,以数字技术与实体经济深度融合为主线,加强数字基础设施建设,通过实体经济和数字技术的融合,将数字经济应用到更丰富的场景。
在金融数据要素流通领域存在下述痛点,一是多头采购,全行共享困难。企业不同业务部门基于各自的业务引入外部数据,缺乏企业层面统一的规划,造成企业内重复采购或无法共享,成本高、管理难;二是多头接入,数字治理成本高。外部数据接入方式和数据本身各异,由各个业务系统单独对接从整体上会增加企业IT负担,数字治理成本高;三是无统一标准,安全合规风险大。缺乏统一的数据接入也会造成对于数据安全标准的不一致,使得外部数据接入存在安全合规隐患,风险大;四是数据分散,缺少价值深挖。多头接入的外部数据通常沉淀于各个业务系统,银行业外部数据分散独立,标准不统一,难以深挖数据价值。五是缺少数据“双循环”流通模式,内外部数据融合困难。银行业应抢抓先机,率先引入市场化机制,充分融合内外部数据,实现市场化数字资产智能应用供给和优化;六是缺乏相互信任,权益难保障。一次数据流通涉及所有者、使用者、传输者等多方主体,所有者如何确定数据的所有权、使用者如何防范获得假数据、各方如何保障数据流通时自己权益的计量公平与合理,诸多问题成为数据流通的拦路虎。七是数据安全和隐私保护隐患重重。数据安全强调数据全生命周期内的安全,尤其是涉及秘密和隐私数据失控蕴含极大风险,进一步阻碍了各流通参与主体的意愿。
在此背景下,工商银行企业级数据要素流通全链路建设项目立足围绕“引、建、管、用、治、通”六个阶段建立企业级数据要素流通体系,实现工商银行全域共享、业数融合的智慧赋能。其具备了规模化外部数据汇聚能力,利用大数据、人工智能技术的创新实践,也是工行率先在全球金融同业中自主研发的“数据多元、能力触达、服务丰富、全链应用,内外循环”的数据要素流通新基建。技术方面,通过数据“低代码+零代码”的模式,提供数据服务全的接入能力,同时,利用区块链、隐私计算等新技术高效满足全领域用数赋智创新需要。业务方面,赋能全行全业务领域多个业务场景,实现运营、风险、产品创新等领域的大规模数字化建设,在获客增收、风险防控、效率提升、生态建设等方面成效显著。
方案背景
近年来,数字经济发展速度之快、辐射范围之广、影响程度之前所未有,正在成为重组全球要素资源、重塑全球经济结构、改变全球竞争格局的关键力量。在国家“十四五”规划中明确指出要发挥数字经济的优势,发掘海量数据中所蕴藏的巨大价值,同时党的十九大和十九届历次全会精神也指出,要立足新的发展阶段和格局,以数据为关键要素,以数字技术与实体经济深度融合为主线,加强数字基础设施建设,通过实体经济和数字技术的融合,将数字经济应用到更丰富的场景。
数据要素本身具有其独特性、非竞争性、非排他性、非稀缺性、非耗竭性,并且具有自我繁衍性,数据可以通过不同视角加以探索和开发。金融行业数据要素流通建设处于探索阶段,这使得数据作为生产要素在金融行业涉及产权、流通、共享、定价、使用、获取、安全和隐私方面,无法因循既有制度体制,不能照抄其他数据要素市场机制,甚至难以借鉴其他要素市场的设置,从而造成在当前的数据要素市场上数据要素流通交易困难,数据的定价和收益分配无章可循。上述问题体现在金融数据要素流通,一是多头采购,全行共享困难。企业不同业务部门基于各自的业务引入外部数据,缺乏企业层面统一的规划,造成企业内重复采购或无法共享,成本高、管理难;二是多头接入,数字治理成本高。外部数据接入方式和数据本身各异,由各个业务系统单独对接从整体上会增加企业IT负担,数字治理成本高;三是无统一标准,安全合规风险大。缺乏统一的数据接入也会造成对于数据安全标准的不一致,使得外部数据接入存在安全合规隐患,风险大;四是数据分散,缺少价值深挖。多头接入的外部数据通常沉淀于各个业务系统,银行业外部数据分散独立,标准不统一,难以深挖数据价值。五是缺少数据“双循环”流通模式,内外部数据融合困难。银行业应抢抓先机,率先引入市场化机制,充分融合内外部数据,实现市场化数字资产智能应用供给和优化;六是缺乏相互信任,权益难保障。一次数据流通涉及所有者、使用者、传输者等多方主体,所有者如何确定数据的所有权、使用者如何防范获得假数据、各方如何保障数据流通时自己权益的计量公平与合理,诸多问题成为数据流通的拦路虎。七是数据安全和隐私保护隐患重重。数据安全强调数据全生命周期内的安全,尤其是涉及秘密和隐私数据失控蕴含极大风险,进一步阻碍了各流通参与主体的意愿。
方案目标
在此背景下,工商银行企业级数据要素流通全链路建设项目围绕“引、建、管、用、治、通”六个阶段建立企业级数据要素流通体系,实现工商银行全域共享、业数融合的智慧赋能。其具备了规模化外部数据汇聚能力,利用大数据、人工智能技术的创新实践,也是工行率先在全球金融同业中自主研发的“数据多元、能力触达、服务丰富、全链应用,内外循环”的数据要素流通新基建。技术方面,通过数据“低代码+零代码”的模式,提供数据服务全的接入能力,同时,利用区块链、隐私计算等新技术高效满足全领域用数赋智创新需要。业务方面,赋能全行全业务领域多个业务场景,实现运营、风险、产品创新等领域的大规模数字化建设,在获客增收、风险防控、效率提升、生态建设等方面成效显著。
方案特点
企业级数据要素流通全链路建设项目,涵盖了数据引入、资产建设、数据应用、数据流通的全生命周期,集成了区块链技术、隐私计算技术、人工智能技术以及数据安全技术,实现将数据要素流通全链路线上化管理。
外部数据引入方面,一是提供外部数据接入流程及标准,支持查询、核验等多种交互模式的参数化配置接入,外部数据接入平台建成后,联机接口接入耗时将缩短为30分钟/单接口,数据文件1人日/单文件,极大节省了外部数据接入70%的工作量,缩短了接入周期;二是提供灵活的数据查询模式,面向行内应用不同场景支持直查外部、查询缓存、最近N日缓存+外部接口混合查询三种模式,并支持配置化实时切换查询模式。目前已推广20余家一级分行, 应用于营销、授信审批、贷后管理、风险防控等多个场景。
数据流通方面,依托联邦学习、多方安全计算等隐私计算技术平台,以及区块链技术平台全栈数据要素流通技术,建设我行数据要素流通体系,涵盖数据产品上架到交付的全生命周期管理,支持构建数据要素流通“双循环”新格局。积极参与国家数据要素市场,加强数据要素高效供给,创新性实现我行数据交易平台与国家级数据交易所对接,引入上海数据交易所2000+数据产品,成为金融行业首家与国家级数据交易所互联互通的平台。同时通过数据沙箱提供可信计算环境,形成数据模型线上交付能力,为数据需求方提供安全可靠的交易保障。
方案业务流程图
实现功能展示
1、分布式技术框架
工商银行基于开放平台,使用各类分布式技术(包括分布式服务、分布式数据库、分布式缓存等),已建设成支持高容量、易扩展、边界研发及智能运维的企业级分布式技术支撑体系。企业级数据要素全链路建设平台采用全栈国产化技术,依托行内分布式技术体系,满足平台高可用、高扩展、高灵活性的需求,通过数据湖存储交易过程中产生的数据。
2、隐匿查询(PIR)
隐私查询技术的主要目的是发起方从被查询方的数据集中获取数据,并且在被查询方无法获取发起方具体的查询信息,也不知道最终查询了哪些具体的数据。对于隐匿查询,目标是查询方在获取查询结果的同时可以隐藏被查询对象关键词或ID信息,数据提供方提供匹配的查询结果却无法获知具体对应哪个查询对象。以工银金租数据流通项目为例,中国工商银行和工银金租分别部署联邦学习节点,在数据不出域前提下,利用隐匿查询,将工银金租反洗钱系统近千万客户信息和总行数据湖中千万级工商数据进行对接,通过部分字段对比,校验工银金租客户信息准确性。
3、数据确权
区块链分布式数字身份技术是一种去中心化的实体标识符(DID)及实体属性信息(数字凭证)验证技术,其利用区块链实现去中心化的公钥基础设施(DPKI),将公钥与DID关联在一起并在区块链节点存储和获取,从而实现属性凭证的生成和验证过程在不同机构间分离。在数据共享流通过程中,通过为数据流通参与主体签发与其身份匹配的DID,并由其通过数字身份私钥对流通数据进行签名,确认数据权益鉴别,实现数据流通环节的精准授权管控。数据所有权凭证能够为数据提供方提供数据所有主权,并且在数据交付环节鉴别其来源的可靠性,数据所有权凭证能够为数据使用方提供其数据使用权益,并在数据交换环节验证其使用数据的合法性。同时在链上使用DID进行数据流通参与主体的行文登记,能够实现链上公开的身份信息为匿名,保障参与主体的真实身份信息的隐私防护需求。
基于区块链的分布式数字身份技术,记录数据的所有权及使用权权益和用户身份的绑定关系,拥有数据所有权的数据提供方用户可以授权数据使用权给其他用户并完成数据上传交付,其他数据需求方用户基于使用权凭证获取数据的使用权,实现对数据来源的真实保障以及使用的细粒度权限控制。
4、数据鉴真和存证溯源
区块链是一种利用密码学保证访问安全、利用P2P通讯技术实现对等通信、利用共识机制实现记账合法性,利用链式结构按时间顺序存储数据的共同记账解决方案。其技术原理是,数据共享流通的参与各方运用一套共识算法,在机器之间建立“信任”,达成交易共识,以通过技术背书,而非中心化信用机构来进行信用创造。通过将流通数据的指纹信息、权属信息、流通交互信息按流通交互事件的事件顺序记录在链上,可以保障信息对参与各方公开透明、不可篡改,可追溯。同时将数据指纹而不是源数据披露在链上能够满足源数据不公开披露的需求,保障数据的隐私安全。
基于区块链存证的智能合约及分布式账本技术,由数据提供方用户将数据指纹上链,数据使用方用户在使用数据时先根据链上数据指纹对数据进行真实性核验,可保障数据传输过程中数据完整性可校验,通过数据指纹上链可同步满足用户无需在链上披露源数据的隐私防护需求。按数据产品维度将数据登记、授权、使用等全流程日志上链,保证数据流通过程的透明,可追溯。
5、数据供需撮合
大模型是指具有大规模参数和复杂计算结构的机器学习模型。这些模型通常由深度神经网络构建而成,拥有数十亿甚至数千亿个参数。大模型在各种领域都有广泛的应用,包括自然语言处理、计算机视觉、语音识别和推荐系统等。大模型通过训练海量数据来学习复杂的模式和特征,具有更强大的泛化能力,可以对未见过的数据做出准确的预测。
基于大模型的供需撮合,由数据需求方在需求大厅中提出用数需求,依托于大模型自然语言处理能力及知识抽取能力,将数据要素流通平台中的数据产品匹配推荐给数据需求方,实现数据在行内外的快速流通。
方案案例及效果
1、直接效益
在数据基础支撑战略层面上,建立“数据+智能+业务”三位一体的创新能力,助推工行战略转型发展,开启工行规模化推动数据要素业务应用、实现智慧赋能,为提升经营贡献开辟新的利润增长点、优化客户结构夯实客户基础、加强风险管理稳固经营基石等经营转型战略提供数据推动力。在营销拓户领域,分行A依托于政务等数据,构建农业识别模型、风险筛查模型、授信评分模型,对30万余农户进行主动授信,总授信额度超百亿元,提款客户近2万余户,提款余额超20亿;分行B依托于工商数据为全行员工提供线上实时核查企业信息服务,利用首批客户清单试点营销,单月资产增加百万以上客户超600户,总资产超近20亿元,获客成功率高达20%。在风险防控领域,依托于工商等数据,进一步推进信用风险、合规风险、交叉风险的数字化、自动化和智能化转型,避免客户损失超过千亿元。在生态共建领域,一是融合行内外数据要素,创新推出e企查等智能数据微应用,实现跨界、跨业的数字化、智能化联动,打造了无界融合、优势互补、开放共赢的金融生态圈。
积极参与国家级数据要素市场建设,创新性实现我行数据交易平台与国家级数据交易所对接,成为金融行业首家与国家级数据交易所互联互通的平台,大幅提升服务实体经济能力。工商银行数据要素流通全链路平台自2022年6月成立至今,已入驻企业30余家,上架400余项数据产品,撮合交易千万元。二是促进与数交所系统互联互通和创新数字金融服务方面持续合作,我行作为银行业唯一代表出席上数所2023全球数商大会,获评2023年度优秀数商(数据消费型)。
2、潜在效益
工商银行数据要素流通全链路平台通过汇聚金融领域大量数据产品,一是探索数据要素分配机制,促进数据价值高效释放。建设数据要素流通一站式能力,统一数据要素基础设施与完善的规则体系,实现了数据要素的市场化定价模式,促进高价值密度数据共享开放、合规使用。通过数据要素产品化,构建全域全场景产品体系;助力释放数据价值红利,通过数据要素赋能普惠金融、养老金融、数字金融、绿色金融、科技金融,实现数字经济与实体经济高效协同。二是助力数据共享共用,强化数据优质供给。基本解决了数据确权、安全等问题;推进行内外数据共享、开放的积极性,提高数据要素供给数量和质量。通过数据汇聚共享和开放开发,强化市场主体获取数据的公平性,降低获取门槛,打破数据要素垄断,增强数据要素共享性、普惠性,激励创新创业创造。三是保障数据安全合规开发,促进数据安全有序流动。提升数据安全保障能力与规范,确保在“原始数据不出域、数据可用不可见”的前提下进行开发利用、流通交易,让数据在一个安全可信的区域内来进行生产开发,实现全程的安全可控。四是培育多元数据要素产业生态,提升产业创新服务支撑水平。通过助力数据资源开发,实现内外部数据价值链各环节发展,促进数据经济发展。通过数据治理,大力发展数据分析、数据服务等产业培育数据要素流通和交易服务生态,引进第三方服务机构,促进数据产品估值、数据安全评级、数据合规审计等新业态服务发展。
3、不可替代性
在大数据时代,数据已经成为各行各业决策和优化的重要基础。数据流通过程中的权益保障机制、安全保护手段、基础设施建设是决定各流通参与主体意愿的决定性因素。工商银行数据要素流通全链路平台,整合的区块链技术、隐私计算技术、数据安全技术以及大模型技术,实现了数据要素流通全链路线上化管理,有效解决了数据流通过程中数据引入难、隐私保护难、权益确认难、追溯难等痛点,具有不可替代性。
4、成果亮点
(1)技术价值
工商银行数据要素流通全链路平台,整合区块链技术、隐私计算技术以及数据安全技术,实现了数据要素流通全链路线上化管理,在数据引入、采集、存储、分析、隐私保护等方面积累了成熟经验,有助于提高工商银行数字化水平和创新能力。
(2)社会价值
工商银行数据要素流通全链路平台,为数据的供需双方提供了高效的对接平台,降低了数据获取和处理成本,使得金融数据要素的价值得以更好的体现。同时,通过数据要素流通全链路平台的规范化管理,使得数据的合法性和真实性得到了保障,提高了数据的可信赖度和可用性,进一步提升了数据要素的价值,为金融、政务等多行业数据流通提供解决新思路。
(3)成果创新性
工商银行数据要素流通全链路平台涵盖数据产品上架到交付的全生命周期,整合区块链技术、隐私计算技术以及数据安全技术,实现将数据要素流通全链路线上化管理。
提供完善的管理功能:数据要素流通全链路平台提供数据产品引入、产品发布、产品使用、产品交易、智能合约功能等功能,让数据需求方和提供方可以方便地完成数据资源的发现、申请和使用,将上架、使用、交易、合同签署等所有环节上链存证,保证数据流通过程的透明,可追溯。
实现 “数据可用不可见”效果:联邦学习平台集成隐私查询、隐私求交、联邦特征工程、横向/纵向联邦学习、联邦数据质量和模型质量评估等功能,实现 “数据可用不可见”的效果。
交易“有迹可循”:通过区块链技术,实现数据权益鉴别、数据完整性核验、数据使用记录追溯等业务诉求,提供数据确权、数据鉴真及存证溯源服务,并对全流程交互信息进行可信存证监控,以支撑数据登记、数据交易、数据交付、使用审计等数据全生命周期流程的闭环。
方案未来展望
(一)加速外部数据引入,将全行外部数据统一纳管形成外部数据市场生态
统一管理的模式有利于厘清行内外部数据资产,充分挖掘外部数据价值、提升效益,以形成外部数据市场生态。其贯穿了外部数据引入、使用、评估、退出的全流程。数据引入做到数据需求统一受理与整合、预算统一管理与采购,严格把控供应商准入和数据准入,保障外部数据合规可用;数据使用做到数据使用服务化,按需共享,安全规范可管理;数据评估包括数据质量监控、服务评价、应用效果评估、供应商评价等,通过定期审计总结,提升外部数据统一管理能效;数据退出包括数据无缝切换、供应商黑名单管理,适时执行数据退出,促进更新迭代,提升数据资产质量和业务价值。
(二)加快公共数据开放利用,将其作为推动外部数据市场建设的突破口。
公共数据作为政府部门和公共企事业单位在履行公共职责或提供公共服务的过程中收集和产生的数据,便于通过公共数据开放利用和授权运营等模式,加快扩大其开放利用的规模。此外,加快推动公共数据开放利用也有助于完善数据交易基础规则体系,从而带动培育各类数据主体,活跃行内外部数据流通,成为推动外部数据市场建设的重要抓手和关键突破口。首先,优化公共数据开放基础设施建设,拓展公共数据开放服务能力,提高普惠性,降低接入使用公共数据的门槛和成本。其次,针对公共数据,建立跨部门跨行业的统一分类分级和技术应用标准,提高标准的通用性。
(三)积极孵化各类数据应用场景,发展开放多元的数据开发利用的流通和生态服务体系。
数据要素的价值实现依赖于高效的数据要素流通以及更为开放多元的数据开发利用的生态,外部数据市场体系构建应积极培育各类数据要素市场主体,促进数据产品和服务的供给与创新,形成更为丰富多元的开发利用生态。具体包括:结合重点领域和场景,引导鼓励具有技术优势的总分行基于具体场景开发高质量数据产品和服务;鼓励探索多样化的外部数据流通路径,提升数据需求的匹配度。
(四)加快隐私技术等数字技术创新与应用,保障外部数据全流程的安全流通。
隐私计算、可信数据空间与区块链等新兴数字技术是承载“数据密态时代”数据安全可控流转的重要工具。通过隐私计算等数字技术的应用,可以实现数据流通的“可用不可见,可算不可识,可控可计量”,有助于提升相关主体合规治理能力,让数据敢于流通、能够流通,促进数据的跨主体分享和安全利用。同时,需要加快相关统一技术标准的制定,推动安全可信的受控环境、密态数据以及数据使用权跨域管控等场景下相关技术应用的统一标准建立和完善。
点击“阅读原文”,申报金松奖!
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...