为了深入了解和把握数据智能领域最新技术与应用趋势,共商数据与智能融合之道,2025年6月18-19日,由中国通信标准化协会主办,中国信息通信研究院、大数据技术标准推进委员会承办的“2025 数据智能大会”在京隆重召开。
19日上午,大会“下一代数据治理”分论坛特设置圆桌研讨环节,由中国信息通信研究院云计算与大数据研究所大数据与智能化部主任姜春宇主持,南方电网公司数字化部数据管理高级经理陈彬、中国移动集团首席专家、信息技术中心大数据首席架构师尚晶、中软国际AIGC研究院数据智能研究负责人符山齐聚一堂,以“破界·重塑:下一代数据治理的范式革命”为主题,围绕数据治理在 AI 时代的范式变革、技术创新及实践路径展开深度探讨,为行业发展提供前瞻性思考。
Q1:“下一代”数据治理主要有哪些发展方向?目前企业开展了哪些实践?
一是治理对象革新。数据治理从信息化时代的结构化数据,向数字化、智能化时代的多模态数据扩展,如无人机巡线数据等,因此治理方法需适配数据形态变化。二是治理技术革新。相较于传统治理手段,AI技术可提升数据治理效率,改变传统数据治理“苦活累活”“价值难显性”的属性,是下一代治理的重点方向。三是价值化转型。原先数据治理围绕业务目标开展,现在数据作为生产要素,需在治理过程中引入资产化管理要求,如价值评估、权属配置等,突破传统业务支撑的局限。四是安全范式转变。数据安全是为流通保驾护航的,将从原先网络安全的“攻防对抗”转向“保障流通安全合规”,因此后续需要重点关注数据安全与流通效率的平衡。
南方电网去年年底发布了央企首份“数据要素发展规划”,构建“供得出、流得动、用得好”的蓝图;并成立了数据公司,整合内外部数据治理与生态运营;同时推进人工智能平台发展与智能化升级,夯实技术基础,为进入下一代数据治理时代做好准备。
中国移动构建了自己的一套“道、法、术、器”治理体系,随着数据治理的发展,我们也在进行扩展演进。“道”是战略和目标。我们将从企业内部数据治理,向数智化、多模态数据治理及外部数据治理延伸;“法”是制度。企业需新增数据资产管理、资产评估入表等制度,以应对合成数据治理,标注合成数据,但同时也存在人类不可见信息影响AI价值观、与物理世界逻辑冲突等新课题;“术”是方法和流程。我们内部要相应建立外部数据、合成数据、多模态数据的管理流程;“器”是工具。借助AI大模型替代人工经验,提升治理效率,比如元数据关联、规则自动提炼等。
一是底层逻辑认知。数据治理底层是管理问题,也需将数据治理本身视为“业务”,我们是要“用数据治理手段去提升数据治理”。二是技术趋势演进。AI赋能需结合元数据驱动、Data Fabric,另外AI落地是人和技术的结合、有赖于持续运营,需要DataOps、AgentOps这些技术框架和平台工具,我期待数据治理的技术在AI加持下能有根本变化,改变人力的高度依赖、消耗和瓶颈问题。三是数据治理人员能力需转型。传统技能如ETL的重要性下降,未来需聚焦人机协同工作,创造“数据治理数字人”。四是行业实践扩展。中软国际是跨行业数据治理的先行者,从金融到钢铁、铁路、制造等行业,现在基于全栈 AI 技术平台赋能AI落地“最后一公里”;除了服务客户,也做自己的数据治理、并基于此在管理和业务中落地大模型应用,自己造降落伞,自己先跳。
Q2:AI 时代数据是否更重要?AI 如何赋能数据治理?
数据与AI的关系是二者相互促进、螺旋式上升的。人工智能的发展离不开高质量数据集,高质量数据集离不开高质量的数据治理。
AI赋能数据治理我个人认为存在三个阶段:第一,零碎场景化应用。在数据治理的若干环节里挑选三个明显特征:劳动量大且重复、能够规整成明确规则的、投入大量人力的。以上三个特征场景都可以用AI手段加持,提升效率。目前南方电网就处在这个阶段,开展了相关实践,如元数据智能发现、数据目录自动生成、质量规则调优等。第二,集中式流程化应用。AI可以处理一些计划性的工作,通过智能体组合实现计划调度,如质量报告生成等;第三,全量自主化阶段。这一阶段AI将承担治理计划的制定与执行,人类则聚焦创新性的顶层设计与效果验证。
大数据发展最开始是技术发展,使海量数据处理成为可能。AI时代我们可以纳入更多数据源、可以处理更多数据,但同样面临多元异构数据、衍生数据激增等问题。AI 时代数据治理挑战加剧,但AI正是突破治理瓶颈的关键工具。
AI 赋能数据治理包括以下路径:第一,元数据管理。以前虽然可以从数据里面,脚本里面做自动化的元数据解析,形成技术元数据,但技术元数据、业务元数据和管理元数据的关联很多时候是靠人力。AI时代,大模型可以自动关联技术元数据与业务元数据,替代人工映射。第二,规则提炼。数据治理的规则,一定程度上是靠人的经验沉淀的。现在则可以从专家经验中训练模型,自动发现隐性治理规则,实现自动化、前置化治理。第三,数据开发。AI驱动脚本生成与数据采集,结合元数据构建端到端质量体系,提升生产力。
AI赋能数据治理最大的问题是底层的数据挑战,简而言之就是训练智能治理的大模型,相关数据哪里来。数据治理高度非标,不同企业基础差异大,AI赋能需先解决数据获取与标准化问题,比如如隐性知识显性化。AI赋能数据治理是一个漫长的过程。AI 赋能数据治理本质也是自动化和效率提升,在业务梳理、Data Pipeline构建、数据字典的构建和查询等关键环节都已经有了很多实践。也可以借鉴业务应用智能化方面的一些经验,如在数据进入系统时,通过智能体自动化的实现数据的语义化,为Data Fabric打下比较好的基础,并且在AI技术的加持续,未来结构化与非结构化数据界限可能也会变模糊,反向改变数据治理的底层方法论。最后,AI 赋能可能使部分技术岗位的重要性下降,数据治理人员角色将变化,虽然传统编码等技能重要性降低,但对业务以及数据治理本身的理解与把控仍然重要。
Q3:请分享如何说服公司对数据治理持续投入资源?
要推动公司持续投入数据治理,核心是要回答“为何投入”的问题。我认为需要双管齐下。一是认知层面要自上而下构建起数据治理的战略共识。将数据治理纳入企业战略,统一内部对数据治理的基础定位,由高层挂帅统筹,让业务人员广泛参与进来,将数据治理相关指标纳入部门考核,完成责任落地,形成“一把手工程”的推动力。二是实施层面以业务价值反向促进数据治理投入。建立数据治理与业务增长的强关联关系,真正理解业务需求和痛点,深度挖掘业数融合的应用场景,通过数据治理帮助业务部门降低业务运行成本、缩短业务响应周期、提高业务决策精度、扩大业务用户范围等,让业务部门切实体会到数据的价值,从而主动追加投入,形成可持续的良性循环。
总之,数据治理是一项基础性工作,公司只有在看到并得到数据带来的好处,才能发自内心的愿意持续投入,实现数据的“长治久安”。
中国移动数据治理工作伴随系统建设的全过程,因此目前公司在该工作的资源投入上是非常重视的。回顾二十年发展的过程,主要有几个方面需要注意:首先是公司领导的重视,要与领导层在“数据治理工作是基础性、长期投入的工作”上取得共识。其次是与业务部门、财务部门的密切合作,以需求牵引拉动数据治理工作向纵深扩展。第三是要有专职人员,不仅在数据管理部门配备相应的人员,还要在业务部门、数据源头管理部门配备专职人员,才能保证贯穿公司运营的数据流始终畅通的流转。最后,数据还是要用起来,要共享,让公司有需求的人员能得到数据的支持,才能形成“我为数据,数据为我”的良性循环和数据参与感和获得感,进而使数据治理工作更加顺畅。
讲明白数据治理持续投入的合理性一直以来的确是数据治理工作最有挑战的命题之一,数据治理的抽象性以及治理工作和应用的脱节都是重要的原因。目前大模型技术发展和AI落地大潮实际上为数据治理责任部门的内部叙事带了重大契机。由于AI的战略重要性已经成为企业高管的共识,数据治理工作的负责人应该搭上大模型AI这班车,从Data4AI的角度合理“蹭热点”:基于大模型技术的AI落地、应用的低幻觉和可用性基础就是高质量数据,也需要合规安全手段保障,这些都是数据治理的核心工作内容。换句话讲,AI时代,数据治理更成为企业级数字化基础设施的一部分,应该和云、操作系统和网络一样,构建以数据治理为基础的数据基础设施。
当然,将数据治理本身视为一项“业务”的理念在任何时代都是基础和应该坚持的“论点”。正如任何业务部门都需要持续投资才能实现增长和效率提升一样,数据治理也同样如此,需要改变企业管理层将数据治理视为辅助工作的认知,通过内部沟通和重要事件设计等方式不断提升数据治理的地位,最终“重塑身份”。数据治理从成本中心转变为业务价值的推动者和收入创造者这一目标可能还过于激进,但的确需要花一定的精力考虑如何展示数据治理直接有助于改进决策、降低运营成本、提升客户体验及新产品开发创新,这样持续投资的合理性就变得更容易被接受。
为指导各类机构适应数据资产全过程管理发展新要求,中国信通院牵头联合中移信息、中国联通、上海国家会计学院等六十余家企事业单位开展《数据资产管理能力要求》标准编制工作。现《数据资产管理能力要求》标准试点验证和辅导报名工作火热进行中,欢迎垂询!
《数据资产管理能力要求》标准试点联系人:
艾老师 15910352198
中国通信标准化协会大数据技术标准推进委员会(CCSA TC601,简称:数标委/BDC),旨在凝聚产业链各个环节,识别和解决大数据发展面临的重大问题,开展大数据技术、数据资产管理、数据共享与流通、数据安全等共性基础标准研究,以标准推进工作为纽带,推动大数据与实体经济深度融合。欢迎加入我们的行列!
入会咨询:白老师 13520285502
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...