文章最后更新时间2025年03月06日,若文章内容或图片失效,请留言反馈!
邮发代号 2-786
征订热线:010-82341063
2024年中央经济工作会议指出,开展“人工智能+”行动,以科技创新引领新质生产力发展。高质量数据集是通过系统性筛选、清洗、标注、增强合成、质量评估等环节形成的标准化数据产品,具有格式统一、质量可控、场景适配性强等特点,是驱动人工智能模型训练、科学研究、数据挖掘及检验检测的核心要素。工业是我国经济发展的核心支柱,同时也是保障国家战略安全的主阵地,加快开展工业领域高质量数据集建设,是支撑“人工智能+”在工业场景落地,推动人工智能赋能新型工业化,提高我国工业国际竞争力的新时代护城河。随着基础大模型性能的持续突破,高质量数据集建设已成为人工智能赋能新型工业化的重要抓手,成为工业企业降本增效、重塑企业竞争力的战略选择,亟需创新发展理念,推动工业数据从“规模红利”向“质量红利”和“数据红利”转变。一是转变发展思路,加快推动向以数据为中心转型。工业领域是人工智能应用的重要场景,全球都在加速布局。例如,NVIDIA推出了Omniverse平台,通过构建工业数字孪生数据引擎打造高质量数据集;西门子与微软联合推出了工业元宇宙计划,构建覆盖工业全生命周期的数据集。这些案例表明,以数据为中心的发展模式正成为工业人工智能的关键。通过深度挖掘场景需求,融合先进技术,构建高质量、生态化的数据集,能够有效提升工业智能水平。因此,我国应加快推动向以数据为中心转型,创新发展路径,以提升工业人工智能的核心竞争力。二是发挥双重优势,塑造高质量数据集建设新优势。我国作为全球工业大国,形成了世界上最为完整的工业体系,数据资源和应用场景极为丰富,开展工业高质量数据集的开发利用价值巨大。我国需充分发挥海量工业数据规模和工业场景多样性优势,聚焦研发设计、生产制造、运维服务、经营管理等关键环节,构建具有国际竞争力的差异化数据集体系,为我国在全球工业智能化浪潮中抢占先机、推动高质量数据集建设奠定良好基础。三是坚持场景牵引,打通高质量数据集构建新路径。场景是释放数据要素价值的前提,更是数据要素价值释放的核心载体。当前,多模态大模型、推理大模型、函数召回大模型等产品不断突破,正在重构“场景-数据-模型”的共生关系。以场景需求为锚点,将工业机理与数据要素深度融合,是破解模型精度不足、场景赋能不深、数据利用率低等问题的关键路径。创新是人工智能产业高质量发展的核心引擎,也是突破工业数据集建设瓶颈的关键抓手。围绕核心技术攻关、标准体系完善和创新载体打造三方面重点发力,为人工智能深度赋能新型工业化筑牢高质量数据集根基。一是加快核心技术攻关,突破工业数据集构建与融合应用瓶颈。以国际前沿人工智能需求为导向,开展工业领域高质量数据集的关键技术攻关,加强工业深度思维链数据集打造、多源异构数据融合决策、长尾场景样本合成、智能数据标注、数据集质量评估和提升等关键技术研发,加快研制先进自主可控的高质量数据集工具链,实现数据、模型、工具、系统和制造业场景等要素的融合,对于推进工业领域高质量数据集打造具有重要意义。例如,针对工业高价值长尾场景,要加快建立高精度工业数据合成技术体系,通过融合“生成式人工智能-工业第一性原理-工业仿真引擎”,三位一体合成稀缺工况数据,突破工业长尾场景数据瓶颈。二是加强标准体系完善,构建工业数据集质量与安全双轨标准。围绕高质量数据集全生命周期,结合工业企业业务实际,鼓励从质量评估、安全合规两方面协同推进工业数据集标准研制,覆盖数据集质量评估、数据集分层分类分级、数据集安全保障等工业领域数据集开发利用关键问题,开展工业领域数据集质量评估和提升行动,推动模型企业、数据企业和工业企业协同发展。三是加速打造创新载体,构建产学研用协同的数据集生态体系。支持工业企业联合模型企业、科研机构、高等院校等主体联合建立打造高水平创新载体,建设工业数据和模型技术“测试场”,以生产环境验证数据和模型技术方案。推动产学研用协同,培养具有工业背景的高水平数据人才,加快科技成果转化和应用落地,鼓励有条件的工业企业支持和参与开源生态建设,推动工业数据集开放共享。随着多模态大模型、推理大模型等技术突破,通过人工智能技术与产业关键环节的深度融合,工业数据集的开发已从单一数据标注向“机理融合、知识嵌入、动态迭代”的系统闭环方向演进,构建“原始数据-高质量数据集-智能应用”的闭环链路,为研发设计、生产制造、运维服务、经营管理等核心环节的智能化升级提供核心支撑。工业研发设计需融合产品结构参数、仿真实验数据、用户需求反馈等多源数据,构建覆盖全生命周期的设计优化数据集。例如在制造业图纸自动生成场景,需收集CAD图纸、CAE仿真结果、材料物性参数、用户使用日志等原始数据,通过标注关键设计节点、跨模态对齐仿真与实测数据,形成可训练生成式设计模型的高质量数据集。生产制造是工业的核心环节,该环节的智能化建模往往需整合设备传感数据、工艺参数、质检记录等大量工业时序数据,构建动态优化的智能制造数据集,该类数据集具有较强的敏感性和专用性。例如在设备预测性维护场景,需收集设备振动、温度、电流时序数据,工艺控制参数,视觉质检图像等原始数据,通过标注异常工况特征,建立工艺参数与产品质量的因果关联标签,支撑预测性维护与自适应控制模型训练。智能运维可实现设备故障的精准诊断、超前预测和高效修复等,需汇聚设备历史故障数据、环境变量、维修知识库,构建智能诊断与决策支持数据集。例如在工业设备智能运维场景,需汇聚工业设备运行日志、故障报警记录、维修工单文本、环境温湿度等原始数据,经过专业技术人员标注设备故障因果链条(例如转动设备故障因果链条:振动异常→轴承磨损→润滑失效),构建维修方案与备件库存的关联图谱,赋能形成工业设备智能运维场景应用。智能化经营管理可实现企业供应链协同、生产调度、人力资源管理、财务管理等多个子系统的贯通,需整合供应链、市场、财务数据,构建支持全局优化的决策智能数据集。例如在智能制造供应链场景,需汇聚供应商交付记录、库存周转数据、市场舆情文本、财务流水信息等原始数据资源,通过标注供应链风险特征,构建市场趋势与生产计划的动态匹配关系。工业高质量数据集是人工智能赋能新型工业化的战略基石,在当前国际人工智能激烈角逐的的背景下,我国亟需加快工业高质量数据集建设,为我国突破关键领域“卡脖子”困局、筑牢产业链安全根基,促进工业实现降本增效,抢占全球智能制造高地。分享网络安全知识 强化网络安全意识
欢迎关注《中国信息安全》杂志官方抖音号
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
ZhouSa.com
还没有评论,来说两句吧...