1.基础术语
1.1.分布式人工智能 distributed artificial intelligence人工智能系统实现的一种方式,其中数据与指令在一组以特定拓扑结构相互连接的节点之间传递和处理,以完成人工智能任务。注:节点连接拓扑一般包含去中心化结构、星形结构、环形结构、树形结构等
1.2.人工智能 artificial intelligence;AI学科人工智能系统(1.8)相关机制和应用的研究和开发。
1.3.人工智能服务器artificial intelligence server信息系统中能够为人工智能应用提供高效能计算处理能力的服务器注 1: 以通用服务器为基础,配备人工智能加速卡后,为人工智能应用提供专用计算加速能力的服务器,称人工智能兼容服务器。注2:专为人工智能加速计算设计,提供人工智能专用计算能力的服务器,称人工智能一体机服务器。1.4.人工智能集群 artificial intelligence cluster注1:人工智能计算功能单元可包含人工智能加速处理器、人工智能服务器、人工智能加速模组等注2:当由人工智能服务器组成时,人工智能集群可称为人工智能服务器集群,其中的人工智能服务器可称为节点。人工智能加速芯片 artificial intelligence accelerating chip具备适配人工智能算法的运算微架构,能够完成人工智能应用运算处理的集成电路元件。1.6.人工智能加速模组 artificial intelligence accelerating module
专为固定领域人工智能计算设计,部署在边缘计算场景中的扩展加速部件注:人工智能加速模组一般用于执行智能摄像机、机器人、无人机等设备的人工智能计算任务
1.7.人工智能设施包artificial intelligence portfolio
一种组成人工智能应用解决方案,帮助用户实现不同规模的业务逻辑的软硬件包。
注:典型的人工智能设施包包括人工智能加速处理器、云计算资源池、加速处理器算子库等。
1.8.人工智能系统 artificial intelligence system针对人类定义的给定目标,产生诸如内容、预测、推荐或决策等输出的一类工程系统。注1:该工程系统使用人工智能(1.2)相关的多种技术和方法,开发表征数据、知识、过程等的模型,用于执行任务。注2:人工智能系统具备不同的自动化级别。
1.9.异构资源池 heterogeneous resource pool一种将不同架构、不同实现方式的人工智能计算资源组织起来,自动按需满足不同计算需求的统调度软件集合。注 1: 异构资源池提供一种可伸缩计算架构,有利于合理分配计算资源,为不同运行环境(例如云、集群、移动设备物联网)的人工智能应用系统的开发和部署提供计算能力、存储、带宽和延时保障。注 2:人工智能计算资源包括中央处理单元(CPU)图形处理单元(GPU)、神经网络处理单元(NPU)、现场可编程逻辑门阵列(FPGA)、数字信号处理器(DSP)、专用集成电路(ASIC)等。2.关键通用技术相关术语
2.1.贝叶斯网络Bayesian network一种使用贝叶斯推理进行概率计算并表示为有向无环图的概率模型在训练过程中,能够同时使用标注数据和无标注数据进行训练的一种机器学习任务2.4.长短时记忆网络 long short-term memory network;LSTM network一种含有区块结构并能够对不定时间长度的数值形成记忆,决定输入的记忆及输出的循环神经网络。注:长短时记忆网络对处理长、短程相关性序列数据均具备良好性能。针对一批样本,重复地执行系列步骤直至完成训练的过程。
注:一个(训)期中的迭代数量等于该期中,训练样本的批数[来源:ISO/IEC 2382;2015,2121826,有修改]
2.6.分类模型classification model<机器学习>一种对给定输入数据,输出其所属的一个或多个类别的机器学习模型。<机器学习>创建的模型过于精确地拟合训练数据,对新数据缺乏泛化性。注1: 过拟合可能由以下原因造成:训练的模型从训练数据中学习了非必要的特征(例如,对有用输出无效的特征),训练数据中过多的噪声(例如,过多的离群点),训练数据与生产数据分布的显著不匹配,或模型复杂度过高而与训练数据不匹配。注 2:当在训练数据测量的误差与在独立的测试及验证数据测量的误差之间存在显著差异时,过拟合能被识别当训练数据和生产数据之间存在严重不匹配时,过拟合模型的性能尤其会受到影响。以给定数值为输入,预期的输出为连续变量的机器学习模型2.9.回归分析 regression analysis评价担责变量与预测变量关系模型的技术[来源:GB/T 3358.3-2009,3.3,有修改]2.10.机器学习machine learning通过计算技术优化模型参数的过程,使模型的行为反映数据或经验2.11.机器学习模型 machine learning model一种基于输人数据或信息生成推理或预测的计算结构。示例:如果一个单变量线性方程(y=0+)经由线性回归训练,则结果模型为 y=3+7x。注:一个机器学习模型是基于机器学习算法训练的结果2.12.机器学习算法 machine learning algorithm依据给定的准则,根据数据确定机器学习模型参数的算法。示例:考虑求解一个单变量线性函数其中y是输出或结果,x是输人,是截距(x=0时y的值),是权重。在机器学习中,确定线性函数的截距和权重的过程称为线性回归。2.13.卷积神经网络convolutional neural network:CNN深度卷积神经网络 deep convolutional neural network;DCNN2.14.连接权重connection weight一个系数,在它与其他输入值结合前,乘以人工神经元的输入值[来源:GB/T 5271.34-2006,34.03.02]
2.15.联邦机器学习 federated machine learning一种框架或系统能在不泄漏参与方所拥有的原始数据和隐私数据的同时,使多个参与方合作建立和使用机器学习模型且获得好的性能。2.16.逻辑推理logical inference利用符号、谓词、函数和量词等逻辑要素从给定的前提进行推理并得出结论。
2.17 模式识别pattern recognition
通过功能单元对某一对象物理或抽象的模式以及结构和配置的辨识[来源;GB/T 5271.28-2001,28.01.1373.2.18
利用训练数据,基于机器学习算法,确定或改进机器学习模型参数的过程和使用机器学习模型且获得好的性能3.2.16
2.19.模型优化 modeloptimization提升模型执行速度,泛化能力,或改善利益相关方所关心的其他特性的方法注:如神经网络模型优化的方式包含剪枝、量化、调整参数、调整模型深度和宽度、增减特征或根据硬件平台具体特性重新安排聚合算子等。2.20.批(量)训练batch training一种训练方法,仅在一个(训)期后,才调整连接权重来源:ISO/IEC 2382:2015,21206907来源:ISO/IEC 2382:2015.212410373.2.22由于训练数据不足或不充分导致创建的模型在面向新数据时性能表现不佳或不准确。注:欠拟合可能会发生的情况:特征选择不当、训练时间不足,或者因模型能力有限(如表现力)使模型过于简单而无法从大量训练数据中学习。2.23.迁移学习transfer learning一种将旨在解决一个问题的模型应用到不同问题上的方法。2.24.前馈神经网络 feed forward neural network;FFNN一种神经网络,其中信息仅单向从输入层传送到输出层3.2.252.25.强化学习reinforcement learning;RL一种通过与环境交互,学习最佳行动序列,使回报最大化的机器学习方法2.26.神经网络neural network; neural net;artificial neural network由一层或多层神经元组成的网络,通过权值可调的加权连接,接收输入数据并产生输出。注1:神经网络是连接主义Connectionism(仿生学派)方法的一个突出例子注2:虽然神经网络的设计最初是受生物神经元功能的启发,但大多数神经网络的研究不再遵循这种启发。深度神经网络学习 deep neural network learning通过训练具有许多隐层的神经网络来创建丰富层次表示的方法注:深度学习是机器学习的一个子集。2.28.生成式对抗网络generative adversarial network:GAN一种由单个或多个生成器网络和判别器网络组成的神经网络架构,两个神经网络用相互博弈的方式进行学习注:生成器依据真实样本创建具有代表性数据集的样本,判别器用来区分生成的样本与真实样本。注1:在人工智能领域中,一个前提是一个事实、一个规则、一个模型、一个特征或原始数据为提升人工智能模型的预测精确度,一种先以大型广泛领域数据集训练,再以小型专门领域数据集继续训练的附加训练技术2.32.无监督机器学习 unsupervised machine learning2.33.循环神经网络recurrent neural network:RNN一种神经网络,其中前一层和前一处理步骤的输出都被传送到当前层用于评估单个或多个候选机器学习模型性能的数据样本,注1:验证数据与测试数据是不重复的,通常也与训练数据不重复。但是,在没有足够的数据进行三种方式的训练、验证和测试集拆分的情况下,数据只被分成两个集一--一个测试集和一个训练或验证集。交叉验证或自助法是用于从训练或验证集中生成单独的训练和验证集的常用方法。注 2:验证数据用于调优超参数或验证某些算法选择,直至在专家系统中包含给定规则的效果2.36.隐马尔可夫模型 hidden Markov model;HMM一种如下信号模型:其中各信号段的状态都表示为马尔可夫过程的状态,且这些状态不能直接观察到。注1:马尔可夫过程是由一系列状态组成的随机过程,其中从一个状态转移到另一状态的概率,只依赖于这两个状态而与此前的各状态无关。注2:为识别某一进话,由系统去计算在训练期间导出的各模型所生成的似然性。该进话作为其模型给出最高似然分值的词或其他实体识别出来。来源:GB/T5271.29-2006,29.02.1172.37.有监督机器学习supervised machine learning3.2.词性标注 part-of-speech tagging根据单词的语法属性为其指定类别(如动词、名词、形容词)的任务3.3.对话管理 dialog management根据用户输人、对话历史和其他上下文知识,在对话中选择适当的下一步动作,以达到预期目标的任务3.4.关系抽取relationship extraction3.5.光学字符识别 optical character recognition;OCR3.6.机器翻译machine translation:MT使用计算机系统将文本或语音从一种自然语言自动翻译为另一种自然语言来源:IS0 17100:2015.2.2.273.7.命名实体识别 named entity recognition;NER识别并标注文本或语音流中单词序列的实体的指称名称及其类别的任务注 1:实体是指所关注的具体或抽象事物,包括事物之间的关联注 2:“命名实体”是指具有特定或唯一含义的指称名称的实体注 3:指称名称包括人员、位置、组织的特定名称,以及基于域或应用的其他专有名称3.8.情绪识别 emotion recognition通过计算识别和分类一段文本、语音、视频或图像以及它们的组合中表达情绪的任务。3.9.问答 question answering3.10.信息检索information retrieval根据关键字或自然语言查询从数据集中检索相关文档或文档部分的任务3.11.语义计算semantic computing旨在识别计算内容含义和理解用户意图并以机器可处理的形式表达它们的计算领域3.12.语义理解 semantic comprehension理解数据符号的语义信息,或在具体业务场景下的需求表达,并按照要求输出正确反馈结果的过程。[来源:GB/T36464.3-2018.3.673.3,13[来源:GB/T 23703.2-2010.4.10.有修改]3.14.自动摘要automatic summarization在保留重要语义信息的同时缩短自然语言内容或文本的任务3.15.自然语言理解 natural language understanding;NLU通过功能单元,从已传入其中的自然语言文本或语音中提取信息,并输出对给定文本或语音及其表示的描述3.16.自然语言处理natural language processing;NLP3.17.自然语言生成natural language generation;NLG尊重既定事实、社会规范和信仰,且不受偏祖或不公正歧视影响的对待、行为或结果注1:对公平性的考虑是与环境高度相关的,并且因文化、代际、地理和政治观点而异注。2:公平不等于没有偏见(4.10)。偏见并不总是导致不公平,不公平可能是由偏见以外的因素引起的。注1:依赖于语境或行业,也依赖于具体的产品或服务、数据以及所用技术,应用不同的可信赖特征并对其进行验证,以确保利益相关方的期望能得到满足。注2: 可信赖的特征包括可靠性、韧性、安全性(信息安全、功能安全),隐私性、可问责、透明性、真实性、质量、实用性等。注3:可信赖作为一种属性用于描述服务、产品、技术、数据和信息,在治理中也用于组织3.4.3(人工智能)系统以人能理解的方式,表达影响其(执行)结果的重要因素的能力注:可解释性理解为对“原因”的表达,而不是尝试以“实现必要的优势特性”做出争辩<人工智能>系统及其利益相关方对其行动决定和行为负责任的状态。注1:可问责与分配的责任有关。责任可能基于法规或协议,也可能通过委托的一部分进行指派。
注2:可问责涉及负责人或实体通过特定方法和依据特定条件,对其他人或实体的某些事物负责。
4.7.可预测性 predictability
<人工智能>满足利益相关方关于所提出输出做出可靠假设的性质。
4.8.伦理 ethics
<人工智能>开展人工智能技术基础研究和应用实践时遵循的道德规范或准则。
4.9.鲁棒性 robustness
<人工智能>系统在任何情况下都保持其性能水平的特性。
4.10偏见 bias
<人工智能可信赖>对待特定对象、人员或群体时,相较于其他实体出现系统性差别的特性注:对待指任何一种行动,包括感知、观察、表征,预测或决定。
4.11.韧性resilience
<人工智能>系统在事故后在符合期望的时间段内,恢复可操作条件的特性
4.12.透明性transparency
<人工智能>系统与利益相关方交流关于该系统适当信息的特性。注1:系统透明性相关的信息一般包含特性,性能,缺陷,组件,程序,度量,设计目标,设计选择和假设,数据源及标注协议。注2:对系统某些方面不适当的暴露一般会违背安全、隐私或保密要求。
还没有评论,来说两句吧...