2023.10.23-2023.10.29
每周文章分享
标题: An Integrated Multitasking Intelligent Bearing Fault Diagnosis Scheme Based on Representation Learning Under Imbalanced Sample Condition
期刊: IEEE Transactions on Neural Networks and Learning Systems, 2023, doi: 10.1109/TNNLS.2022.3232147.
作者: Jiusi Zhang; Ke Zhang; Yiyao An; Hao Luo; Shen Yin.
分享人: 河海大学——张雨濛
研究背景
旋转机械系统是工业实践中的关键设备。轴承作为旋转机械系统中不可缺少的部件,对机器的健康运行起着至关重要的作用。表征学习作为学习算法的一个重要分支,可以将原始特征转换为机器可以处理的方式,具有很高的可靠性和可解释性。AE作为一种典型的表征学习方法,在轴承故障诊断中有着广泛的应用。尽管数据驱动方法在轴承故障诊断中有广泛的工业应用,但大多数数据驱动方法需要足够的标记故障数据来训练算法模型,这要求离线数据和在线数据之间的分布相同。同时,在实践中,用户对旋转机械系统中已知的轴承故障类型有足够的认识和维护策略。相反,应该注意,未知的轴承故障对没有事先通知就发生的旋转机械系统具有至关重要的后果。
关键技术
本文探索构建集成故障检测、故障分类和未知故障识别的多任务集成轴承智能故障诊断方案的可能性,以降低设计成本。此外,为了表示不平衡的样本状态,故障检测和未知故障识别任务都是无监督的。此外,在不平衡样本条件下,基于表示学习的集成方案完成了以下任务:1)在无监督条件下,集成方案无需任何标记故障数据即可实现轴承故障检测,从而获得了较高的旋检测精度。2)在故障少样本的情况下,集成方案包含轴承故障分类模块,分类性能好。3)在已知故障类型数据的基础上,方案实现无监督条件下的未知故障识别。在上述基础上,提出了一种基于表示学习的非平衡样本条件下多任务集成智能轴承故障诊断方案。
该方法的创新和贡献如下:
1)在无标记故障数据的情况下,提出了一种基于表示学习的MDAE-SAMB辅助轴承故障检测方法。
2)在故障少样本的情况下,提出了一种基于模型的用于检测任务中的分层无监督预训练MDAE-SAMB的轴承故障分类集成方案迁移学习方法。
3)在无监督条件下,该综合方案能够根据旋转机械中已知的故障数据识别出未知的轴承故障,这在现有工作中很少得到研究。
算法介绍
A.框架
本文提出的非平衡条件下基于表征学习的多任务集成智能轴承故障诊断方案框架如图所示,在基于MDAE-SAMB的无监督轴承故障检测中,任务一分为离线训练和在线检测,只使用处于健康状况的运行数据进行特征提取,并训练MDAE-SAMB网络。在线检测时,将实时运行数据经过特征提取后输入到网络中,可以根据样本重构误差检测故障。
图1 集成多任务智能轴承故障诊断方案框架
对于Task 2中基于迁移学习的是少样本轴承故障分类,借助分层无监督预训练过程,将Task 1中得到的MDAE-SAMB中从输入层到瓶颈层的部分转移到目标源。在此意义上,实现了轴承运行数据中特征表示的转换。此外,只使用少量样本(10%)进行训练,从而可以完成在线少样本故障分类。
对于无监督条件下的未知轴承故障识别,在Task 1故障检测的基础上,将MDAE-SAMB生成的已知故障类型的残差展开为残差增广矩阵,作为AE训练的输入。将在线运算生成的增广残差矩阵输入到训练好的AE中,根据任务3中的重构误差判断故障类型是否未知。
B.基于表征学习的MDAE-SAMB网络
传统的去噪AE (DAE)通过在输入层中加入噪声来提高网络的鲁棒性。受DAE的启发,提出的MDAE-SAMB有两个改进:
1)在瓶颈层神经元上叠加噪声信号,降低噪声的影响。
2)在瓶颈层神经元中引入自注意力机制,对相应的瓶颈层神经元赋予不同的权值。
MDAE-SAMB结构如图2所示。MDAESAMB由编码器、噪声引入、SAMB和解码器组成。
图2 MDAE-SAMB的结构
①编码器:构建输入特征向量xi与编码向量xe之间的映射关系:
②引入噪声:将噪声加到瓶颈层的输出:得到xc e:(v是高斯噪声)
③带瓶颈层的自注意力机制:通过自注意机制层可以得到各瓶颈层神经元之间的映射关系及其重要性,并通过softmax函数得到归一化显著度aj,由此得到自注意机制层的输出xs作为后续解码器的输入:
④解码器:是构造x与网络重构输出x i之间的映射关系,为了使输入和输出之间的差值最小,MDAE-SAMB的网络参数通过损失函数进行更新:
C.无监督条件下基于MDAE-SAMB的轴承故障诊断
通过从健康数据中提取的特征对MDAE-SAMB网络进行训练。网络在离线训练中学习的是健康数据中特征之间的耦合关系。因此,一旦将轴承故障数据输入到训练好的网络中,重构误差会更高。
当MDAE-SAMB的在线剩余输入大于阈值时,轴承在相应时间失效。反之,轴承是健康的。
D.基于迁移学习的少样本轴承故障分类
基于模型的迁移学习是为了实现模型参数的共享,将源任务上预训练得到的模型迁移到目标任务上,从而提升模型的性能。在此基础上,将健康数据和故障数据分别视为源域和目标域。通过分层无监督预训练方法,提出了一个基于迁移学习的MDAE-SAMB神经网络(TF-MDAE-SAMB-NN)用于故障分类。
迁移的模型包括MDAE-SAMB中通过离线训练得到的从输入层到瓶颈层的部分。也就是说,将集成方案中检测模块中的编码器、噪声引入、SAMB等部分作为预训练模型转移到故障分类中。TF-MDAE-SAMB-NN的结构如图3所示。
图3 TF-MDAE-SAMB-NN的结构
假设输入特征向量为xi∈Rm×1,模型的输出为xn o∈Rm×1。
用one-hot编码对故障类型进行编码。在此基础上,构建预训练模型的输出与故障标签的映射关系,如下式所示:
为了使真实分类标签y(n)与预测结果y(n)之间的差值最小,通过交叉熵损失函数更新网络参数。需要注意的是,基于表示学习的迁移学习方法可以实现模型参数的共享,提高训练效率。考虑到在实践中很难获得错误样本,因此只使用少量样本(10%)进行训练。
E.无监督条件下未知轴承故障识别
该方案考虑了一种无监督表示学习方法来识别未知故障。将已知故障样本输入到集成方案中检测模块训练好的MDAE-SAMB中,残差向量r(n) e如式8所示,其中r(n) e=[r(n) e,1,r(n) e,2,…,r(n) e,m],m为特征向量的维数。由于单个故障样本生成的残差向量难以完全表征故障,因此无法取得较大的识别性能。因此,综合方案结合q个残差向量的个数,得到故障样本的增广残差矩阵r~(n) e。
利用已知故障样本的残差增广矩阵作为输入,构建AE模型,学习已知故障类型特征之间的耦合关系。
①编码器:利用编码器构造式(13)中增广残差矩阵r~(n) e与编码向量x~e之间的映射关系。
②解码器:利用解码器构造编码向量x ~ e与网络重构r ~ (n) e之间的映射关系。
构建AE后,将在线运行产生的故障数据形成残差增强矩阵作为输入。当轴承故障未知时,训练AE产生的重构误差增大。
在此基础上,将故障阈值JRes,th2设为下列式子,一旦重构误差大于式子中的阈值,则对应的时序的轴承故障位置。
实验分析
利用SumYoung技术有限公司转子动力学试验台(RDER)产生的实际轴承振动数据验证了所提出的方法。整个数据集包括健康运行、内圈故障、球型故障、外圈故障和组合故障五种工况,其中组合故障是上述三种故障的综合。轴承的振动信号由三通道无线传感器收集。以上五种工况分别包含轴承在1000r /min、2000r /min和3000r /min时采集的数据,因此总共有15个工作过程。
1)基于MDAE-SAMB的无监督故障检测
本文设计了MDAE-SAMB瓶颈层中隐藏层数和神经元数对网络超参数影响的对比实验。通过xi和xi~之间的重构均方根误差(RMSE)来评估网络性能。对比结果如表1所示。
表1 不同瓶颈神经元和隐藏层的重构模型结果
当隐藏层数为3层,瓶颈神经元数为64个时,该方法具有良好的重构性能。综上所述。为了证明这种表示学习方法的可解释性,子图(a)和子图(b)分别显示了图4中有和没有SAMB的瓶颈层权值可视化的比较结果。为了更好地代表实验结果,本文采用了极大极小值归一化。可以看出,由于SAMB的引入,改变了瓶颈层神经元的数据分布,使得权重集中在重要位置。中间层的可视化是可解释表示学习的一个贡献。
图4 (a)无SAMB和(b)有SAMB的瓶颈层权重可视化
在此基础上,基于MDAE-SAMB的轴承故障检测任务实验结果如图5所示。图5(a) - (d)分别为内圈断层、球圈断层、外圈断层和组合断层的结果。从图5中可以看出,对于每一个故障,重构残差都在阈值以上。我们将检测精度作为评价指标。精度高,检测性能好。
图5 RDER数据集的MDAE-SAMB故障检测结果。(a)内种族断层。(b)球故障。(c)外竞赛故障。(d)复合故障
2)基于迁移学习的少样本故障分类
图6为健康运行与四种故障分类的混淆矩阵。从图6可以看出,本文提出的TF-MDAE-SAMB-NN方法可以有效地对不同类型的少射故障进行分类。为便于表达,故障1-4分别表示内圈故障、球圈故障、外圈故障和组合故障。
图6 分类结果。(a)不归一化的混淆矩阵(b)归一化的混淆矩阵
表2列出了一些机器学习和深度学习方法,即支持向量机分类器(SVC)、随机森林分类器(RFC)、轻梯度增强机(LightGBM)、极端梯度增强机(XGBoost)和CNN在RDER数据集上的故障分类结果对比。所有的方法都是用整个样本的10%来训练的。
表2 RDER数据集分类精度的比较
3)无监督条件下的未知故障识别
无监督条件下未知故障的识别结果如图7所示。从图7可以看出,通过本文提出的综合方案可以有效地识别未知故障数据。其中,对未知故障的识别准确率可达100%。这些未知的故障对没有事先通知就发生的。旋转机械系统有重要的影响。从这个意义上说,该集成方案提出了一种基于表示学习的识别方法,具有很高的识别精度。
图7 无监督条件下的未知故障识别结果:(a)未知故障:球故障(b)未知故障:外部故障(c)未知故障:组合故障
总结
本文提出了一种基于表示学习的非平衡样本条件下多任务集成智能轴承故障诊断方案。综合方案的新颖之处在于:1)在没有故障样本的情况下,提出了一种基于表示学习的MDAE-SAMB方法来完成无监督条件下的故障检测;2)为了实现精确的少弹故障分类,集成方案中包含了一种基于迁移学习的故障分类方法;3)在故障检测的基础上,构建AE,有效识别无监督条件下的未知故障,这在现有工作中很少研究。由此可见,所提出的集成方案能够把握轴承故障检测、分类和识别任务之间的共性,从而实现轴承故障的智能诊断。
END
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...