2024.02.26-2024.03.03
每周文章分享
标题: Imbalanced Sample Fault Diagnosis of Rolling Bearing Using Deep Condition Multidomain Generative Adversarial Network
期刊: IEEE SENSORS JOURNAL, VOL. 23, NO. 2, 15 JANUARY 2023
作者: Xuejun Liu, Wei Sun , Hongkun Li , Zibo Wang, and Qiang Li
分享人: 河海大学——左青
01
研究背景
滚动轴承故障诊断对保证旋转机械的安全可靠性起着至关重要的作用,一些采用深度学习技术的方法是建立在存在大规模故障数据的假设基础上的。在现实中,在不同故障率下很难获得更多的失效滚动轴承数据。为了解决这些问题本文提出了一种新的条件多域生成对抗网络(CMDGAN),用于非平衡样本故障诊断。当原始样本有限时,该框架通过融合两域信息有效地捕获样本分布信息。此外,引入的自适应样本条件不需要先验知识,有助于合成数据的不同状态。最后,利用自关注模块改进故障诊断模型,实现局部故障特征与全局周期性故障特征的融合。
02
关键技术
本文提出了一种基于多域学习的自适应样本条件的数据生成对抗训练网络,该网络利用二值判别器对样本条件信息进行监督对抗训练。由于生成模型很难获得时域特征,在训练中加入额外的域数据可以加强模型特征的学习,有助于学习小原始样本的分布。具体而言,本文提出的条件多域GAN (CMDGAN)模型是在时域和频域监督学习上充分学习原始小信号的分布。引入的自适应样本条件信息有助于生成带标记的样本。此外,针对卷积核大小的限制,本文还设计了一种新的基于自关注(SA)机制的故障诊断模型,该模型综合了新平衡数据集的局部和全局特征。
本文的创新和贡献如下:
1)针对样本条件信息的学习,改进了自适应特征提取模块,使得条件知识参与模型训练时生成数据的状态不同。
2)在多域对抗训练中,利用二元判别器构造了轴承样本数据生成框架。该模型通过对时域和频域信息的知识融合来获取有限样本的分布空间。
3)提出了一种改进的SA 1-D CNN用于平衡轴承数据集的故障诊断,该模型通过加入SA机制克服了卷积核大小的限制,通过局部特征和全局特征的融合实现了故障状态预测。
03
算法介绍T
(1)样本条件信息建设
由于传统的GAN模型是采用无监督学习的方式进行训练的,因此给出样本条件的辅助信息可以扩展模型以生成不同的状态数据,而这些状态数据通常是人工设计的。而且,每个显著的样本状态不仅代表了所有相同状态样本的共同特征,而且与其他类数据具有区别。因此,作者引入了一种基于聚类分析的自适应构造各轴承状态样本条件的方法。
如图1所示,该方法分为中间特征提取和中心特征聚类两个部分。首先,建立具有两个AE的SAE神经网络,从原始信号中提取显著特征,解决了样本条件的第一条准则。
图1 样本条件信息建设
AE是一种强大的无监督学习特征提取模型,它由编码器和解码器组成。AE模型的优化目标如下:
(2)CMDGAN
图2 CMDGAN流程图
CMDGAN流程图如图2所示,首先,将前一部分获取的样本条件信息加入到数据生成模型中,生成带标签的不同数据。并将这些样本状态数据参与到生成器和鉴别器的训练中。其次,由于频率数据包含轴承运行状态的一些显著特征,该网络引入了频谱信息来进行模型对抗训练。数据生成模块通过时域和频域的监督学习,很好地学习了输入小样本的分布。综上所述,所设计的CMDGAN主要包括三部分:故障样本发生器G和时域和频域域判别器D_t和D_f两个二值分类器。由于CNN具有强大的特征提取和模式识别能力,CMDGAN的各个部分都是基于CNN构建的。
其中,域鉴别器D_t和D_f由卷积层、池化层和全连接(FC)层组成,其中时间序列样本及其频率数据组合条件信息分别作为D_t和D_f的输入。每个卷积层利用不同的核函数对输入或池化层的输出进行卷积,其中J为域判别作业,W、H、C为核函数的权值、高度和通道。由于D_t的输入为时间序列数据,因此将H和D_t的初始C设为1。卷积结果如下:
利用最大池化对模型训练参数进行约简,其中最大值为每次池化操作的结果,如下所示:
经过卷积池运算后,高维特征映射的结果被平面化为一维向量。该1-D向量由FC层处理, 结果如下:
在判别方面,利用softmax函数对最后一层FC的输出进行处理,得到标签的概率。
然后,利用交叉熵计算二元鉴别器的训练损失。因为它们都是二值分类器,所以损失函数可以表示为:(其中y_i是x_i的标签,P(·)是正标签的概率)
与D_t和D_f的结构不同,生成器G仅由卷积层构造。G打算将z维高斯噪声与条件信息结合生成新的标记时间序列数据,其中新数据具有与真实样本相同的分布。将G的最后一层输出作为生成样本,用D_t和D_f进行判别。因此,G的损耗由L(D_T)决定。对于时域和频域的信息差异,会影响两个鉴别器的训练,设置L(G)的权衡参数λ (0 <λ< 1)来平衡这种差异。因此,G的损失函数如下所示:
(3)平衡数据集故障检测
图3 基于平衡数据集的故障诊断模型框架。
如图3所示,该故障诊断模型由局部特征提取、全局特征提取和特征分类三部分组成。局部特征提取通过两个卷积池层捕获故障样本的邻域特征,并输出局部特征映射供下一步操作使用。
在全局特征提取部分,增加SA层,从之前的输出特征映射中捕获全局周期性信息。最后一部分的输出特征映射x_L通过三个函数f、g、h进行变换,得到key、query、value,其中f (x_L) = W_f* x_L, g(x_L) = W_g* x_L, h(x_L) = W_h* x_L。所有三个变换都由三个1 × 1卷积层处理。然后,令s_i,j = f (x_L,i)^T *g(x_L,j)计算注意力,SoftMax结果表示模型在合成第j个区域时对第j个位置的关注程度:
SA层的输出记为o = {o_1, o_2,…,o_N},其中o_j如下(N为前一隐藏层特征的特征位置个数):
为了保证SA的运行质量,采用残差操作,最终输出q_i如下式所示:
04
实验结果分析T
实验部分,作者在CWRU数据集上进行实验,共选择了9种轴承故障样本和1种正常长样本,每个样本包含12万多个点。为方便起见,将每个轴承故障状态标记为“B7/B14/B21/I7/I14/I21/O7/O14/O21”。
利用四种基于GAN模型的不平衡故障诊断方法进行比较,分别为:GAN、Wasserstein GAN (WGAN)、deep convolutional GAN (DCGAN)、dual discriminator GAN (D2GAN),并对所有模型进行时域样本训练。
图4 真实样本与生成样本在时域和频域上的数据比较
如图4所示为六种生成故障样本与真实轴承故障信号的对比。图中左侧为实际样本,右侧为生成样本。很明显,生成的样本在时域和频域上都与实际样本相似。
在图形上,生成样本的每个轴承故障状态与真实情况相似,并且这些样本也应该具有相同的分布空间。利用一些统计方法来评估样本数据的质量和相似度,常见的数据评估方法有三种:MMD、欧氏距离(ED)和余弦相似度。
图5 真实样本和生成样本之间的数据评估
图5显示了本文方法与对比方法的ED、MMD和CS评价结果。三张图的横坐标表示轴承的九种故障状态,五种颜色条表示所提出的方法和对比方法。例如,图5(a)中第一个横坐标“I7”表示5种方法对7 in内圈断层的评价,所提方法的结果最低,说明生成能力优于其他方法。图5(b)显示了每个轴承故障状态样本上所有频率数据的余弦相似度,并且只有本文方法的样本更接近于1,即最大相似度。从图5(c)中可以看出,与其他方法相比,本文方法在各故障状态下的MMD结果最低且最稳定。这些结果也揭示了模型收敛的训练效果,所提方法的最小值代表最好。
图6 不同方法的故障诊断预测精度
如图6所示为不同方法的故障诊断预测精度。很明显,随着迭代次数的增加,模型的训练精度也不断增加,这些曲线在第12次迭代后缓慢上升。对比方法生成的样本较差,混淆了原始分布,降低了故障诊断的预测精度,本文提出的方法生成的样本是最优秀的。
05
总结T
本文提出了一种基于样本生成和状态识别的滚动轴承不平衡数据故障诊断方法。首先,引入自适应特征提取,寻找样本条件,生成带标签的数据;其次,通过融合原始信号的二域特征,构造了一种新的CMDGAN来学习小故障样本的分布;最后,提出了一种改进的故障诊断模型,该模型利用合成数据和原始不平衡数据进行训练,提高了故障诊断的识别能力。
- END -
==河海大学网络与安全实验室==
微信搜索:Hohai_Network
联系QQ:1084561742
责任编辑:何宇
推荐站内搜索:最好用的开发软件、免费开源系统、渗透测试工具云盘下载、最新渗透测试资料、最新黑客工具下载……
还没有评论,来说两句吧...