当前位置: 首页 > news >正文

1.1 轴承故障数据预处理与时频图提取

本博客来源于CSDN机器鱼,未同意任何人转载。

更多内容,欢迎点击本专栏,查看更多内容。

目录

0 数据集分析

1 数据划分

2 特征提取

 3 结语


0 数据集分析

数据来源于凯斯西储大学的滚动轴承故障诊断,数据集介绍参考【博客】,下载就自己网上找,到处都是资料。

图1 故障模拟平台
图1 故障模拟平台

数据集如下:这是我从网上下的,只下了48k采样频率的数据,48k代表采样频率48kHz,DriveEnd代表是驱动端,B、IR、OR分别是球体Ball、内圈InnerRace,外圈OuterRace的故障,007、014、021代表轴承直径(英寸),0代表0马力负载,normal代表正常类型,一共10种,后续我们将建立10分类的故障诊断网络。其他负载与采样频率的后续有空再研究。

1 数据划分

每种故障数据都是一个几百k长度的振动信号, 而我们做神经网络需要很多样本,因此采用随机采样的方式进行数据预处理,具体操作如下

步骤①计算数据data长度,得到长度length;

步骤②在0-(length-L)的范围内随机生成一个数start,end=start+L;取数据data[start:end]作为一样样本;

步骤③循环②共N次,得到N个样本;对每种数据都训练N次,得到10N个样本。

步骤④随机9:1划分得到训练集与测试集。完整代码如下:

# -*- coding: utf-8 -*-
import os
from scipy.io import loadmat,savemat
import numpy as np
from sklearn.model_selection import train_test_split
np.random.seed(0)
# In[]
lis=os.listdir('./data/')
N=200;Len=1024 #每种故障取N个样本,每个样本长度是Len
# 一共10类 标签是0-9
data=np.zeros((0,Len))
label=[]
for n,i in enumerate(lis):
    path='./data/'+i
    print('第',n,'类的数据是',path,'这个文件')
    file=loadmat(path)
    file_keys = file.keys()
    for key in file_keys:
        if 'DE' in key:
            files= file[key].ravel()
    data_=[]
    for i in range(N):
        start=np.random.randint(0,len(files)-Len)
        end=start+Len
        data_.append(files[start:end])
        label.append(n)
    data_=np.array(data_)
    
    data=np.vstack([data,data_])
label=np.array(label)
# 9:1划分数据集
train_x,test_x,train_y,test_y=train_test_split(data,label,test_size=.1,random_state=0)
# In[] 保存数据
savemat('result/data_process.mat',{'train_x':train_x,'test_x':test_x,
                                   'train_y':train_y,'test_y':test_y})

2 特征提取

直接采用时域信号做分类,效果一般都不好。通常的做法是①提取时域特征,如均值、方差、极大极小值。②提取频域特征,如快速傅里叶变换、小波变换。③提取时频域特征,如短时傅里叶变换、连续小波变换、希尔伯特-黄变换等。本博客采用的特征提取为连续小波变换时频图,从原本的时域信号中提取得到时频域特征。代码如下

# -*- coding: utf-8 -*-
import matplotlib.pyplot as plt
# 每种故障取一个样本出来画图举例
import numpy as np
import pywt
import os
from scipy.io import loadmat
# In[]
lis=os.listdir('./data/')
Len=1024
data=[]
for n,i in enumerate(lis):
    path='./data/'+i
    print('第',n,'类的数据是',path,'这个文件')
    file=loadmat(path)
    file_keys = file.keys()
    for key in file_keys:
        if 'DE' in key:
            files= file[key].ravel()
    start=np.random.randint(0,len(files)-Len)
    end=start+Len
    data.append(files[start:end])
# In[] 参数设置
for i in range(10):
    sampling_rate=48000# 采样频率
    wavename = 'cmor3-3'#cmor是复Morlet小波,其中3-3表示Fb-Fc,Fb是带宽参数,Fc是小波中心频率。
    totalscal = 256
    fc = pywt.central_frequency(wavename)# 小波的中心频率

    cparam = 2 * fc * totalscal
    scales = cparam / np.arange(totalscal, 1, -1)
    [cwtmatr, frequencies] = pywt.cwt(data[i], scales, wavename, 1.0 / sampling_rate)
    
    t=np.arange(len(data[i]))/sampling_rate
    plt.figure()
    plt.plot(t, data[i])
    plt.xlabel('Time/s')
    plt.ylabel('Amplitude')
    plt.title('Fault type'+str(i))
    plt.savefig('result/Fault type'+str(i)+' Signal.jpg')
    plt.close()
    plt.figure()
    t,frequencies = np.meshgrid(t,frequencies)
    plt.pcolormesh(t, frequencies, abs(cwtmatr),cmap='jet')    
    plt.xlabel('Time/s')
    plt.ylabel('Frequency/Hz')  
    plt.title('Fault type'+str(i))
    plt.savefig('result/Fault type'+str(i)+' Spectrum.jpg')
    plt.close()

写一个循环,将【0】得到的数据集依次提取出来,即可得到需要的数据集,数据保存成n_c.jpg的格式,n代表第n个样本,c代表样本对应的类别,代码如下所示:

# -*- coding: utf-8 -*-
# 对所有样本依次计算时频图 并保存
from threading import Thread
import matplotlib.pyplot as plt
import numpy as np
import pywt
from scipy.io import loadmat
import os
import shutil
shutil.rmtree('image/')
os.mkdir('image/')
os.mkdir('image/train')
os.mkdir('image/test')
# In[]
def Spectrum(data,label,path):
    label=label.reshape(-1,)
    for i in range(data.shape[0]):
        sampling_rate=48000# 采样频率
        wavename = 'cmor3-3'#cmor是复Morlet小波,其中3-3表示Fb-Fc,Fb是带宽参数,Fc是小波中心频率。
        totalscal = 256
        fc = pywt.central_frequency(wavename)# 小波的中心频率
        cparam = 2 * fc * totalscal
        scales = cparam / np.arange(totalscal, 1, -1)
        [cwtmatr, frequencies] = pywt.cwt(data[i], scales, wavename, 1.0 / sampling_rate)
        t=np.arange(len(data[i]))/sampling_rate

        t,frequencies = np.meshgrid(t,frequencies)
        plt.pcolormesh(t, frequencies, abs(cwtmatr),cmap='jet')    
        plt.axis('off')
        plt.savefig(path+'/'+str(i)+'_'+str(label[i])+'.jpg', bbox_inches='tight',pad_inches = 0)
        plt.close()

data=loadmat('result/data_process.mat')
Spectrum(data['train_x'],data['train_y'],'image/train')
Spectrum(data['test_x'],data['test_y'],'image/test')
# 用多线程快一点
# p1 = Thread(target=Spectrum, args=(data['train_x'],data['train_y'],'image/train'))
# p2 = Thread(target=Spectrum, args=(data['test_x'],data['test_y'],'image/test'))
# p1.start()
# p2.start()
# p1.join()
# p2.join()

 3 结语

通过上述方式,我们已经完成了样本的处理与特征提取处理,更多内容请点击我的专栏获取。

相关文章:

  • 踏过强化学习的每一步推导
  • C++基础算法(插入排序)
  • 学习如何设计大规模系统,为系统设计面试做准备!
  • Uniapp自定义TabBar组件全封装实践与疑难问题解决方案
  • sscanf() 用法详解
  • docker 安装多次 Jenkins后,插件全部报错
  • G8 的 Morph(形态/变形)转移到 Genesis 9 (G9)
  • 《Java八股文の文艺复兴》第八篇:时空裂缝中的锁竞争——当Synchronized与量子纠缠重构线程安全
  • 探索 Gaggol:理解 10^^^100 的宇宙级常数
  • [TAMUctf 2025]
  • 【C语言】文件操作(2)
  • 吾爱破解安卓逆向学习笔记(4p)
  • OpenCV:计算机视觉的强大开源库
  • 【Python Cookbook】字符串和文本(三)
  • Java基础 3.31
  • Macro 巨汇黄金外汇投资全解析:策略与操作步骤?
  • 【STM32】最后一刷-江科大Flash闪存-学习笔记
  • 第四章Python基础进阶—函数(其二)
  • 自由学习记录(51)
  • 电源芯片在自动化测试中该如何降低成本增加精准度
  • 高端产品网站/百度指数使用方法
  • 网站建设费用初步预算/搜索引擎优化报告
  • 梧州做网站建设/数据分析培训
  • 沈阳企业网站设计制作/百度竞价托管哪家好
  • 湖北潜江疫情最新消息/处理器优化软件
  • 国外网站建设素材/关键词优化怎么弄