python如何识别振动异常

Python识别振动异常的方法包括：数据采集与预处理、特征提取、机器学习模型、数据可视化。 其中，数据采集与预处理是关键的一步，通过高质量的传感器数据，可以为后续的分析和模型训练打下坚实的基础。利用Python的强大数据处理库，如Pandas和Numpy，可以高效地进行数据清洗、转换和归一化处理。

一、数据采集与预处理

数据采集

振动数据的采集通常需要使用加速度传感器，这些传感器可以捕捉到机械设备在运行过程中的振动信号。数据采集的过程中，需要注意以下几点：

传感器选择：选择高灵敏度、高精度的加速度传感器，以保证采集到的数据质量。
采样频率：根据设备的工作频率选择合适的采样频率，避免数据的别化。
安装位置：传感器的安装位置应尽量靠近振动源，以捕捉到真实的振动信号。

数据预处理

采集到的振动数据通常会包含噪声和干扰信号，因此需要进行预处理。预处理的步骤包括：

数据清洗：去除无效数据和异常值，确保数据的完整性和准确性。
去噪处理：使用滤波器（如低通滤波器、高通滤波器或带通滤波器）去除噪声信号。
数据归一化：将数据归一化到相同的范围，避免因量纲不同导致的误差。

import pandas as pd
import numpy as np
from scipy.signal import butter, lfilter
读取数据
data = pd.read_csv('vibration_data.csv')
数据清洗
data = data.dropna()
去噪处理
def butter_bandpass(lowcut, highcut, fs, order=5):
    nyq = 0.5 * fs
    low = lowcut / nyq
    high = highcut / nyq
    b, a = butter(order, [low, high], btype='band')
    return b, a
def bandpass_filter(data, lowcut, highcut, fs, order=5):
    b, a = butter_bandpass(lowcut, highcut, fs, order=order)
    y = lfilter(b, a, data)
    return y
fs = 1000.0  # 采样频率
lowcut = 0.1
highcut = 50.0
data['filtered'] = bandpass_filter(data['vibration'], lowcut, highcut, fs)
数据归一化
data['normalized'] = (data['filtered'] - np.min(data['filtered'])) / (np.max(data['filtered']) - np.min(data['filtered']))

二、特征提取

时间域特征

时间域特征是直接从振动信号的时域波形中提取的特征，包括：

均值：反映信号的平均水平。
标准差：反映信号的波动程度。
峰度：反映信号的尖锐程度。
偏度：反映信号的对称性。

def extract_time_domain_features(data):
    features = {}
    features['mean'] = np.mean(data)
    features['std'] = np.std(data)
    features['kurtosis'] = pd.Series(data).kurtosis()
    features['skewness'] = pd.Series(data).skew()
    return features
time_domain_features = extract_time_domain_features(data['normalized'])

频域特征

频域特征是通过对振动信号进行傅里叶变换得到的特征，包括：

频谱能量：反映信号在各个频率成分上的能量分布。
主频率：信号能量最大的频率成分。
频带能量比：信号在不同频带上的能量比值。

from scipy.fftpack import fft
def extract_frequency_domain_features(data, fs):
    N = len(data)
    T = 1.0 / fs
    yf = fft(data)
    xf = np.linspace(0.0, 1.0/(2.0*T), N//2)
    features = {}
    features['spectrum_energy'] = np.sum(np.abs(yf[0:N//2])  2) / N
    features['main_frequency'] = xf[np.argmax(np.abs(yf[0:N//2]))]
    return features
frequency_domain_features = extract_frequency_domain_features(data['normalized'], fs)

三、机器学习模型

数据准备

在进行机器学习建模之前，需要将提取的特征组合成特征向量，并划分训练集和测试集。

from sklearn.model_selection import train_test_split
组合特征向量
features = {time_domain_features, frequency_domain_features}
X = pd.DataFrame([features])
假设y为标签
y = data['label']
划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

模型选择与训练

常用的机器学习模型包括决策树、支持向量机、随机森林等。以随机森林为例：

from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
创建随机森林模型
model = RandomForestClassifier(n_estimators=100, random_state=42)
训练模型
model.fit(X_train, y_train)
预测
y_pred = model.predict(X_test)
评估模型
accuracy = accuracy_score(y_test, y_pred)
print(f'Model Accuracy: {accuracy}')

模型优化

通过调参和交叉验证，可以进一步优化模型的性能。

from sklearn.model_selection import GridSearchCV
参数调优
param_grid = {
    'n_estimators': [100, 200, 300],
    'max_depth': [None, 10, 20, 30]
}
网格搜索
grid_search = GridSearchCV(estimator=model, param_grid=param_grid, cv=5, scoring='accuracy')
grid_search.fit(X_train, y_train)
最佳参数
best_params = grid_search.best_params_
print(f'Best Parameters: {best_params}')

四、数据可视化

时间域信号可视化

通过时域波形图，可以直观地观察到振动信号的变化情况。

import matplotlib.pyplot as plt
plt.figure(figsize=(10, 6))
plt.plot(data['time'], data['vibration'], label='Original Signal')
plt.plot(data['time'], data['filtered'], label='Filtered Signal')
plt.xlabel('Time')
plt.ylabel('Amplitude')
plt.title('Time Domain Signal')
plt.legend()
plt.show()

频域信号可视化

通过频谱图，可以观察到信号在频域上的能量分布。

plt.figure(figsize=(10, 6))
plt.plot(xf, 2.0/N * np.abs(yf[0:N//2]), label='Frequency Spectrum')
plt.xlabel('Frequency')
plt.ylabel('Amplitude')
plt.title('Frequency Domain Signal')
plt.legend()
plt.show()

机器学习结果可视化

通过混淆矩阵和ROC曲线，可以评估模型的分类效果。

from sklearn.metrics import confusion_matrix, roc_curve, auc
混淆矩阵
conf_matrix = confusion_matrix(y_test, y_pred)
plt.figure(figsize=(8, 6))
plt.imshow(conf_matrix, cmap='Blues')
plt.title('Confusion Matrix')
plt.colorbar()
plt.xlabel('Predicted')
plt.ylabel('Actual')
plt.show()
ROC曲线
fpr, tpr, _ = roc_curve(y_test, model.predict_proba(X_test)[:, 1])
roc_auc = auc(fpr, tpr)
plt.figure(figsize=(8, 6))
plt.plot(fpr, tpr, color='darkorange', lw=2, label=f'ROC curve (area = {roc_auc:.2f})')
plt.plot([0, 1], [0, 1], color='navy', lw=2, linestyle='--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.xlabel('False Positive Rate')
plt.ylabel('True Positive Rate')
plt.title('Receiver Operating Characteristic')
plt.legend(loc='lower right')
plt.show()

通过上述步骤，利用Python可以有效地识别振动异常，并为机械设备的健康监测和故障诊断提供强有力的支持。

python如何识别振动异常

一、数据采集与预处理

数据采集

数据预处理

读取数据

数据清洗

去噪处理

数据归一化

二、特征提取

时间域特征

频域特征

三、机器学习模型

数据准备

组合特征向量

假设y为标签

划分训练集和测试集

模型选择与训练

创建随机森林模型

训练模型

预测

评估模型

模型优化

参数调优

网格搜索

最佳参数

四、数据可视化

时间域信号可视化

频域信号可视化

机器学习结果可视化

混淆矩阵

ROC曲线

相关问答FAQs：