基于SCADA数据驱动的风电机组部件故障预警

吴亚联 1 , 梁坤鑫 1 , 苏永新 1* , 詹 俊 2
(1.湘潭大学 信息工程学院, 湖南 湘潭 411105; 2.湖南优利泰克自动化系统有限公司, 湖南 长沙 410205)前端

摘 要: 为提升风电机组部件故障预警的精度和速度, 文章提出了一种基于SCADA数据的风电机组部件故障预警方法, 用于解决现存的风电机组部件故障预警时间与故障预警精度的矛盾。 首先SCADA历史数据经过数据预处理与BP神经网络创建机组部件正常状态模型, 随后以该模型为基础结合基于马氏距离的数据统计方法造成故障预警判据, 并将结果反馈给SCADA系统达到风电机组部件故障预警目的。 仿真结果代表, 使用该方法可以提早2个月识别主轴承故障信号, 同时该方法能发现SCADA系统误报故障。
关键词: 神经网络; 故障诊断系统; 马氏距离; 风电场; SCADA系统算法

做为一种绿色无污染的新能源, 风能愈来愈受到重视,它将成为人类将来主要的能源资源 [1] 。 受复杂多变的环境因素影响, 风电机组各部件性能会在运行中逐渐降低, 最终致使部件发生故障。 而对风电机组部件进行故障预警则可提早发现隐患, 有利于优化维护计划, 避免因部件故障延误而致使更加严重的整机故障。
传统风电机组故障预警方法有振动分析、 声学分析、 润滑分析等, 这些方法须要采集高频率的振动数据或额外安装高成本附加设备或者传感器, 致使难以普遍应用于风场中。 风机数据采集与监控(Supervisory Control And Data Acquisition, SCADA) 系统做为风机状态监测的重要组成部分, 可以提供监测风机状态与风机部件运行状态的数据, 基于SCADA数据驱动的风机部件故障预警方法已经被普遍应用于风场中。 经过SCADA数据创建神经网络模型对风机部件进行故障预警不须要对风机组件的机械结构有深刻了解。
当SCADA数据充足的状况下, 可以实现对风机多部件的故障预警。 神经网络对风机组件故障预警的这些优势, 使其成为风机关键部件故障预警的重要方法之一 [2-4] 。
Garcia等 [5] 在2006年提出经过利用神经网络创建风机组件正常模型对风机齿轮箱进行故障预警, 该方法经过神经网络正常模型的预测值与实际值进行比较获得偏差, 将在正常行为模型定义的置信区间以外的偏差判断为异常。 研究结果代表, 使用Garcia提出的方法只能提早26小时监测到风机齿轮箱发生故障, 预警时间太短致使没法针对即将发生的故障制定相应的维护计划。 Zaher等 [6] 在2009年提出相似的方法, 即经过观察神经网络的预测值与实时数据之间的偏差和偏差频率的增长来实现故障预警。 该方法可以提早6个月对齿轮箱轴承故障进行识别, 可是由于缺少定量的判据来判断风机组件是否发生异常, 不曾大量运用于风场。 Kusiak等 [7] 在2012年经过改进神经网络模型, 选取最优性能模型对风机发电机轴承进行故障预测。 实验结果代表, 该方法可以提升神经网络精度, 但只能实现提早1.5小时对风机发电机轴承进行故障预测。 因为预警时间太短, 风场业主短期内没法制定有效的维护计划。针对以上问题, 本文着力解决故障预警时间和预警精度的矛盾。 在结合逐步回归算法和遗传算法优化神经网络预测模型的基础上, 根据神经网络预测模型与马氏距离原理, 提出基于SCADA数据的风机部件故障预警方法。 经过某风场2 MW直驱式的风机进行试验、 分析, 验证所给出的方法在预警时间、 精度方面的有效性。
1 风机故障预警框架
如引言所述, 本文提出一种基于遗传算法的优化BP神经网络(Genetic Algorithm-Back Propagation, GA-BP) 和风机部件参数几率分布的风电机组部件故障预警方法, 其原理如图1所示, 方法分为风电机组部件正常行为建模、 故障预警两个部分。网络

 

 

 图1 基于SCADA数据驱动的风电机组部件故障预警app

1.1 风电机组部件正常行为建模
实际观测中发现SCADA数据中存在异常数据, 为保证训练数据的一致性与连续性, 对训练数据进行异常数据滤除。 同时为了不输入参数重复使用与数据冗余, 采用逐步回归算法获取神经网络输入参数, 获取风机部件参数相关性较大的输入参数。SCADA系统因为结构复杂状态参数众多, 故障特征与故障之间存在极为复杂的非线性关系。 GA-BP神经网络具备强大的非线性映射功能, 无需单独建模, 能有效运用于风电场故障诊断中。 基于GA-BP神经网络, 选取相关参数, 创建风电机组部件正常行为模型, 正常行为模型结合基于马氏距离的数据统计方法, 造成故障预警判据, 计算了故障分布几率, 能适应多重工况。
1.2 故障预警
经过SCADA系统将风电机组部件实时监控数据输入模型, 获得其输出, 并计算其与正常值的马氏距离, 若是马氏距离越限, 则断定机组故障, 从而实现故障预警。如图1所示, 基于SCADA数据对风电机组部件进行故障预警主要分为如下3个步骤: 神经网络选择; 数据预处理; 风机部件故障判据肯定。
1.3 神经网络选择
风机部件故障诊断问题本质上是非线性的, 选择的神经网络应具备并行处理学习记忆和非线性等特色。 针对以上特色, 选取BP神经网络创建正常模型对风机部件进行故障诊断, 结果代表BP神经网络在风机故障预警中的适用性 [7-8] 。结合具备全局寻优能力的遗传算法, 优化BP神经网络的权重和阈值, 设计基于GA-BP神经网络, 构建风电机组部件预警方案, 有效改善了BP神经网络速度和收敛速度, 也可提升故障预警的成功率 [8-9] 。 本文采用遗传算法优化后的BP神经网络。
2 数据预处理
2.1 异常数据滤除
神经网络预测模型经过训练阶段的数据来肯定输入输出之间的映射, 然而SCADA数据在正常状况下很难找到一个完整的、 正常的训练数据集。 一般状况下经过SCADA系统获取的数据是不连续、 不一致的, 为了提升神经网络预测模型的准确性, 须要对数据进行预处理。选取风机功率数据进行数据预处理, 图2为某风机功率数据图, 经过数据的平均值 x 和误差δ, 对数据进行异常滤除, 受到其余外部因素的影响致使数据具备波动性, 对其进行指数滑差处理:框架

 

 

 式中: k经过统计小几率事件肯定, 经过设置k和α对数据进行异常判断, 当x t 知足公式(2) 时, 能够判断当前数据为正常值, 不然为异常进行滤除。 选取k=3和α=0.3对功率数据进行处理, 滤除结果如图2所示。ide

 

 

 图2 风电机组功率数据预处理函数

2.2 神经网络输入参数选择
对于风电场的SCADA数据, 神经网络选取输入参数, 大多经过主观经验判断或者参数之间的相关性来决定。 因为风电场SCADA参数之间存在相关性, 使用参数相关性选取神经网络输入参数的方法, 当选择输入参数存在高度相关时, 会形成参数的重复使用和数据冗余的问题。 而经过主观经验法选择神经网络输入参数, 因为影响风机部件的参数比较多, 存在选择参数不许确, 致使神经网络效率低, 选择参数过少, 精度不够等问题。咱们采起逐步回归 [10-11] 解决这一问题, 逐步回归分析具体步骤以下所示:
第一步: 输入SCADA参数样本X(m,n), 有n个参数x 1 ,x 2 ,x 3 ,…,x n , 全部参数的维度为m。
第二步: 故障预警部件参数设为x n 计算全部参数的平均值ix 、 离均差平方和s ii 、 协方差矩阵S=(s ij ) n×n' 和相关系数矩阵R=(r ij ) n×n' 。性能

 

 

 其中i,j=1,2,3,…,n-1,n。
第三步: 判断可选入参数个数是否大于2, 选入参数数量当大于2继续下一步, 不然结束。
第四步: 计算各参数的方差贡献, 以l(l≥1) 步为例, 计算偏回归平方和V l p 。学习

 

 

 第五步: 选入参数的显著性检验。 检验时, 先选定信度a, 查表获得F a , 挑选未入选的模型中方差贡献最大的参数,计算:测试

 

 

 若F 1 >F a , 说明该参数对y做用显著, 应该选入参数, 同时对相关系数矩阵R作变换, 不然结束。
第六步: 判断选入参数的数量是否大于2, 当数量大于2则继续下一步, 不然执行第四步。
第七步: 作剔除参数的显著性检验。 挑选入选模型中方差贡献最小的变量, 计算:

 

 

 若F 2 <F a , 说明该变量对y做用不显著, 应该剔除掉, 对相关系数矩阵R作变换。 不然将参数保留。 并执行下一步
第八步: 判断为剩余可选入参数数量是否大于2个, 当知足大于2时, 执行第四步, 不然得到最优参数子集。
3 风机部件故障判据
针对上文中提出的传统风机部件故障预警方法的局限性, 本文经过马氏距离设计风电机组部件故障判据, 马氏距离方本质上是一种统计学方法, 避免了传统上单次幅度阈值判断方法受偶然因素影响剧烈的缺点。马氏距离是一种距离测量单位, 表示数据协方差距离大小。 马氏距离可以排除相关变量之间相关性的干扰, 给出多元变量中单变量的距离, 经常使用来识别数据集中的异常值。 由此本文使用该方法以获取SCADA数据集中的异常值, 马氏距离获取数据异常值计算如式(10) 所示:

 

 

 第i个向量X i =[Xi1, Xi2, Xi3,…, X im ], m是向量总数。u=[u 1 ,u 2 ,u 3 ,…,u m ]是均值向量。马氏距离对于训练数据集的计算以下:

 

 

 式中: X ref =[训练数据, 训练偏差], 用于训练神经网络的历史数据, 训练数据所产生的偏差。经过获取到的马氏距离值利用最小二乘法肯定威布尔分布函数:

 

 

 在训练阶段获取到的马氏距离值符合双函数威布尔分布, 如图3所示。 经过获取到的马氏距离值利用最小二乘法肯定威布尔分布函数:

 

 

 其中: X newi =[预测偏差, 测量数据], 其中测量数据指的是预测时SCADA监控到的组件的实时数据, 预测偏差指的是神经网络的预测值与实时数据的偏差。

经过获取到实时的预测偏差与检测数据, 计算获得马氏距离值MD newi , 经过获取到的马氏距离值MD newi 计算f(MD newi ) 。 当知足f(MD newi ) <0.01时, 则能够判断当前数据为异常 [12] 。 实现风机部件故障诊断。

 

 

 图3 人工神经网络训练过程MD值的
直方图和韦布尔几率密度函数

4 仿真及结果分析
相比于传统的风电机组须要齿轮箱的多级增速, 直驱式风电机组忽略了增益齿轮箱, 结构较为简单。 可是因为风轮和发电机的整个重量做用在主轴承上, 一旦主轴承发生故障, 若不能及时处理, 将致使更为严重的风电机组整机故障。 本文基于Matlab 2016a平台对直驱式风电机组关键部件主轴承的故障预警进行上述方法试验分析。
4.1 神经网络型输入参数选择
SCADA系统主要监测主轴承运行时的温度, 选取SCADA系统参数主轴承温度2(前端) 做为因变量, 其余参数为自变量, 如图4所示, 使用SPSS软件进行逐步回归分析,得到主轴承温度2正常模型输入参数。

 

 

 图4 模型输入输出参数

4.2 异常数据滤除
根据第2节所提到的方法对主轴承温度2数据进行预处理。 如图4所示选取输入参数为自变量对主轴承温度2分别进行异常数据滤除, 同时当主轴承温度2处于异常时, 滤除对应全部输入参数数据。 如图5所示, 当主轴承温度2处于异常状态时, 滤除对应的输入参数如风速、 轮廓转速、 机舱温度等数据。 将滤除后的数据用于神经网络训练和测试。
4.3 主轴承故障诊断
本文经过两台直驱式风机主轴承故障诊断仿真试验, 验证上述故障预警方法的有效性, 并与其余传统风机部件故障预警方法进行比较。神经网络训练阶段原始SCADA数据具备较大的波动性, 为了下降波动性, 对数据进行10 min平均标准化处理。在24 h内可获取144个测量值, 进行故障诊断的马氏距离值根据经验法应当选取12 h平均, 每24 h生成2个马氏距离值。

 

 

 图5 风电机组主轴承温度2异常数据滤除

4.3.1 风机P01主轴承发生故障
风电场SCADA系统经过简单设置主轴承温度阈值的方法来对主轴承温度进行状态监测, 当主轴承温度高于设定的阈值时SCADA就会向风场业主发出报警。使用本文方法结合SCADA数据对风机P01在2016年1月到2017年1月进行主轴承故障诊断, 结果如图6所示。 由图可得SCADA系统第一次发出警报的时间在5月份, 随着时间的推移, SCADA系统报警的次数随之增长, 最终业主进行维护, 主轴承故障消失, SCADA系统报警中止。

 

 

 图6 P01主轴承故障监测结果

相比于SCADA报警方法, 使用本文方法在3月份时马氏距离值已经超出了故障阈值从而获得第一次报警。 随着时间的增长, SCADA系统在5月份开始报警, 相比于SCADA系统状态监测的方法, 使用本文方法可以提早2个月对风机主轴承进行故障报警。为了不本文方法因为神经网络输入参数值异常, 致使马氏距离值超出阈值产生故障报警。 如图7所示, 对神经网络输入参数进行分析, 图7中的最大值和最小值分别对应的是训练数据中的最大值和最小值, 能够观察到在图7中, 输入正常模型的参数在训练神经网络数据的范围内, 输入参数值并未产生异常。 所以能够判断使用本文方法检测到的异常为组件状态异常。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 图7 P01主轴承故障监测输入数据

在同一时间内获取风机P01神经网络预测偏差值如图8所示。 由图七、 图9可得当偏差阈值绝对值设定在1.5时,预测偏差并无超过该阈值, 并未能产生报警。 验证了本文方法优于传统利用预测偏差进行风机部件进行故障预警的方法。

 

 

 图8 P01主轴承预测偏差

 

 

 图9 P07主轴承故障监测结果

4.3.2 风机P07SCADA系统误报警
使用本文方法对相同型号风机P07在2016年1月到2017年1月进行主轴承故障诊断, 结果如图9所示。由图9可知, 该风机SCADA系统在1月出现第一次报警,随着时间的增长SCADA系统报警数量增长。 而根据本文方法, 马氏距离的值全程均不曾超过阈值, 能够获得主轴承没有发生故障的结论, 与事实相符。 可见咱们提出的方法, 还能辅助风场业主分辨现有SCADA系统报警是否有效, 有利于风场业主制定有效的维护计划。
5 结语
对风电机组关键部件进行故障预警的关键是预警准确、 及时。 本文以神经网络在风电机组部件故障预警的应用为背景, 着力解决故障预警时间和预警精度的矛盾, 提出了一种SCADA数据驱动的风电机组部件故障预警方法。
(1) 方法结合逐步回归算法与指数滑差算法, 给出SCADA数据预处理方法, 准确找出对风电机组影响较大参数, 并滤除这些参数的噪声。
(2) 方法经过神经网络预测模型与马氏距离算法, 将传统故障预警方法改成统计方法, 而且这种统计方法计算了故障分布几率, 可以适应运行工况复杂多变状况。
(3) 以两台2 MW直驱式风机为对象, 对本文方法进行实例验证。 试验结果代表: 使用该方法可以提早2个月识别主轴承故障信号, 同时该方法能发现SCADA系统误报故障。 本方案能有效赢得备件和维护计划优化时间, 也能剔除SCADA系统误报下降维护量, 有效下降风电场维护成本。下一步将根据风机内部零部件之间的相关性, 针对风机整机研究风电机组整机故障预警方法。

[参考文献][1]GWEC.Global wind energy outlook 2016 available online[EB/OL].(2016-04-04) [2018-05-08].http://www.gwec.net.[2]郭清, 夏虹, 韩文伟.基于小波熵与BP神经网络的电机故障信号研究[J].仪表技术与传感器, 2014(1): 96-99.[3]范文, 孙冬梅, 熊鑫, 等.基于信息融合技术的磁轴承转子故障诊断[J].仪表技术与传感器, 2015(12): 136-140.[4]张伟, 郑恩让.基于多层前向神经网络的应力传感器故障诊断[J].仪表技术与传感器, 2001(4): 1-2.[5]GARCIA M C, SANZ-BOBI M A, DEL PICO J.SIMAP: intelligent system for predictive maintenance: application to the health condition monitoring of a windturbine gearbox[J].Computers in Industry, 2006(6): 552-568.[6]ZAHER A, MCARTHUR S D J, INFIELD D G, et al.Online wind turbine fault detection through automated SCADA data analysis[J]. Wind Energy, 2009(6): 574-593.[7]KUSIAK A, VERMA A.Analyzing bearing faults in wind turbines: a data-mining approach[J].Renewable Energy, 2012(48): 110-116.[8]SUN P, LI J, WANG C, et al.A generalized model for wind turbine anomaly identifcation based on SCADA data[J].Applied Energy,2016(168): 550-567.[9]郭东杰, 王灵梅, 郭红龙, 等.改进小波结合BP网络的风力发电机故障诊断[J].电力系统及其自动化学报, 2012(2): 53-58.[10]ZHANG Z Y, WANG K S.Wind turbine fault detection based on SCADA data analysis using ANN[J].Advances in Manu Facturing,2014(1): 70-78.[11]高兴良.基于逐步回归分析的组合神经网络股指预测研究[D].哈尔滨: 哈尔滨工业大学, 2015.[12]BANGALORE P, LETZGUS S, KARLSSON D, et al.An artificial neural network‐ based condition monitoring method for wind turbines, with application to the monitoring of the gearbox[J].Wind Energy, 2017(8): 1421-1438.

相关文章
相关标签/搜索