Page 100 - 电力与能源2024年第二期
P. 100
240 李洪涛:基于 MI-CEEMDAN-RF-LGBM 的风功率预测分析
入,而未考虑其余风机参数是否会对风功率预测
建模造成影响。因此,本文首先采用互信息(MI)
法对各个风机参数与风功率的关联性进行分析,
选择出与风功率强相关的风机参数,并将其也作
为风功率预测建模输入的一部分 [1-2] 。其次,为了
去除风功率序列中的高噪声,使用完全自适应噪
声集合经验模态分解(CEEMDAN)算法对风功
率序列进行特征分解 [3-4] ,随后对这些分解的序列
进行特征提取。为了避免输入数据的冗余,采用
图 1 基于互信息法的重要性大小对比结果
随机森林(RF)算法对模态分量进行二次特征选
择 [5-6] 。最后,利用轻量级梯度提升机(LGBM) 输入的一部分。
[7]
算法来构建风功率预测模型。 2 完全自适应噪声集合经验模态分解
1 风机参数选择 本研究采用完全自适应噪声集合经验模态分
解算法对风功率序列进行分解,CEEMDAN 算法
为了选择出与风功率强相关的风机参数,并
不仅可以去除风功率序列中的高噪声,而且还弥
将其作为风功率预测建模的输入,本文采用互信
补了集合经验模态分解(EEMD)与补充总体经验
息法对以下风机参数进行选择,相较于一些只关
模 态 分 解(CEEMD)的 白 噪 声 问 题 CEEMDAN
注线性相关性的方法(如皮尔逊相关系数法),互
算法具体流程如图 2 所示,分解得到的模态分量
信息法具有更大的优势,因为该方法不仅可以捕
如图 3 所示。
捉变量之间的线性关系,更能够捕捉复杂的非线
首先将风功率信号分解为 K 次均值为 0 的白
性关系。
噪声:
此外,相较于一些只考虑单向相关性的方法,
x i(t) = x(t) + εδ i(t) (2)
互信息法能够提供更全面的信息,因为它考虑了
式 中 ε—— 高 斯 白 噪 声 权 值 系 数 ; δ i(t)—— 第
变量对彼此的依赖程度,从而不仅能够发现单向
i次产生的白噪声。
相关变量,还能够识别出双向相关的变量。计算
其次,对上述 x i(t)进行经验模型分解(EMD),
公式如下:
分解得到的第一个模态分量作为 CEEMDAN 分
p( x,y )
I ( X;Y) = ∑ p( x,y ) lg (1) 解得到的第一个模态分量:
x,y p( x ) p( y )
1 K
i
式 中 p( x)——X = x i 的 概 率 ;p( y)——Y = y i IMF 1(t) = ∑ IMF 1(t) (3)
K
i = 1
的概率;p( x,y)——X = x i, Y = y i 的联合概率。 r j(t) = r j - 1(t) - IMF j(t) (4)
本文将对以下风机参数进行特征选择:变桨 式 中 IMF 1(t)—— 分 解 的 第 一 个 模 态 分 量 ;
轴位置反馈、机舱空气温度、机舱位置、机舱外环 r j(t)——余量。
境温度、变桨轴轴箱温度、风速、风向、发电量等,
对分解得到的第 j 阶段余量添加特定噪声后
并将重要性大小排名前四的风机参数作为建模输 继续进行 EMD:
入的一部分。 1 K
IMF j(t)= ∑ E 1{r j- 1( ) t + ε j- 1 E j- 1[ δ i( ) t } ](5)
基于互信息法的重要性大小对比结果如图 1 K
i= 1
所示。 r j(t) = r j - 1(t) - IMF j(t) (6)
根据图 1,将风速、机舱空气温度、风向和变 式中 IMF j(t)——分解的第 j个模态分量。
桨轴轴箱温度 4 个风机参数作为风功率预测建模 最后,假如第 K 次分解得到的余量信号为单

