Page 67 - 电力与能源2024年第四期
P. 67
周 平,等:基于 CNN-LSTM 模型的绝缘架空导线局部放电识别研究 461
表现出色。然而支持向量机在处理大规模数据时 对于分类问题,应将完全连接层连接到输出
显得力不从心,而人工神经网络凭借其自学习和 分类结果的最后一个卷积层上,其定义为
自适应能力,在解决大规模数据中的非线性问题 y = ϕ(W y l - 1 + b ) (3)
l
l
l
时展现出了显著优势,因此在检测领域得到了广 式中 W ——上层和当前层之间连接的权重矩
l
[9]
泛应用。其典型方法包括多层感知机(MLP) 、 阵;y ——上层的特征矩阵;b ——当前层的偏置
l
l-1
[11]
[10]
小波神经网络(WNN) 和 BP 神经网络(BP) 向量。
等。但研究者发现,ANN 难以学习时序数据的相
2 长短期记忆神经网络(LSTM)
关性,通常需要人工提取的历史电压数据变化特
征来建立输入与输出变量之间的关系。然而,中 随着数据维数和数据量的增加,传统的循环
压绝缘覆盖导体的电压数据具有非线性、不平稳 神经网络(RNN)的学习能力逐渐降低,并且由于
和动态变化等特点,即模型的输出不仅与当前输 标准 RNN 仅考虑相邻信息单元的影响,如果之前
入有关,与过去的输入也有关 [12] ,基于人工提取的 的信息单元与当前 RNN 单元相距太远,RNN 网
特征可能会影响数据本身的连续性,单一的输入 络可能会遗忘数据信息,从而降低神经网络的学
输出模型关系的建立也可能会降低检测精度。 习能力。然而,LSTM 模型可以解决这个问题。
为提高检测 PD 活动的精度,本文提出一种 与 RNN 相比,LSTM 在其单元中增加了 3 个特殊
基 于 卷 积 神 经 网 络 — 长 短 期 记 忆 神 经 网 络 门,即输入门、遗忘门和输出门。LSTM 的内部结
(CNN-LSTM)的 PD 活动检测模型。该方法利 构如图 1 所示。
用 CNN 从采集的历史电压数据序列中提取有效
的特征向量,并采用 LSTM 对 CNN 所提取的特
征的动态变化进行建模学习。该模型综合利用
CNN 和 LSTM 的结构优势,能有更有效地分析处
理绝缘架空线路中电压数据的变化,从而精准地
检测 PD 活动的发生。试验表明,与典型方法相
比,本文所提方法具有更高的识别精度。
1 卷积神经网络(CNN)
图 1 长短期记忆神经网络的内部结构
近年来,卷积神经网络在实际应用中取得了
三个门的计算公式如下:
巨大的成功,尤其是在图像分类领域。深度卷积
I t = σ (W i × X t + Z i × Y t - 1 + b i) (4)
神经网络是一种由分层排列的可训练层组成、能 F t = σ (W f × X t + Z f × Y t - 1 + b f)
够学习有效的特征表示的神经网络结构。在图像 (5)
O t = σ (W o × X t + Z o × Y t - 1 + b o) (6)
分类任务中,典型卷积层包含输入 I 和卷积核 K,
式中 σ——Sigmoid 激活函数;W i,W f,W o,Z i,Z f,
二维卷积定义如下:
Z o——每个门的权重矩阵;b i,b f,b o——对应的偏
j
j
S( i,) =( I × K)( i,) =
)
I
∑∑ ( m,n K ( i - m,j - n ) (1) 置向量。
m n 输入数据 N t 如下式所示:
由于要处理的数据是一维电压波动信号,因 N t = th(W t × X t + Z t × Y t - 1 + b t) (7)
此对于每个卷积层执行一维卷积。当 m=1 时,式 式 中 th——tanh 激 活 函 数 ;W t,Z t—— 权 重 矩
(1)即表示一维卷积。具体来说,一维卷积可以用 阵;b t——输入偏置矢量。
以下方程来计算: 获得三个门状态和输入信息后,中间变量 M t
C ij = ϕ( k n × 1 x i:i + n + b ij) (2) 可以描述如下:
l
i
j

