Page 68 - 电力与能源2024年第四期
P. 68
462 周 平,等:基于 CNN-LSTM 模型的绝缘架空导线局部放电识别研究
M t = I t × N t (8)
式中 ×——矩阵乘法。
输入门的状态值在 0 到 1 之间,LSTM 单元
信息 L t 和输出状态 Y t 可以由式(9)和式(10)分别
表示。像 I t 一样,遗忘门和输出门的状态值 F t 和
O t 的值都在 0 到 1 之间。
(9)
L t = M t + F t × L t - 1
Y t = th( L t) × O t (10)
3 优化器及损失函数 图 2 ENET 数据集数据分布
的示例如图 3 和图 4 所示。
在检测模型的训练过程中,选取自适应矩估
计(Adam)优化算法对模型参数进行优化。Adam
是一种可以替代传统随机梯度下降过程的一阶优
化算法,该算法能够基于训练数据迭代更新神经
网络的权重,使损失函数输出值达到最优。模型
的损失函数使用 softmax 对数交叉熵损失函数,即
N C
y ̂
L( y ̂,y) =- ∑∑ y j lg( ) (11)
j
i = 1 j = 1
式 中 N—— 样 本 个 数 ;y i—— 实 际 值 ,是 一 个 图 3 正常类型(Non-PD Type)数据分布
One-Hot 编码后的 C 维向量。
结合研究内容以检测 100 个点为例,N 为模
型 检 测 输 出 的 点 数 即 100, y i 为 i 时 刻 标 签 的 实
际值。
4 试验验证与性能分析
ENET 数据集内每列信号包含 20 万 ms 内对
电源线电压的 80 万次测量。当基础电网以 50 Hz 图 4 PD 故障类型(Non-PD Type)数据分布
的频率输电时,每个信号都包含一个完整的电网 为了定量评估本文所提算法的性能,在数据
运 行 周 期 。 电 网 本 身 采 用 三 相 电 源 方 案 ,故 集中随机选取 6 500 个样本作为训练集,2 000 个
ENET 数据集内包含测量的三相数据。ENET 数 样本作为测试集。将每个对比算法都重复 10 次
据集包含由仪器记录的 8 712 个预标记电压信号。 试验,计算最终准确度的平均值和标准差。将本
每个信号都已预先标记为是 PD 活动(525)或不是 文 算 法 与 多 层 感 知 机(MLP)、支 持 向 量 回 归
PD 活动(8 187),数量情况如图 2 所示。 (SVM)、全卷积神经网络(FNN),CNN、双向长
从图 2 可以看出,不同类型的数据数量之间 短期记忆网络(BiLSTM)等典型 PD 活动检测算
存在严重的不均衡问题,这无疑增加了利用神经 法进行比较,并以准确率得分作为评估指标,试验
网 络 模 型 检 测 PD 活 动 的 难 度 。 每 个 信 号 都 是 结果如表 1 所示。表 1 中给出了各个对比算法对
50 Hz 的单周期电压波形,包含 800 000 个数据点。 于正常类型和 PD 活动类型数据的检测准确度情
此数据集很大,因此使用了 Hadoop 分布式文 况。分析表 1 可知,传统的机器学习模型(MLP,
件系统(HDFS)存储格式。PD 信号和非 PD 信号 SVM 等)对于 PD 活动检测的准确度较低,随着提

