Page 68 - 电力与能源2024年第四期
P. 68

462              周   平,等:基于 CNN-LSTM 模型的绝缘架空导线局部放电识别研究

                                 M t = I t × N t        (8)
                式中  ×——矩阵乘法。
                    输入门的状态值在 0 到 1 之间,LSTM 单元
                信息 L t 和输出状态 Y t 可以由式(9)和式(10)分别
                表示。像 I t 一样,遗忘门和输出门的状态值 F t 和

                O t 的值都在 0 到 1 之间。
                                                        (9)
                             L t = M t + F t × L t - 1
                              Y t = th( L t) × O t     (10)
                3 优化器及损失函数                                                  图 2 ENET 数据集数据分布
                                                                 的示例如图 3 和图 4 所示。
                    在检测模型的训练过程中,选取自适应矩估

                计(Adam)优化算法对模型参数进行优化。Adam
                是一种可以替代传统随机梯度下降过程的一阶优
                化算法,该算法能够基于训练数据迭代更新神经
                网络的权重,使损失函数输出值达到最优。模型
                的损失函数使用 softmax 对数交叉熵损失函数,即
                                      N  C
                                                y ̂
                          L( y ̂,y) =- ∑∑  y j lg( )   (11)
                                                 j
                                     i = 1 j = 1
                式 中  N—— 样 本 个 数 ;y i—— 实 际 值 ,是 一 个                    图 3 正常类型(Non-PD Type)数据分布
                One-Hot 编码后的 C 维向量。
                    结合研究内容以检测 100 个点为例,N 为模
                型 检 测 输 出 的 点 数 即 100, y i 为 i 时 刻 标 签 的 实
                际值。

                4 试验验证与性能分析


                    ENET 数据集内每列信号包含 20 万 ms 内对
                电源线电压的 80 万次测量。当基础电网以 50 Hz                            图 4 PD 故障类型(Non-PD Type)数据分布
                的频率输电时,每个信号都包含一个完整的电网                                为了定量评估本文所提算法的性能,在数据
                运 行 周 期 。 电 网 本 身 采 用 三 相 电 源 方 案 ,故             集中随机选取 6 500 个样本作为训练集,2 000 个
                ENET 数据集内包含测量的三相数据。ENET 数                        样本作为测试集。将每个对比算法都重复 10 次
                据集包含由仪器记录的 8 712 个预标记电压信号。                       试验,计算最终准确度的平均值和标准差。将本

                每个信号都已预先标记为是 PD 活动(525)或不是                       文 算 法 与 多 层 感 知 机(MLP)、支 持 向 量 回 归
                PD 活动(8 187),数量情况如图 2 所示。                       (SVM)、全卷积神经网络(FNN),CNN、双向长
                    从图 2 可以看出,不同类型的数据数量之间                        短期记忆网络(BiLSTM)等典型 PD 活动检测算
                存在严重的不均衡问题,这无疑增加了利用神经                            法进行比较,并以准确率得分作为评估指标,试验

                网 络 模 型 检 测 PD 活 动 的 难 度 。 每 个 信 号 都 是           结果如表 1 所示。表 1 中给出了各个对比算法对
                50 Hz 的单周期电压波形,包含 800 000 个数据点。                  于正常类型和 PD 活动类型数据的检测准确度情
                    此数据集很大,因此使用了 Hadoop 分布式文                     况。分析表 1 可知,传统的机器学习模型(MLP,
                件系统(HDFS)存储格式。PD 信号和非 PD 信号                      SVM 等)对于 PD 活动检测的准确度较低,随着提
   63   64   65   66   67   68   69   70   71   72   73