Page 119 - 电力与能源2023年第六期
P. 119

彭   昕,等:基于供电服务信息的数据挖掘方法                                     665

                生故障的主要类型和故障频次进行统计,建立热                            的地址解析模型对故障地址信息进行特征提取得到
                力图生成单元,对高频故障地址和故障频次进行                            特征向量,然后对特征向量进行条件约束获得地址
                可视化展示。                                           标签序列,最后进行聚类得到高频故障小区地址信
                    数据挖掘方法运行流程如图 3 所示。                           息。记录高频故障工单的驻点、小区地址、故障频次、
                                                                 主要故障类型、主要故障频次及主要故障占比等,并
                                                                 将其整理为高频故障统计表。

                                                                 5.2 可视化热力图生成
                                                                     本文利用关键信息数据集对故障高频小区发
                                                                 生故障的主要类型和故障频次进行统计,建立热
                                                                 力图生成单元,对高频故障地址和故障频次进行
                                                                 可视化展示。

                                                                 6 结语

                                                                     本文设计了一种基于供电服务信息的数据挖

                                                                 掘方法,包含供电数据提取模块、供电数据处理模
                                                                 块和供电数据特征识别模块。
                                                                    (1)供电数据提取模块基于电网的供电服务
                                                                 信息主要负责提取历史故障抢修工单中的故障地
                                                                 址、故障类型、用户抄表段等信息,形成信息挖掘
                                                                 数据集;然后根据故障类型对信息挖掘数据集中
                                                                 的用户误报信息进行筛选,排除非电力故障数据
                                                                 对信息挖掘工作的干扰,形成关键信息数据集。
                            图 3 数据挖掘方法运行流程
                                                                    (2)为实现高频故障地址的聚类,需首先对故
                5 算例分析                                           障地址进行解析,准确识别地址文本中的各关键
                                                                 地 址 要 素 。 供 电 数 据 处 理 模 块 建 立 BERT-
                    为了证明本文提出的基于供电服务信息数据
                                                                 BIGRU-CRF 模型对故障地址信息进行处理。
                挖掘方法的可行性,以某地区供电服务信息工单
                                                                    (3)供电数据特征识别模块对高频信息进行
                为基本算例,使用该方法进行高频故障地区故障
                                                                 聚类分析和高频故障热力图可视化表征。
                类型与故障频次的提取及可视化热力图的生成。
                                                                     最后通过实际算例证明了本文提出的方法能
                5.1 高频故障地区故障类型与频次的提取
                                                                 够通过挖掘历史供电服务信息,寻找出供电服务
                    该地区供电服务工单信息的原始数据中记录
                                                                 中的薄弱环节,提高供电服务质量。
                了多种信息,包含:工单信息来源、工单编号、通知
                抢修时间、恢复送电时间、故障地址、故障原因分                           参考文献:
                析、报修内容、报修人信息、工单处理情况及抄表                          [1]  陈  徽 . 基于云平台的电力数据处理系统的设计与实现
                                                                    [J] 电器工业,2022(10):51-54.
                                                                       .
                段编号等。
                                                                [2]  宋  灿,朱   青,王  慧 . 基于大数据的电力运营监控数据
                    本文设计的数据挖掘方法首先通过供电数据提                             处理技术[J] 电子技术,2022,51(6):232-233.
                                                                              .
                取模块获得供电服务信息数据集(包括故障地址、故                         [3]  吴柯蓉 . 基于大数据分析方法的电力 95598 服务质量提升
                                                                     研究[D] 南宁:广西大学,2021.
                                                                           .
                障类型、抄表段编号等),然后筛选掉其中的非电力
                                                                [4]  武文梁 . 基于力大数据的 95598 用户画像及其行为评估研
                故障工单,得到关键信息数据集;接下来供电数据处                              究[D] 南宁:广西大学,2020.
                                                                         .
                理模块通过本文建立的基于 BERT-BIGRU-CRF                                                   (下转第 669 页)
   114   115   116   117   118   119   120   121   122   123   124