Page 119 - 电力与能源2023年第六期
P. 119
彭 昕,等:基于供电服务信息的数据挖掘方法 665
生故障的主要类型和故障频次进行统计,建立热 的地址解析模型对故障地址信息进行特征提取得到
力图生成单元,对高频故障地址和故障频次进行 特征向量,然后对特征向量进行条件约束获得地址
可视化展示。 标签序列,最后进行聚类得到高频故障小区地址信
数据挖掘方法运行流程如图 3 所示。 息。记录高频故障工单的驻点、小区地址、故障频次、
主要故障类型、主要故障频次及主要故障占比等,并
将其整理为高频故障统计表。
5.2 可视化热力图生成
本文利用关键信息数据集对故障高频小区发
生故障的主要类型和故障频次进行统计,建立热
力图生成单元,对高频故障地址和故障频次进行
可视化展示。
6 结语
本文设计了一种基于供电服务信息的数据挖
掘方法,包含供电数据提取模块、供电数据处理模
块和供电数据特征识别模块。
(1)供电数据提取模块基于电网的供电服务
信息主要负责提取历史故障抢修工单中的故障地
址、故障类型、用户抄表段等信息,形成信息挖掘
数据集;然后根据故障类型对信息挖掘数据集中
的用户误报信息进行筛选,排除非电力故障数据
对信息挖掘工作的干扰,形成关键信息数据集。
图 3 数据挖掘方法运行流程
(2)为实现高频故障地址的聚类,需首先对故
5 算例分析 障地址进行解析,准确识别地址文本中的各关键
地 址 要 素 。 供 电 数 据 处 理 模 块 建 立 BERT-
为了证明本文提出的基于供电服务信息数据
BIGRU-CRF 模型对故障地址信息进行处理。
挖掘方法的可行性,以某地区供电服务信息工单
(3)供电数据特征识别模块对高频信息进行
为基本算例,使用该方法进行高频故障地区故障
聚类分析和高频故障热力图可视化表征。
类型与故障频次的提取及可视化热力图的生成。
最后通过实际算例证明了本文提出的方法能
5.1 高频故障地区故障类型与频次的提取
够通过挖掘历史供电服务信息,寻找出供电服务
该地区供电服务工单信息的原始数据中记录
中的薄弱环节,提高供电服务质量。
了多种信息,包含:工单信息来源、工单编号、通知
抢修时间、恢复送电时间、故障地址、故障原因分 参考文献:
析、报修内容、报修人信息、工单处理情况及抄表 [1] 陈 徽 . 基于云平台的电力数据处理系统的设计与实现
[J] 电器工业,2022(10):51-54.
.
段编号等。
[2] 宋 灿,朱 青,王 慧 . 基于大数据的电力运营监控数据
本文设计的数据挖掘方法首先通过供电数据提 处理技术[J] 电子技术,2022,51(6):232-233.
.
取模块获得供电服务信息数据集(包括故障地址、故 [3] 吴柯蓉 . 基于大数据分析方法的电力 95598 服务质量提升
研究[D] 南宁:广西大学,2021.
.
障类型、抄表段编号等),然后筛选掉其中的非电力
[4] 武文梁 . 基于力大数据的 95598 用户画像及其行为评估研
故障工单,得到关键信息数据集;接下来供电数据处 究[D] 南宁:广西大学,2020.
.
理模块通过本文建立的基于 BERT-BIGRU-CRF (下转第 669 页)

