Page 47 - 电力与能源2022年第五期
P. 47
彭 昕, 等: 基于密度的聚类算法与改进拉依达准则的 95598 工单处理方法 4 9
0
标替代。
( 3 ) 利用 DBSCAN 对坐标数据进行聚类, 对
各坐标所属类别进行标记, 检测出的离群点利用
抄表段中心坐标替代。
( 4 ) 利用改进拉依达准则逐个判断各坐标是否
需要纠正, 若需要, 可利用抄表段中心坐标替代。
图 7 模型基本技术路线
图 5 改进拉依达准则技术路线
5 故障情况可视化
若要整体分析某区域拨打 95598 工单信息,
采用表格的方式局限性较大且不直观, 不能直观
地观察出区域内何处故障较多。因此, 本文利用
实际地图绘制出热力图, 直观地展示各处的故障
情况, 可视化 95598 工单信息。为进一步提升热
力图可视化系统的可读性与可重复性, 利用 Java
编写网页实现以下功能。
图 6 标准正态分布示意图 ( 1 ) 热力图应在实际地图上生成, 而并非简单
偏离经纬度中心的坐标为异常值, 如城市郊区一 地在二维坐标平面上生成。
般偏离经纬度中心较远, 直接利用经纬度坐标判 ( 2 ) 绘制热力图的坐标数据应为独立文件, 不
断可能导致异常坐标均为郊区坐标, 考虑到本文 集成在代码中, 以方便替换其他文件, 实现快速替
数据中抄表段数据相同往往代表地理位置相近, 换数据绘制热力图。
若偏离抄表段中心过远则其往往为异常值, 可采 ( 3 ) 由于在实际地图上绘制, 地图上非待分析
用待检测坐标与抄表段中心坐标的距离作为检测 区域应遮罩处理, 待分析区域应高亮处理, 待分析
对象, 即过度偏离抄表段中心被认为是异常坐标。 区域与非待分析区域应有明显的边界, 地图的显
综上所述, 本文模型实现的基本技术路线如 示要素如文字标注、 道路名称等应能根据需要开
图 7 所示, 基本步骤如下。 启或关闭。
( 1 ) 将工单数据按照抄表段排序, 提取其中的
6 算例分析
故障地址以及抄表段信息。
( 2 ) 将故障地址逐个利用工具转换为经纬度 为说明所提方法的有效性, 采用 2021 年上海
坐标, 将无法转换的错误地址利用抄表段中心坐 市嘉定区 95598 工单数据共 21147 条利用本文

