Page 47 - 电力与能源2022年第五期
P. 47

彭   昕, 等: 基于密度的聚类算法与改进拉依达准则的 95598 工单处理方法                            4 9
                                                                                                      0
                                                               标替代。
                                                                   ( 3 ) 利用 DBSCAN 对坐标数据进行聚类, 对
                                                               各坐标所属类别进行标记, 检测出的离群点利用
                                                               抄表段中心坐标替代。
                                                                   ( 4 ) 利用改进拉依达准则逐个判断各坐标是否
                                                               需要纠正, 若需要, 可利用抄表段中心坐标替代。

























                                                                            图 7  模型基本技术路线
                          图 5  改进拉依达准则技术路线
                                                              5  故障情况可视化

                                                                   若要整体分析某区域拨打 95598 工单信息,
                                                               采用表格的方式局限性较大且不直观, 不能直观
                                                               地观察出区域内何处故障较多。因此, 本文利用
                                                               实际地图绘制出热力图, 直观地展示各处的故障
                                                               情况, 可视化 95598 工单信息。为进一步提升热
                                                               力图可视化系统的可读性与可重复性, 利用 Java
                                                               编写网页实现以下功能。
                           图 6  标准正态分布示意图                          ( 1 ) 热力图应在实际地图上生成, 而并非简单
              偏离经纬度中心的坐标为异常值, 如城市郊区一                           地在二维坐标平面上生成。
              般偏离经纬度中心较远, 直接利用经纬度坐标判                               ( 2 ) 绘制热力图的坐标数据应为独立文件, 不
              断可能导致异常坐标均为郊区坐标, 考虑到本文                           集成在代码中, 以方便替换其他文件, 实现快速替
              数据中抄表段数据相同往往代表地理位置相近,                            换数据绘制热力图。
              若偏离抄表段中心过远则其往往为异常值, 可采                               ( 3 ) 由于在实际地图上绘制, 地图上非待分析
              用待检测坐标与抄表段中心坐标的距离作为检测                            区域应遮罩处理, 待分析区域应高亮处理, 待分析

              对象, 即过度偏离抄表段中心被认为是异常坐标。                          区域与非待分析区域应有明显的边界, 地图的显
                   综上所述, 本文模型实现的基本技术路线如                        示要素如文字标注、 道路名称等应能根据需要开

              图 7 所示, 基本步骤如下。                                  启或关闭。
                   ( 1 ) 将工单数据按照抄表段排序, 提取其中的
                                                              6  算例分析
              故障地址以及抄表段信息。
                   ( 2 ) 将故障地址逐个利用工具转换为经纬度                         为说明所提方法的有效性, 采用 2021 年上海
              坐标, 将无法转换的错误地址利用抄表段中心坐                           市嘉定区 95598 工单数据共 21147 条利用本文
   42   43   44   45   46   47   48   49   50   51   52