Page 24 - 电力与能源2021年第八期
P. 24

3 9 0            温立超, 等: 基于距离的离群点算法和三相不平衡电流分析的用户窃电研究

              帕累托图, 如图 1 所示。                                   过 X i 与 X j  之间的距离D ( X i X j
                                                                                          , ) 来衡量两者之
                                                               间的差异, 距离越大, 两者越相异:
                                                                   , )
                                                                                               (
                                                                                                         2
                                                                                       2
                                                              D ( X i X j =  ( V i1 -V j 1 ) +  …  + V im -V j m )
                                                                                                        ( 1 )
                                                              3  窃电算法及筛选流程
                                                              3.1  欠流法
                                                                   上海地区低压用户均采用三相四线制接法,
                                                               考虑实际负荷特 性及计量装置的计量准确度影
                                                               响, 正常用电情况下三相电流会有一定偏差, 但应
                                                               该在一定范围内波动。这里选定三相电流不平衡
                            图 1  窃电方式帕累托图
                                                               率绝对值r 作为研究值。
                   由图 1 可知, 欠压法和欠流法是主要的窃电
                                                                                (
                                                                                           )/
                                                                          I 0 = I a+I b +I c 3          ( 2 )
              方式。传统的反窃电模式是结合低压台区线损率
                                                                                 (
                                                                                         )/
                                                                            r x = I x -I 0 I 0          ( 3 )
              和用户电量变化的关联性分析来开展疑似窃电用
                                                               式中   I x ———相电流; I 0 ———三相平均负荷电流。
              户的定位, 进而进行现场排查及取证。实际现场
                                                                   目前用电信息采集系统中有 96 点冻结电流
              排查结果证明, 这种方法成功率约在 30% 。虽然
                                                               数据, 如果采取欠流法进行窃电, 其电流不平衡率
              这种分析方法有一定成效, 但是在用能信息如电
                                                               可能会隐藏一定的规律。选取上海市松江区未发
              压、 电流一天 96 个点数据实现冻结功能后, 该方
                                                               生窃电纪录的 50 个台区的 305 个三相用户, 计算
              法显得有点过时。电压值有基准值, 通过欠压方
                                                               一天内所有用户对象距质心( 取三相平衡时r a=
              式进行窃电比较容易被发现, 而电流值会根据用
                                                              r b= r c=0 为质心) 的欧几里得距离:
              电情况发生变化, 因此比较难发现异常。本文利
                                                                                  96  2   2     2 )     ( 4 )
              用离群点理论对海量的日冻结电流数据进行数据                                   d x-0 =  ∑1  ( r a1 + r b1 + r c1
              分析, 并提出一种定位疑似窃电用户的分析思路。                              各对 象 距 离 质 心 的 欧 几 里 得 距 离 分 布 见
                                                               表 1 。
              2  离群点理论                                              表 1  各对象距离质心的欧几里得距离分布
                   离群点检测作为数据挖掘领域研究的重要组                            d x 范围        包含对象数         分布比率 / %
                                                                 0~110.16         230           75.41
              成部分, 致力于发掘庞大信息集合中所占比例极
                                                               110.16~201.68      57            18.69
              小的一部分特殊数据。这部分特殊数据具有明显                            201.68~269.28      18             5.90
              的不同于其他数据的离群特征, 往往蕴含着真实                               由表 1 可知, 大部分正常用电户距离质心的

              却又出乎意料的现实意义或知识价值。                                距离分布在[ 0 , 201.68 ] 区间, 占比为 94.1% 。由
                   目前研究人员根据不同的应用场景, 提出了                        此可将距离质心大于 201.68 的用电户, 列入疑似

                                                               窃电嫌疑。根据基于距离的离群点检测方法可以
              多种不同离群点检测算法, 主要有基于统计( Dis-
              tance-Based ) 的方法、 基于距离的方法、 基于密度                 判定, 若有至少 94.1% 数量的对象距某对象的距
              的方法、 基于聚类的方法、 基于深度的方法等                   [ 2 ] 。  离超过 201.68 , 该对象可以认为是一个离群点,
              本文选取基于距离的方法来对异常的离散数据进                            则基于距离的离群点检测参数 p ct 为 94.1% , 距
              行检测。基于距离的方法通过对数据集 T 指定                           离 D 为 201.68 。因此, 将距离质心大于 201.68

              距离参数 D 与比例参数P , 进而规定与数据集 T                       用户, 列入疑似窃电用户。
              中大于比例P 的点的距离大于 D 的对象为离群                         3.2  不平衡电流的影响
              点。目前, 针对基于距离的离群点检测常用距离                               有些三相用户存在严重的三相电流不平衡情
                                             、    为两个 m        况, 对于此类用户, 基于距离的离群点检测方法可
              度量方法为欧几里得距离。设 X i X j
                                              (   ,   ,…,      能会出现偏差。为了尽量减少此类偏差, 结合台
                           ( , ,…, V im
              维对象, 即 X i V i1 V i2        ), X j V j 1 V j 2
                  )。在基于欧几里得距离的离群点检测中, 通                        区线损率对不平衡电流开展进一步探讨。
              V j m
   19   20   21   22   23   24   25   26   27   28   29