Page 24 - 电力与能源2021年第八期
P. 24
3 9 0 温立超, 等: 基于距离的离群点算法和三相不平衡电流分析的用户窃电研究
帕累托图, 如图 1 所示。 过 X i 与 X j 之间的距离D ( X i X j
, ) 来衡量两者之
间的差异, 距离越大, 两者越相异:
, )
(
2
2
D ( X i X j = ( V i1 -V j 1 ) + … + V im -V j m )
( 1 )
3 窃电算法及筛选流程
3.1 欠流法
上海地区低压用户均采用三相四线制接法,
考虑实际负荷特 性及计量装置的计量准确度影
响, 正常用电情况下三相电流会有一定偏差, 但应
该在一定范围内波动。这里选定三相电流不平衡
图 1 窃电方式帕累托图
率绝对值r 作为研究值。
由图 1 可知, 欠压法和欠流法是主要的窃电
(
)/
I 0 = I a+I b +I c 3 ( 2 )
方式。传统的反窃电模式是结合低压台区线损率
(
)/
r x = I x -I 0 I 0 ( 3 )
和用户电量变化的关联性分析来开展疑似窃电用
式中 I x ———相电流; I 0 ———三相平均负荷电流。
户的定位, 进而进行现场排查及取证。实际现场
目前用电信息采集系统中有 96 点冻结电流
排查结果证明, 这种方法成功率约在 30% 。虽然
数据, 如果采取欠流法进行窃电, 其电流不平衡率
这种分析方法有一定成效, 但是在用能信息如电
可能会隐藏一定的规律。选取上海市松江区未发
压、 电流一天 96 个点数据实现冻结功能后, 该方
生窃电纪录的 50 个台区的 305 个三相用户, 计算
法显得有点过时。电压值有基准值, 通过欠压方
一天内所有用户对象距质心( 取三相平衡时r a=
式进行窃电比较容易被发现, 而电流值会根据用
r b= r c=0 为质心) 的欧几里得距离:
电情况发生变化, 因此比较难发现异常。本文利
96 2 2 2 ) ( 4 )
用离群点理论对海量的日冻结电流数据进行数据 d x-0 = ∑1 ( r a1 + r b1 + r c1
分析, 并提出一种定位疑似窃电用户的分析思路。 各对 象 距 离 质 心 的 欧 几 里 得 距 离 分 布 见
表 1 。
2 离群点理论 表 1 各对象距离质心的欧几里得距离分布
离群点检测作为数据挖掘领域研究的重要组 d x 范围 包含对象数 分布比率 / %
0~110.16 230 75.41
成部分, 致力于发掘庞大信息集合中所占比例极
110.16~201.68 57 18.69
小的一部分特殊数据。这部分特殊数据具有明显 201.68~269.28 18 5.90
的不同于其他数据的离群特征, 往往蕴含着真实 由表 1 可知, 大部分正常用电户距离质心的
却又出乎意料的现实意义或知识价值。 距离分布在[ 0 , 201.68 ] 区间, 占比为 94.1% 。由
目前研究人员根据不同的应用场景, 提出了 此可将距离质心大于 201.68 的用电户, 列入疑似
窃电嫌疑。根据基于距离的离群点检测方法可以
多种不同离群点检测算法, 主要有基于统计( Dis-
tance-Based ) 的方法、 基于距离的方法、 基于密度 判定, 若有至少 94.1% 数量的对象距某对象的距
的方法、 基于聚类的方法、 基于深度的方法等 [ 2 ] 。 离超过 201.68 , 该对象可以认为是一个离群点,
本文选取基于距离的方法来对异常的离散数据进 则基于距离的离群点检测参数 p ct 为 94.1% , 距
行检测。基于距离的方法通过对数据集 T 指定 离 D 为 201.68 。因此, 将距离质心大于 201.68
距离参数 D 与比例参数P , 进而规定与数据集 T 用户, 列入疑似窃电用户。
中大于比例P 的点的距离大于 D 的对象为离群 3.2 不平衡电流的影响
点。目前, 针对基于距离的离群点检测常用距离 有些三相用户存在严重的三相电流不平衡情
、 为两个 m 况, 对于此类用户, 基于距离的离群点检测方法可
度量方法为欧几里得距离。设 X i X j
( , ,…, 能会出现偏差。为了尽量减少此类偏差, 结合台
( , ,…, V im
维对象, 即 X i V i1 V i2 ), X j V j 1 V j 2
)。在基于欧几里得距离的离群点检测中, 通 区线损率对不平衡电流开展进一步探讨。
V j m

