Page 50 - 电力与能源2023年第六期
P. 50
596 颜昕昱,等:基于改进 K‒Means++聚类分析的邻户表计错接辨识方法
下述两种情况:一是由用户来电反映电费与实际用 1.1 负荷曲线的统计特征表述
电不符情况,经现场勘查后发现邻户错接现象;二是 用户电力负荷作为典型的时序信号,其波动
在错接后因轮换、抢修、校表、通信故障等原因装接 性、周期性、幅值等性质都较明显。在实际监测采
人员赶赴现场再一次进行调表作业时发现接线错 集数据过程中,使用单个时刻点的功率值无法有
误 [6-8] 。以往错接现象的发现均属“被动”知晓,因邻 效表征用户的整体负荷特征,故需要以用户负荷
户错接问题并不会影响表计正常计量运行,采集系 曲线为基础,通过多维度统计量刻画出用户用电
统仍正常采集用户的用电数据,不会引发系统报警, 情况的规律与特点 [13] 。
故供电公司无法主动发现错接问题 [9-10] ,从而导致表 本文选取均值、标准差、峭度这 3 个统计维度
计错接的时间往往较长,供电企业与用户双方经济 来重新描述用户的电力负荷曲线 [12] 。其中,均值
损失较大,引发用户的强烈投诉意向。 用于反映用户某时间段电量数据的集中趋势与平
如果采取线下派遣勘查人员逐户排查的方式 均水平,标准差用于描述某段时间电量数据的波
动情况与离散程度,峭度主要用于表征电量数据
进行错接辨识将花费大量的时间与人力,工作量
的统计分布形态。
极大、排查效率极低。因此,急需研究一种新的辨
式(1)~式(3)分别为这 3 个统计量的定义及
识方法,通过线上数据分析的方式定期监测用户
计算公式:
用电量数据,及时发现邻户电表错接问题,从而使
1 n
表计错接问题由原先的“被动”知晓转变为“主动” m = ∑ w i (1)
n
发现 [11] ,以避免供电企业与用户双方的损失进一 i = 1
n é n ù 2
1
步扩大,并缩小表计错接对供电公司社会形象和 1 ê ê ê ( ) ú ú
s = n ∑ê w i - n ∑ x j ú ú (2)
ê ê
公众信任程度的影响,从而保证电力市场改革有 i = 1 ë j = 1 û
序推进。 ì ü 4
ï ï
ï ï
n
ï
本文参考电力用户负荷曲线分类相关的研究 ï w i - 1 ∑ w e ) ï ï
ï ï
ï
ï
1 ï ï ( n ï ï
思路 [12-16] ,提出一种基于改进 K 均值聚类分析的 g = í e = 1 ý (3)
n ï ï 2 ï ï
n
1
单相电表邻户错接辨识的方法。经实际案例分析 ï ï 1 n é ê ê ê ( ) ù ú ú ï ï
ï ï n ∑êw j - n ∑ w f ú ú ï ï
ê ê
验证,所提方法能够准确辨识出邻户表计错接现 ï ï j = 1 ë f = 1 û ï ï
þ
î
s
象,可作为异常接线判定的有效依据。 式中 m,,g——电量数据的均值、标准差和峭度;
w——数据点;n——电量数据集中数据点的总数。
1 方法原理
居民用户曲线在多维统计空间中的表述如图
单 相 表 邻 户 错 接 线 示 意 见 图 1。 2 所示。图 2(a)为某 8 kW 居民用户在一年内的日
用电量曲线,通过均值、标准差、峭度进行重新刻画
后,其在多维特征空间中的表述如图 2(b)所示。
1.2 K-means++聚类分析原理
将电量数据集中在某些特征相似的对象进行
分类的过程称为聚类。聚类后同一个簇中的对象
彼此相似,与其他簇中的对象相异。
图 1 单相表邻户错接线示意 K 均值聚类(即 K-means 聚类)是一种高效、
由图 1 可以看出,用户 1 的实际用电量如果被 简洁的聚类分析算法 [15] 。该方法能根据需求设定
用户 2 的电能表抄收,而用户 2 的实际用电量如果 聚类数量 K,随机选择数据集中 K 个对象作为初
被用户 1 的电能表抄收,将导致出账时用户双方 始聚类中心后,然后计算数据集中每个对象与各
支付对方的电费。 个聚类中心之间的距离,并将各个对象分配给距