Page 42 - 电力与能源2023年第二期
P. 42
136 张一彦,等:购售同期情况下的异常数据治理方式及分析
日用电量(kWh)/该用户变压器装接功率(kVA)。 行业为“汽车”,行业的日均电量分析就可以通过
当最大用电小时数在 0~24 h 时,认为校核通过, 整理好的数据库分析出来。异常数据自动化处理
该用户当日用电量正常(包含界限值);当最大用 小工具系统流程如图 1 所示。
电小时数小于 0 h,该用户用电量为负,怀疑数据
异常。当最大用电小时数大于 24 h,该用户以最
大功率工作时间超过 24 h,用电量过多,怀疑数据
异常。
1.3 异常数据自动化处理小工具系统结构
根据行业分类及异常数据认定方案编制了异
常数据自动化处理小工具。
1.3.1 系统框架
异常数据自动化处理小工具系统采用基于
PHP+Laravel 的框架。Laravel 框架可以快速支
图 1 异常数据自动化处理小工具系统流程
持用户身份验证登录,具有模块化的包系统且有
专属的包库,提供快速的模块式开发和许多种类 2 用电量特征描述方法
的关连式数据库方式,还可以提供工具来协助应
电力需求具有反映宏观经济趋势的先行作
用 程 序 的 部 署 和 维 持 ,并 且 发 展 出 许 多 语 法 。
用。日用电量可以及时反映用户的生产经营发展
Laravel 与 Symfony,Zend,CodeIgniter,Yii2 等 框
情况,通过分析、预测用电态势及发展规律对服务
架一起被视为最受欢迎的 PHP 框架之一。通过
地区、行业、能源、用户的发展具有重要意义。
Laravel 成熟模块,可以在整理和统计数据时利用
用户用电量分析和预测方法主要建立在各种
Excel导入模块直接将企业的源数据导入 Sql数据
数理统计理论的基础之上,下面介绍采用的数学
库中,从而方便后续分析,为数据统计创造条件。
方法。
在未来的扩展中,也可以通过 Laravel 的特性进行
2.1 点估计和区间估计
模块式的迭代和增加。同时因为每个 Control 类
由一个数给定的总体参数估计称之为该参数
映射不同的视图层,既可以相互之间不影响逻辑
的点估计。由包含参数的两个数的区间给定的总
和功能,也方便维护。
体参数估计称之为该参数的区间估计。
1.3.2 数据库系统
MySQL 是一个关系型数据库管理系统,是最 总体参数的置信区间估计:令 µ s 和 σ s 是一个
流行的关系型数据库管理系统之一。在 WEB 应 统 计 量 S 的 抽 样 分 布 的 均 值 和 标 准 差(标 准 误
用方面,MySQL 将数据保存在不同的表中,而不 差)。若 S 的抽样分布近似于正态(若样本量 n≥
是将所有数据放在一个大仓库内,这样就增加了 30,这 对 许 多 统 计 量 是 真 实 的),可 期 望 S 约
速度并提高了灵活性。通过 MySQL 的可视化程 68.27%,95.45% 和 99.73% 分 别 落 在 区 间(µ s −
序,可以方便地进行备份和还原。配合 Laravel 框 σ s,µ s+ σ s )、(µ s − 2σ s,µ s+2σ s )和(µ s − 3σ s,µ s+3σ s )
架快速开发的特点,MySQL 作为轻量级的关系型 内。因此,称这些区间分别是 68.27%,95.45%,
数据库管理系统,具有非常轻便、快速、开发快等 99.73% 对于估计 µ s 的置信区间。
特点。 2.2 坐标曲线
1.3.3 系统流程图 坐标曲线用于显示月用电量曲线和未来发展
将源数据每个文件导入系统后,再整理每个 趋势,是通过对原始数据进行加工处理,以数值为
企业对应的行业,如上汽大众汽车有限公司,标注 纵坐标,日期为横坐标绘制出的相应曲线。

