Page 42 - 电力与能源2023年第二期
P. 42

136                    张一彦,等:购售同期情况下的异常数据治理方式及分析

                日用电量(kWh)/该用户变压器装接功率(kVA)。                       行业为“汽车”,行业的日均电量分析就可以通过
                当最大用电小时数在 0~24 h 时,认为校核通过,                       整理好的数据库分析出来。异常数据自动化处理
                该用户当日用电量正常(包含界限值);当最大用                           小工具系统流程如图 1 所示。
                电小时数小于 0 h,该用户用电量为负,怀疑数据
                异常。当最大用电小时数大于 24 h,该用户以最

                大功率工作时间超过 24 h,用电量过多,怀疑数据
                异常。
                1.3 异常数据自动化处理小工具系统结构
                    根据行业分类及异常数据认定方案编制了异
                常数据自动化处理小工具。
                1.3.1 系统框架
                    异常数据自动化处理小工具系统采用基于

                PHP+Laravel 的框架。Laravel 框架可以快速支
                                                                        图 1 异常数据自动化处理小工具系统流程
                持用户身份验证登录,具有模块化的包系统且有
                专属的包库,提供快速的模块式开发和许多种类                            2 用电量特征描述方法
                的关连式数据库方式,还可以提供工具来协助应
                                                                     电力需求具有反映宏观经济趋势的先行作
                用 程 序 的 部 署 和 维 持 ,并 且 发 展 出 许 多 语 法 。
                                                                 用。日用电量可以及时反映用户的生产经营发展
                Laravel 与 Symfony,Zend,CodeIgniter,Yii2 等 框
                                                                 情况,通过分析、预测用电态势及发展规律对服务
                架一起被视为最受欢迎的 PHP 框架之一。通过
                                                                 地区、行业、能源、用户的发展具有重要意义。
                Laravel 成熟模块,可以在整理和统计数据时利用
                                                                     用户用电量分析和预测方法主要建立在各种
                Excel导入模块直接将企业的源数据导入 Sql数据
                                                                 数理统计理论的基础之上,下面介绍采用的数学
                库中,从而方便后续分析,为数据统计创造条件。
                                                                 方法。
                在未来的扩展中,也可以通过 Laravel 的特性进行
                                                                 2.1 点估计和区间估计
                模块式的迭代和增加。同时因为每个 Control 类
                                                                     由一个数给定的总体参数估计称之为该参数
                映射不同的视图层,既可以相互之间不影响逻辑
                                                                 的点估计。由包含参数的两个数的区间给定的总
                和功能,也方便维护。
                                                                 体参数估计称之为该参数的区间估计。
                1.3.2 数据库系统
                    MySQL 是一个关系型数据库管理系统,是最                           总体参数的置信区间估计:令 µ s 和 σ s 是一个
                流行的关系型数据库管理系统之一。在 WEB 应                          统 计 量 S 的 抽 样 分 布 的 均 值 和 标 准 差(标 准 误
                用方面,MySQL 将数据保存在不同的表中,而不                         差)。若 S 的抽样分布近似于正态(若样本量 n≥

                是将所有数据放在一个大仓库内,这样就增加了                            30,这 对 许 多 统 计 量 是 真 实 的),可 期 望 S 约
                速度并提高了灵活性。通过 MySQL 的可视化程                         68.27%,95.45% 和 99.73% 分 别 落 在 区 间(µ s −
                序,可以方便地进行备份和还原。配合 Laravel 框                      σ s,µ s+ σ s )、(µ s − 2σ s,µ s+2σ s )和(µ s − 3σ s,µ s+3σ s )
                架快速开发的特点,MySQL 作为轻量级的关系型                         内。因此,称这些区间分别是 68.27%,95.45%,

                数据库管理系统,具有非常轻便、快速、开发快等                           99.73% 对于估计 µ s 的置信区间。
                特点。                                              2.2 坐标曲线
                1.3.3 系统流程图                                          坐标曲线用于显示月用电量曲线和未来发展
                    将源数据每个文件导入系统后,再整理每个                          趋势,是通过对原始数据进行加工处理,以数值为
                企业对应的行业,如上汽大众汽车有限公司,标注                           纵坐标,日期为横坐标绘制出的相应曲线。
   37   38   39   40   41   42   43   44   45   46   47