Page 55 - 电力与能源2023年第四期
P. 55

邵佳佳,等:面向电力市场交易的客户电量预测技术研究                                      361

                分量造成的影响作用。因此,在随机分量占比较                            控期间。构造疫情封控特征,若当日处于疫情封
                小或其震荡波动较小的场景下,上述模型具有较                            控期间,则疫情封控特征为 1,否则为 0。在此基
                好的预测效果。此外,在随机分量占比较大或其                            础上,定义疫情封控日数特征,计算各月疫情封控
                震荡波动较大的场景下,上述模型的输出可以作                            特征为 1 的日数。
                为电费专职人员的决策依据。                                    3.3 预测框架
                                                                     整体预测框架如图 2 所示。首先,采用基于
                3 面向电力市场交易的电量预测框架
                                                                 季节趋势分解的电量预测方法,计算得到总体电
                3.1 目标                                           量 的 预 测 数 值 ,记 为 A;其 次 ,采 用 XGBoost/
                    用 户 分 类 明 细 如 表 1 所 示 。 在 每 月 月 末 对          Light GBM 等集成学习方法,计算得到总体电量

                表 1 所列用户类型的聚合电量进行隔月月度预                           的预测数值,记为 B;接着,根据随机分量的总体
                测。其中,一级分类包括保供和非保供,市场交易                           占比大小及其历史震荡波动水平,在 A 和 B 中进
                用户单列一类。保供用户细分为居民和农业,非                            行选择;最后,若选择 A,则进一步根据预测月的
                保供用户细分为一般工商业和大工业。考虑到不                            气象、日历等特征的预期(例如是否受到台风、暴
                同电压等级用户的用电行为存在差异,进一步将                            雨等异常天气影响,是否受到疫情、贸易战等重大
                二级分类划分为高压和低压。                                    事件影响),在预测结果的下限、基线、上限中进行

                              表 1 用户分类明细                         选择。
                    一级分类            二级分类           三级分类
                                      居民             −
                      保供                             高压
                                      农业
                                                     低压
                                                     低压
                                    一般工商业
                                                     高压
                     非保供
                                                     低压
                                     大工业
                                                     高压
                                      低压             −
                    市场交易
                                      高压             −
                3.2 特征工程
                    将小时粒度/日粒度的气象、日历、疫情等非
                电特征转换为月粒度的聚合、增广特征。其中,气                                           图 2 预测框架

                象类型特征包括温度、湿度、降雨量及其派生;日
                                                                 4 测试评估
                历类型特征包括月份、月内工作日数、月内周末日
                数、月内法定节假日数;疫情类型特征包括是否处                           4.1 数据集
                于疫情风控、月内疫情风控日数等。此外,考虑到                               收集各用户分类的电量及同期非电特征的历
                春节假期对电量的显著影响,单列春节节假日数。                           史数据,时间范围为 2012 年 1 月至 2022 年 12 月,
                    部分重要特征的构建方式如下。                               粒度为每月 1 点。
                    (1)相对温度。根据公式构造相对温度,其中                        4.2 测试结果

                的临界低温 T L 和临界高温 T H 是以相对温度 T R 与                     对 2022 年 7~12 月的各用户分类的月电量建
                同期电量的皮尔逊相关系数最大时的取值为准。                            立预测模型,预测结果如表 2 所示。其中,机器学
                         ì T L - T    (T < T L )                 习模型采用 XGBoost 算法构建。
                         ï ï
                         ï ï
                                      (T > T H )        (1)          从用户分类看,居民、非保供、高压非保供一
                    T R = í T - T H
                         ï ï
                         ï ï  0    (T L ≤ T ≤ T H )              般工商业低压、市场交易高压用户的预测效果较
                         î
                    (2)疫情封控。将 2022 年 4~6 月作为疫情封                  为理想,所有月份的预测误差在 10% 左右;农业
   50   51   52   53   54   55   56   57   58   59   60