Page 21 - 电力与能源2021年第三期
P. 21

黄星知, 等: 基于小波分解技术和随机森林算法的负荷概率预测                                   2 3
                                                                                                      8
              于 GBRT 的 基 准, 因 此 只 将 DT-CWT-GBRT-B              负 荷 。
              添加到比较分析中。
                   ( 8 ) 初步基准: 初步基准( N-B ) 是基于负荷的             3  仿真分析
              持久性的     [ 14 ] 。假设负荷在整个预测提前期内保                      下面介绍仿真中使用的数据以及使用所提方
              持恒定, 并且每个预测分位数是最后一个观测值                           法得到的预测结果, 并与通过基准模型得到的结
              ( 即预测起点处的负荷), 则该基准可以提供一个                         果进行比较。日前( 1~24h ) 提供每小时分辨率
              无偏见、 易于复制的参考。                                    的负荷预 测, 此 外, 在 α q =0.01 , 0.02 ,…, 0.99
              2.2  误差指数                                        时, 对于每个预测值有 Q=99 个分位数。所提方
                   本文主要利用弹球损失( PinballLoss , 简称                法 包 括 DWT-QRF / RF-M , WPT-QRF / RF-M ,
              PL ) 来比较预测结果。 PL 是一个严格正确的分                      SWT-QRF / RF-M 和 DT-CWT-QRF / RF-M , 分
              数, 同时解决了预测的可靠性和清晰度问题。                            解层级数为 4 , 以便根据每日季节性分离分量。
                   对于给定的预 测 范 围 和 分 位 数 水 平, PL 计             3.1  数据特征
              算公式为                                                 本文使用 的 数 据 是 由 GEFCOM 2014 的 第
                                                               一个任务 1 区提供的, 预测系统根据 2005 年 1 月
                                 (
                    ( α )  [   ^ α )             ^ α )
                                                   (
                                                    q }]
                P L , h  q  = P h -P h q ][ α q -1 { P h ≤P h
                                                              1 日至 2010 年 9 月 30 日的每小时数据进行训练,
                                                       ( 1 )
                                                               测试期为 2010 年 10 月 1 日至 2011 年 9 月 30 日
                   总 P L 是通过 Q 分位数水平求和并通过预测
                                                               ( 即预测实例)。
              总数 U 求 平 均 得 到 的, P L 是 一 个 正 的、 反 向 分
                                                                   在两种不同的场景下分别进行仿真。第一种
              数, 因此较小的 P Ls 表明了更好的概率预测。
                                                               场景( SC1 ) 下, 不使用温度作为 RF 和 QRF 的外
                   采用可靠性评估从概率预测中得到预测区间
                                                               部预测因子, 以便在只有历史负荷可供预测的情
              的一致性, 通常通过可靠性图或平均绝对覆盖误
                                                               况下校验预测性能。第二种场景( SC2 ) 是一个基
              差 ( Avera g e Absolute Covera g e Error ,简 称
                                                               于温度的场景, 使用 GEFCOM2014组织者提供的
              AACE ) 指数来进行评估。
                                                              25个气象站的平均温度作为外部预测因子, 以提
                   本文考虑用可靠性图综合评 价 方 案 的 可 靠
                                                               高预测性能     [ 6 ] 。在这两种情况下, 对一天中的一小
              性, 并用 AACE 给 定 负 荷 预 测 和 标 称 覆 盖 率,
                                                               时、 一周中的一天、 一个月中的一天和一年中的一
              AACE ( 百分比) 是标称覆盖率和估计覆盖率之间
                                                               个月使用日历进行定性预测, 这些日历预测值与文
              的平均绝对差:
                                                               献[ 14 ] 相同, 负荷及温度数据集统计参数见表1 。
                                           Q
                                        1                              表 1  负荷及温度数据集统计参数
                           A AACE =100    ∑
                                %       Q
                                          q=1                      变量        平均值        中位数       标准偏差
                                U
                                            (
                             1            ^ α )                  负荷 / MW    146.89     135.90      47.42
                        α q -  ∑  1 { P h ≤P h q }     ( 2 )
                             U u=1    u     u                     温度 / ℃     16.21      17.31      9.10
                   其中, 较小的 A AACE 值表示更可靠的预测。                  3.2  方法的实施
                   采用清晰度评估从概率预测中获得的预测区                             下面主要讨论 QRFs和 RFs在 MATLAB 中的
              间的宽度, 通常是通过预测区间归一化平均宽度                           训练和运行, 而 GBRT 是在 R 语言中训练和运行的。
              ( PredictionIntervalNormalizedAvera g eWidth ,       建立一 年 每 小 时 预 测 所 需 的 平 均 时 间 ( 即
              简称 PINAW ) 来进行评估。给定U 个预测、 一个                    8760 个预测实例) 如表 2 所示。
              标准 值P 和 标 称 预 测 间 隔 率 , 该 间 隔 率 下 的                            表 2  平均计算时间
                                          ρ
              PINAW :                                                         平均计算                  平均计算
                                                                   预测方法                  预测方法
                                                                               时间 / h                时间 / h
                                      (
                                 U ^ 0.5 + ρ / 2 )  -P h
                                                (
                                              ^ 0.5 - ρ / 2 )
                                    P h
                        ()
                  P PINAW ρ =  1 ∑    u         u      ( 3 )    DWT-QRF / RF-M  26.37    GBRT-B      2.36
                              U u= 1        ρ                   WPT-QRF / RF-M  16.42  DT-CWT-QRF-B  59.34
                   越 小 的 P PINAW 值 表 示 预 测 越 清 晰 。 本 文          SWT-QRF / RF-M  15.89  WPT-QRF-B2   17.95
                                                               DT-CWT-QRF / RF-M 16.49  DT-CWT-QRF-B2  32.97
              考 虑 了 两 个 标 称 预 测 间 隔 率 ( 0.1 和 0.9 ) 下
                                                                   QRF-B1       2.14 DT-CWT-RF / QRF-B 3.25
              的 P PINAWs 并 且 P 是 训 练 期 间 的 最 大 观 测                 QRF-B2       2.07  DT-CWT-GBRT-B  8.68
                        ,
   16   17   18   19   20   21   22   23   24   25   26