Page 88 - 电力与能源2023年第二期
P. 88

182         林君豪,等:基于蒙特卡罗树搜索和 ε 约束算法的配电网源网荷储协同运行优化方法

                式 中  P max/Q max—— 线 路 传 输 容 量 上 限 ;U min,       式中 E max ——ESS 的容量;γ min,γ max——ESS 的
                                                                         ESS
                             T
                         T
                U max —— 节 点 电 压 的 上 下 限 ;ρ—— 概 率 计 算 ;          SOC 最低和最高的比率;L h——ESS 所在的用户
                ξ——机会约束上限;N E,N T——网络中边的数量                       在时刻 h 的负荷大小。
                以及联络开关的数量;C loop——网络中形成环的
                                                                 3 配电网多时段源网荷储协同优化模型
                边集合;x i——网络线路开关 i 的连接状态;x h——
                                                                    的求解方法
                h 时刻配电网开关状态的集合;N x,h,N x,h-1——h
                时刻相比于 h−1 时刻,以及全天网络开关状态变                             由于考虑了 ESS 和配电网重构操作,系统在
                化的次数上限。                                          一定时段内的运行优化是一个多时段优化问题。
                    式(7)和式(8)表示线路有功和无功功率越限                       尽管许多现有研究尝试通过数学优化方法进行求
                的机会约束;式(9)代表节点电压越限的机会约                           解,但随着电源侧和用户侧灵活资源种类的不断
                束;式(10)表示功率平衡约束;式(11)表示配电网                       丰富,很难保证可调控资源的数学模型是足够精

                避免出现孤岛及保持网络呈辐射状的约束条件;                            确且可知的,尤其是用户用电行为,如 DR 行为和
                式(12)表示重构时相邻时段开关动作次数以及全                          电动汽车行为等。因此,可以考虑采用智能优化
                天开关动作次数的上限。                                      算法进行求解。
                2.2.2 DG 出力约束                                        由于 ESS 的 SOC 和重构操作在某一时段的
                    DG 的出力应不大于其安装容量,并且在相                         行为策略只与它们在上一个时段的状态相关,因
                邻时刻的出力大小应遵循爬坡约束,可表示为                             此本文所提的优化模型具有马尔科夫性,可以使

                                 p G,i,h ≤ P s,i       (13)      用强化学习类的求解算法进行求解。
                                 p G,i,h + 1 - p G,i,h
                         -r G,i ≤             ≤ r G,i  (14)      3.1 基于蒙特卡罗树搜索的配电网多时段运行
                                     p G,i,h
                                                                     优化模型求解方法
                式 中  p G,i,h—— 第 i 个 DG 在 时 段 h 的 出 力 ;P s,i                               [18]
                                                                     蒙特卡罗树搜索(MCTS) 是一种求解多阶
                                          r
                ——第 i 个 DG 的安装容量; G,i——第 i 个 DG 的
                                                                 段序贯决策的强化学习算法。该方法将序贯决策
                功率爬/滑坡速率。
                                                                 通过构建搜索树结构的方法展开,并计算各种策
                2.2.3 用户 DR 行为约束
                                                                 略的收益,得到最优策略。在该方法中,决策开始
                    为用户制定 DR 策略时应保证完成用户的日
                                                                 前的状态视为树结构的根节点,每个阶段的行为
                用电任务,约束公式为
                                                                 策略视为树结构的各级子节点。该方法有 4 个主
                               24        24
                              ∑  L h ≥ β  ∑ L h 0      (15)      要操作:选择、展开、模拟和回溯。选择操作是指
                                   DR
                              h = 1      h = 1
                式中 β——日用电总量下限因子,当不考虑用户                           在多阶段序贯决策中的某个阶段,选择一个可行
                用电行为时可取 β=1,当考虑用户用电行为时可                          解进行后续决策的展开;展开是指针对选择的节
                                                                 点,为其新增一个下一时段/阶段的动作策略,对
                                        DR
                                                 DR
                                             0
                                                       0
                作 如 下 估 计 : β=min{Q 1 /  Q 1 ,  Q 2 /  Q 2 ,… ,
                                                                 于搜索树而言即是衍生出选择节点的子节点;模
                Q N / Q N },该式中的 N 为所用的用户历史用电数
                       0
                  DR
                据数量;Q 和 Q     DR  是用户进行 DR 前后的日用电                拟是在某个可行解展开后模拟之后的决策过程,
                         0
                                                                 并得到最终的策略收益;回溯是在完成模拟后,对
                总量。
                2.2.4 ESS 充放电功率约束                                模拟路径上的各决策节点的评估指标进行更新。
                    ESS 的充放电功率和 SOC 上下限约束可表                          MCTS 在寻优过程中需要平衡随机探索和
                示为                                               利用当前最优解这两种搜索策略,上限置信区间
                               ESS    ESS       ESS    (16)     (UCT)算法可以应用在这种平衡策略中,即通过
                          γ min E max ≤ E h  ≤ γ max E max
                                ESS    ESS   ESS                 计算决策节点的 UCT 指标来决定是否对该决策
                            -P d,max ≤ P h  ≤ P c,max  (17)
                                  ESS
                                 P d,h ≥ -L h          (18)      节点进行选择操作。
   83   84   85   86   87   88   89   90   91   92   93