Page 88 - 电力与能源2023年第二期
P. 88
182 林君豪,等:基于蒙特卡罗树搜索和 ε 约束算法的配电网源网荷储协同运行优化方法
式 中 P max/Q max—— 线 路 传 输 容 量 上 限 ;U min, 式中 E max ——ESS 的容量;γ min,γ max——ESS 的
ESS
T
T
U max —— 节 点 电 压 的 上 下 限 ;ρ—— 概 率 计 算 ; SOC 最低和最高的比率;L h——ESS 所在的用户
ξ——机会约束上限;N E,N T——网络中边的数量 在时刻 h 的负荷大小。
以及联络开关的数量;C loop——网络中形成环的
3 配电网多时段源网荷储协同优化模型
边集合;x i——网络线路开关 i 的连接状态;x h——
的求解方法
h 时刻配电网开关状态的集合;N x,h,N x,h-1——h
时刻相比于 h−1 时刻,以及全天网络开关状态变 由于考虑了 ESS 和配电网重构操作,系统在
化的次数上限。 一定时段内的运行优化是一个多时段优化问题。
式(7)和式(8)表示线路有功和无功功率越限 尽管许多现有研究尝试通过数学优化方法进行求
的机会约束;式(9)代表节点电压越限的机会约 解,但随着电源侧和用户侧灵活资源种类的不断
束;式(10)表示功率平衡约束;式(11)表示配电网 丰富,很难保证可调控资源的数学模型是足够精
避免出现孤岛及保持网络呈辐射状的约束条件; 确且可知的,尤其是用户用电行为,如 DR 行为和
式(12)表示重构时相邻时段开关动作次数以及全 电动汽车行为等。因此,可以考虑采用智能优化
天开关动作次数的上限。 算法进行求解。
2.2.2 DG 出力约束 由于 ESS 的 SOC 和重构操作在某一时段的
DG 的出力应不大于其安装容量,并且在相 行为策略只与它们在上一个时段的状态相关,因
邻时刻的出力大小应遵循爬坡约束,可表示为 此本文所提的优化模型具有马尔科夫性,可以使
p G,i,h ≤ P s,i (13) 用强化学习类的求解算法进行求解。
p G,i,h + 1 - p G,i,h
-r G,i ≤ ≤ r G,i (14) 3.1 基于蒙特卡罗树搜索的配电网多时段运行
p G,i,h
优化模型求解方法
式 中 p G,i,h—— 第 i 个 DG 在 时 段 h 的 出 力 ;P s,i [18]
蒙特卡罗树搜索(MCTS) 是一种求解多阶
r
——第 i 个 DG 的安装容量; G,i——第 i 个 DG 的
段序贯决策的强化学习算法。该方法将序贯决策
功率爬/滑坡速率。
通过构建搜索树结构的方法展开,并计算各种策
2.2.3 用户 DR 行为约束
略的收益,得到最优策略。在该方法中,决策开始
为用户制定 DR 策略时应保证完成用户的日
前的状态视为树结构的根节点,每个阶段的行为
用电任务,约束公式为
策略视为树结构的各级子节点。该方法有 4 个主
24 24
∑ L h ≥ β ∑ L h 0 (15) 要操作:选择、展开、模拟和回溯。选择操作是指
DR
h = 1 h = 1
式中 β——日用电总量下限因子,当不考虑用户 在多阶段序贯决策中的某个阶段,选择一个可行
用电行为时可取 β=1,当考虑用户用电行为时可 解进行后续决策的展开;展开是指针对选择的节
点,为其新增一个下一时段/阶段的动作策略,对
DR
DR
0
0
作 如 下 估 计 : β=min{Q 1 / Q 1 , Q 2 / Q 2 ,… ,
于搜索树而言即是衍生出选择节点的子节点;模
Q N / Q N },该式中的 N 为所用的用户历史用电数
0
DR
据数量;Q 和 Q DR 是用户进行 DR 前后的日用电 拟是在某个可行解展开后模拟之后的决策过程,
0
并得到最终的策略收益;回溯是在完成模拟后,对
总量。
2.2.4 ESS 充放电功率约束 模拟路径上的各决策节点的评估指标进行更新。
ESS 的充放电功率和 SOC 上下限约束可表 MCTS 在寻优过程中需要平衡随机探索和
示为 利用当前最优解这两种搜索策略,上限置信区间
ESS ESS ESS (16) (UCT)算法可以应用在这种平衡策略中,即通过
γ min E max ≤ E h ≤ γ max E max
ESS ESS ESS 计算决策节点的 UCT 指标来决定是否对该决策
-P d,max ≤ P h ≤ P c,max (17)
ESS
P d,h ≥ -L h (18) 节点进行选择操作。

