基于多智能体Actor-double-critic深度强化学习的源-网-荷-储实时优化调度方法

被引:0
|
作者
徐业琰 [1 ]
姚良忠 [1 ]
廖思阳 [1 ]
程帆 [1 ]
徐箭 [1 ]
蒲天骄 [2 ]
王新迎 [2 ]
机构
[1] 武汉大学电气与自动化学院
[2] 中国电力科学研究院有限公司
关键词
源-网-荷-储; 实时调度; 带约束马尔科夫合作博弈; 多智能体深度强化学习;
D O I
暂无
中图分类号
TM73 [电力系统的调度、管理、通信]; TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
为保证新型电力系统的安全高效运行,针对模型驱动调度方法存在的调度优化模型求解困难、实时决策求解速度慢等问题,该文提出一种基于多智能体Actor-double-critic深度强化学习的源-网-荷-储实时优化调度方法。通过构建考虑调节资源运行约束和系统安全约束的实时优化调度模型和引入Vickey-Clark-Groves拍卖机制,设计带约束马尔科夫合作博弈模型,将集中调度模型转换为多智能体间的分布式优化问题进行求解。然后,提出多智能体Actor-double-critic算法,分别采用Self-critic和Cons-critic网络评估智能体的动作-价值和动作-成本,降低训练难度、避免即时奖励和安全约束成本稀疏性的影响,提高多智能体训练收敛速度,保证实时调度决策满足系统安全运行约束。最后,通过仿真算例验证所提方法可大幅缩短实时调度决策时间,实现保证系统运行安全可靠性和经济性的源-网-荷-储实时调度。
引用
收藏
页码:513 / 527
页数:15
相关论文
共 23 条
  • [1] 高比例可再生能源电力系统优化运行.[M].姚良忠.科学出版社.2021,
  • [2] A Deep Reinforcement Learning-Based Multi-Agent Framework to Enhance Power System Resilience Using Shunt Resources
    Kamruzzaman, Md.
    Duan, Jiajun
    Shi, Di
    Benidris, Mohammed
    [J]. IEEE TRANSACTIONS ON POWER SYSTEMS, 2021, 36 (06) : 5525 - 5536
  • [3] Virtual-Action-Based Coordinated Reinforcement Learning for Distributed Economic Dispatch
    Li, Dewen
    Yu, Liying
    Li, Ning
    Lewis, Frank
    [J]. IEEE TRANSACTIONS ON POWER SYSTEMS, 2021, 36 (06) : 5143 - 5152
  • [4] Two-Stage Volt/Var Control in Active Distribution Networks With Multi-Agent Deep Reinforcement Learning Method
    Sun, Xianzhuo
    Qiu, Jing
    [J]. IEEE TRANSACTIONS ON SMART GRID, 2021, 12 (04) : 2903 - 2912
  • [5] Lyapunov-based Safe Policy Optimization for Continuous Control..[J].Yinlam Chow;Ofir Nachum;Aleksandra Faust;Mohammad Ghavamzadeh;Edgar A. Duéñez-Guzmán.CoRR.2019,
  • [6] Application of Stochastic Dual Dynamic Programming to the Real-Time Dispatch of Storage Under Renewable Supply Uncertainty
    Papavasiliou, Anthony
    Mou, Yuting
    Cambier, Leopold
    Scieur, Damien
    [J]. IEEE TRANSACTIONS ON SUSTAINABLE ENERGY, 2018, 9 (02) : 547 - 558
  • [7] Playing Atari with Deep Reinforcement Learning..[J].Volodymyr Mnih;Koray Kavukcuoglu;David Silver;Alex Graves;Ioannis Antonoglou;Daan Wierstra;Martin A. Riedmiller.CoRR.2013,
  • [8] 电网优化调度的模型-数据-知识融合方法研究评述及展望
    王珂
    万祥宽
    王继业
    李亚平
    徐云贵
    ASAD WAQAR
    [J]. 中国电机工程学报, 2024, 44(S1) (S1) : 131 - 145
  • [9] 深度强化学习在含分布式柔性资源的电网优化调度中的应用研究综述
    高冠中
    杨胜春
    郭晓蕊
    姚建国
    李亚平
    朱克东
    严嘉豪
    [J]. 中国电机工程学报, 2024, 44 (16) : 6385 - 6404
  • [10] 基于联邦强化学习的社区共享储能日前调度
    余兴兴
    李元诚
    王庆乐
    郭宜果
    杨夯
    [J]. 中国电机工程学报, 2024, 44 (20) : 8103 - 8113