Evaluating Correctness of Reinforcement Learning based on Actor-Critic Algorithm

被引：0

作者：

Kim, Youngjae ^{[1
]}

Hussain, Manzoor ^{[1
]}

Suh, Jae-Won ^{[1
]}

Hong, Jang-Eui ^{[1
]}

机构：

[1] Chungbuk Natl Univ, Coll Elect & Comp Engn, Cheongju, South Korea

来源：

2022 THIRTEENTH INTERNATIONAL CONFERENCE ON UBIQUITOUS AND FUTURE NETWORKS (ICUFN) | 2022年

基金：

新加坡国家研究基金会;

关键词：

reinforcement learning; actor-critic algorithm; safety-critical system; quality evaluation; correctness;

D O I：

10.1109/ICUFN55119.2022.9829571

中图分类号：

TP [自动化技术、计算机技术];

学科分类号：

0812 ;

摘要：

Deep learning is used for decision making and functional control in various fields, such as autonomous systems. However, rather than being developed by logical design, deep learning models are trained by itself through learning data. Moreover, only reward values are used to evaluate its performance, which does not provide enough information that the model learned properly. This paper proposes a new method to assess the correctness of reinforcement learning, considering other properties of the learning algorithm. The proposed method is applied for the evaluation of ActorCritic Algorithms, and correctness-related insights of the algorithm are confirmed through experiments.

引用

页码：320 / 325

页数：6

共 50 条

[31] MARS: Malleable Actor-Critic Reinforcement Learning Scheduler
Baheri, Betis
Tronge, Jacob
Fang, Bo
Li, Ang
Chaudhary, Vipin
Guan, Qiang
[J]. 2022 IEEE INTERNATIONAL PERFORMANCE, COMPUTING, AND COMMUNICATIONS CONFERENCE, IPCCC, 2022,
[32] Averaged Soft Actor-Critic for Deep Reinforcement Learning
Ding, Feng
Ma, Guanfeng
Chen, Zhikui
Gao, Jing
Li, Peng
[J]. COMPLEXITY, 2021, 2021
[33] Locating algorithm of steel stock area with asynchronous advantage actor-critic reinforcement learning
Cho, Young-in
Kim, Byeongseop
Yoon, Hee-Chang
Woo, Jong Hun
[J]. JOURNAL OF COMPUTATIONAL DESIGN AND ENGINEERING, 2024, 11 (01) : 230 - 246
[34] Adaptive Assist-as-needed Control Based on Actor-Critic Reinforcement Learning
Zhang, Yufeng
Li, Shuai
Nolan, Karen J.
Zanotto, Damiano
[J]. 2019 IEEE/RSJ INTERNATIONAL CONFERENCE ON INTELLIGENT ROBOTS AND SYSTEMS (IROS), 2019, : 4066 - 4071
[35] Forward Actor-Critic for Nonlinear Function Approximation in Reinforcement Learning
Veeriah, Vivek
van Seijen, Harm
Sutton, Richard S.
[J]. AAMAS'17: PROCEEDINGS OF THE 16TH INTERNATIONAL CONFERENCE ON AUTONOMOUS AGENTS AND MULTIAGENT SYSTEMS, 2017, : 556 - 564
[36] An Actor-Critic Hierarchical Reinforcement Learning Model for Course Recommendation
Liang, Kun
Zhang, Guoqiang
Guo, Jinhui
Li, Wentao
[J]. ELECTRONICS, 2023, 12 (24)
[37] A Hessian Actor-Critic Algorithm
Wang, Jing
Paschalidis, Ioannis Ch
[J]. 2014 IEEE 53RD ANNUAL CONFERENCE ON DECISION AND CONTROL (CDC), 2014, : 1131 - 1136
[38] THE APPLICATION OF ACTOR-CRITIC REINFORCEMENT LEARNING FOR FAB DISPATCHING SCHEDULING
Kim, Namyong
Shin, IIayong
[J]. 2017 WINTER SIMULATION CONFERENCE (WSC), 2017, : 4570 - 4571
[39] ACTOR-CRITIC DEEP REINFORCEMENT LEARNING FOR DYNAMIC MULTICHANNEL ACCESS
Zhong, Chen
Lu, Ziyang
Gursoy, M. Cenk
Velipasalar, Senem
[J]. 2018 IEEE GLOBAL CONFERENCE ON SIGNAL AND INFORMATION PROCESSING (GLOBALSIP 2018), 2018, : 599 - 603
[40] Dynamic Content Caching Based on Actor-Critic Reinforcement Learning for IoT Systems
Lai, Lifeng
Zheng, Fu-Chun
Wen, Wanli
Luo, Jingjing
Li, Ge
[J]. 2022 IEEE 96TH VEHICULAR TECHNOLOGY CONFERENCE (VTC2022-FALL), 2022,

← 1 2 3 4 5 →