Delay-aware model-based reinforcement learning for continuous control

被引：30

作者：

Chen, Baiming ^{[1
]}

Xu, Mengdi ^{[2
]}

Li, Liang ^{[1
]}

Zhao, Ding ^{[2
]}

机构：

[1] Tsinghua Univ, Beijing 100084, Peoples R China

[2] Carnegie Mellon Univ, Pittsburgh, PA 15213 USA

来源：

NEUROCOMPUTING | 2021年 / 450卷

关键词：

Model-based reinforcement learning; Markov decision process; Continuous control; Delayed system; FINITE SPECTRUM ASSIGNMENT; DEEP NEURAL-NETWORKS; SMITH PREDICTOR; SYSTEMS; INTEGRATOR; STABILITY; ROBOT;

D O I：

10.1016/j.neucom.2021.04.015

中图分类号：

TP18 [人工智能理论];

学科分类号：

081104 ; 0812 ; 0835 ; 1405 ;

摘要：

Action delays degrade the performance of reinforcement learning in many real-world systems. This paper proposes a formal definition of delay-aware Markov Decision Process and proves it can be transformed into standard MDP with augmented states using the Markov reward process. We develop a delay-aware model-based reinforcement learning framework that can incorporate the multi-step delay into the learned system models without learning effort. Experiments with the Gym and MuJoCo platforms show that the proposed delay-aware model-based algorithm is more efficient in training and transferable between systems with various durations of delay compared with state-of-the-art model-free reinforce-ment learning methods. (c) 2021 Elsevier B.V. All rights reserved.

引用

页码：119 / 128

页数：10

共 50 条

[1] Model-based Reinforcement Learning for Continuous Control with Posterior Sampling
Fan, Ying
Ming, Yifei
INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 139, 2021, 139
[2] Delay-aware Cellular Traffic Scheduling with Deep Reinforcement Learning
Zhang, Ticao
Shen, Shuyi
Mao, Shiwen
Chang, Gee-Kung
2020 IEEE GLOBAL COMMUNICATIONS CONFERENCE (GLOBECOM), 2020,
[3] Delay-Aware NFV Resource Allocation with Deep Reinforcement Learning
Yuan, Ningcheng
He, Wenchen
Shen, Jing
Qiu, Xuesong
Guo, Shaoyong
Li, Wenjing
NOMS 2020 - PROCEEDINGS OF THE 2020 IEEE/IFIP NETWORK OPERATIONS AND MANAGEMENT SYMPOSIUM 2020: MANAGEMENT IN THE AGE OF SOFTWARIZATION AND ARTIFICIAL INTELLIGENCE, 2020,
[4] DACOM: Learning Delay-Aware Communication for Multi-Agent Reinforcement Learning
Yuan, Tingting
Chung, Hwei-Ming
Yuan, Jie
Fu, Xiaoming
THIRTY-SEVENTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, VOL 37 NO 10, 2023, : 11763 - 11771
[5] Delay-aware Cooperative Perception with Deep Reinforcement Learning in Vehicular Networks
Xu, Fan
Chen, Chen
Zheng, Haifeng
Feng, Xinxin
2024 9TH INTERNATIONAL CONFERENCE ON COMPUTER AND COMMUNICATION SYSTEMS, ICCCS 2024, 2024, : 980 - 985
[6] Delay-aware TDMA Scheduling with Deep Reinforcement Learning in Tactical MANET
Wi, Gwangjin
Son, Sunghwa
Park, Kyung-Joon
11TH INTERNATIONAL CONFERENCE ON ICT CONVERGENCE: DATA, NETWORK, AND AI IN THE AGE OF UNTACT (ICTC 2020), 2020, : 370 - 372
[7] Delay-aware dynamic access control for mMTC in wireless networks using deep reinforcement learning
Pacheco-Paramo, Diego
Tello-Oquendo, Luis
COMPUTER NETWORKS, 2020, 182 (182)
[8] Delay-Aware Content Delivery With Deep Reinforcement Learning in Internet of Vehicles
Nan, Zhaojun
Jia, Yunjian
Ren, Zhi
Chen, Zhengchuan
Liang, Liang
IEEE TRANSACTIONS ON INTELLIGENT TRANSPORTATION SYSTEMS, 2022, 23 (07) : 8918 - 8929
[9] Reinforcement Learning-Based Delay-Aware Path Exploration of Parallelized Service Function Chains
Huang, Zhongwei
Li, Dagang
Wu, Chenhao
Lu, Hua
MATHEMATICS, 2022, 10 (24)
[10] Continuous-Time Model-Based Reinforcement Learning
Yildiz, Cagatay
Heinonen, Markus
Lahdesmaki, Harri
INTERNATIONAL CONFERENCE ON MACHINE LEARNING, VOL 139, 2021, 139

← 1 2 3 4 5 →