A UNIFIED APPROACH TO ADAPTIVE-CONTROL OF AVERAGE REWARD MARKOV DECISION-PROCESSES

被引：2

作者：

HUBNER, G ^{[1
]}

机构：

[1] UNIV HAMBURG,INST MATH STOCHASTIK,D-2000 HAMBURG 13,FED REP GER

来源：

OR SPEKTRUM | 1988年 / 10卷 / 03期

关键词：

D O I：

10.1007/BF01740510

中图分类号：

C93 [管理学]; O22 [运筹学];

学科分类号：

070105 ; 12 ; 1201 ; 1202 ; 120202 ;

摘要：

引用

页码：161 / 166

页数：6

共 50 条

[1] RECURSIVE ADAPTIVE-CONTROL OF MARKOV DECISION-PROCESSES WITH THE AVERAGE REWARD CRITERION
CAVAZOSCADENA, R
HERNANDEZLERMA, O
APPLIED MATHEMATICS AND OPTIMIZATION, 1991, 23 (02): : 193 - 207
[2] ESTIMATION AND ADAPTIVE-CONTROL OF SPAN-CONTRACTING MARKOV DECISION-PROCESSES
HUBNER, G
KYBERNETIKA, 1991, 27 (01) : 66 - 71
[3] MARKOV DECISION-PROCESSES - DISCOUNTED EXPECTED REWARD OR AVERAGE EXPECTED REWARD
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1993, 172 (02) : 375 - 384
[4] APPROXIMATION AND ADAPTIVE-CONTROL OF MARKOV-PROCESSES - AVERAGE REWARD CRITERION
HERNANDEZLERMA, O
KYBERNETIKA, 1987, 23 (04) : 265 - 288
[5] A Unified Approach for Semi-Markov Decision Processes with Discounted and Average Reward Criteria
Li, Yanjie
Wang, Huijing
Chen, Haoyao
2014 11TH WORLD CONGRESS ON INTELLIGENT CONTROL AND AUTOMATION (WCICA), 2014, : 1741 - 1744
[6] NECESSARY CONDITIONS FOR THE OPTIMALITY EQUATION IN AVERAGE-REWARD MARKOV DECISION-PROCESSES
CAVAZOSCADENA, R
APPLIED MATHEMATICS AND OPTIMIZATION, 1989, 19 (01): : 97 - 112
[7] SEPARABLE VALUE-FUNCTIONS FOR INFINITE HORIZON AVERAGE REWARD MARKOV DECISION-PROCESSES
WHITE, DJ
JOURNAL OF MATHEMATICAL ANALYSIS AND APPLICATIONS, 1989, 144 (02) : 450 - 465
[8] EXISTENCE OF OPTIMAL STATIONARY POLICIES IN AVERAGE REWARD MARKOV DECISION-PROCESSES WITH A RECURRENT STATE
CAVAZOSCADENA, R
APPLIED MATHEMATICS AND OPTIMIZATION, 1992, 26 (02): : 171 - 194
[9] Adaptive aggregation for reinforcement learning in average reward Markov decision processes
Ronald Ortner
Annals of Operations Research, 2013, 208 : 321 - 336
[10] Adaptive aggregation for reinforcement learning in average reward Markov decision processes
Ortner, Ronald
ANNALS OF OPERATIONS RESEARCH, 2013, 208 (01) : 321 - 336

← 1 2 3 4 5 →