Finite-horizon variance penalised Markov decision processes

被引：7

作者：

Collins E.J. ^{[1
]}

机构：

[1] Department of Mathematics, University of Bristol

来源：

Operations-Research-Spektrum | 1997年 / 19卷 / 1期

关键词：

Convex polytopes; Markov decision processes; Mean-variance tradeoff; Variance penalty;

D O I：

10.1007/BF01539805

中图分类号：

学科分类号：

摘要：

We consider a finite horizon Markov decision process with only terminal rewards. We describe a finite algorithm for computing a Markov deterministic policy which maximises the variance penalised reward and we outline a vertex elimination algorithm which can reduce the computation involved. © Springer-Verlag 1997.

引用

页码：35 / 39

页数：4

共 50 条

[1] Finite-horizon variance penalised Markov decision processes
Collins, EJ
[J]. OR SPEKTRUM, 1997, 19 (01) : 35 - 39
[2] Poisoning finite-horizon Markov decision processes at design time
Caballero, William N.
Jenkins, Phillip R.
Keith, Andrew J.
[J]. COMPUTERS & OPERATIONS RESEARCH, 2021, 129
[3] Lexicographic refinements in possibilistic decision trees and finite-horizon Markov decision processes
Ben Amor, Nahla
El Khalfi, Zeineb
Fargier, Helene
Sabbadin, Regis
[J]. FUZZY SETS AND SYSTEMS, 2019, 366 : 85 - 109
[4] Finite approximation for finite-horizon continuous-time Markov decision processes
Qingda Wei
[J]. 4OR, 2017, 15 : 67 - 84
[5] Finite approximation for finite-horizon continuous-time Markov decision processes
Wei, Qingda
[J]. 4OR-A QUARTERLY JOURNAL OF OPERATIONS RESEARCH, 2017, 15 (01): : 67 - 84
[6] FINITE-HORIZON MARKOV DECISION-PROCESSES WITH UNCERTAIN TERMINAL PAYOFFS
WHITE, DJ
[J]. OPERATIONS RESEARCH, 1995, 43 (05) : 862 - 869
[7] Finite-horizon piecewise deterministic Markov decision processes with unbounded transition rates
Huang, Yonghui
Guo, Xianping
[J]. STOCHASTICS-AN INTERNATIONAL JOURNAL OF PROBABILITY AND STOCHASTIC PROCESSES, 2019, 91 (01) : 67 - 95
[8] A variable neighborhood search based algorithm for finite-horizon Markov Decision Processes
Zhao, Qiu Hong
Brimberg, Jack
Mladenovic, Nenad
[J]. APPLIED MATHEMATICS AND COMPUTATION, 2010, 217 (07) : 3480 - 3492
[9] Risk-sensitive finite-horizon piecewise deterministic Markov decision processes
Huang, Yonghui
Lian, Zhaotong
Guo, Xianping
[J]. OPERATIONS RESEARCH LETTERS, 2020, 48 (01) : 96 - 103
[10] Simulation-Based Optimization Algorithms for Finite-Horizon Markov Decision Processes
Bhatnagar, Shalabh
Abdulla, Mohammed Shahid
[J]. SIMULATION-TRANSACTIONS OF THE SOCIETY FOR MODELING AND SIMULATION INTERNATIONAL, 2008, 84 (12): : 577 - 600

← 1 2 3 4 5 →