Regulating greed over time in multi-armed bandits

被引：0

作者：

Traca, Stefano ^{[1
]}

Rudin, Cynthia ^{[2
]}

Yan, Weiyu ^{[3
]}

机构：

[1] Operations Research Center, Massachusetts Institute of Technology, Cambridge,MA,02139, United States

[2] Department of Computer Science, Duke University, Durham,NC,27708, United States

[3] Department of Electrical and Computer Engineering, Duke University, Durham,NC,27708, United States

来源：

Journal of Machine Learning Research | 2021年 / 22卷

关键词：

Time series;

D O I：

暂无

中图分类号：

学科分类号：

摘要：

引用

共 50 条

[41] Quantum Reinforcement Learning for Multi-Armed Bandits
Liu, Yi-Pei
Li, Kuo
Cao, Xi
Jia, Qing-Shan
Wang, Xu
2022 41ST CHINESE CONTROL CONFERENCE (CCC), 2022, : 5675 - 5680
[42] TRANSFER LEARNING FOR CONTEXTUAL MULTI-ARMED BANDITS
Cai, Changxiao
Cai, T. Tony
Li, Hongzhe
ANNALS OF STATISTICS, 2024, 52 (01): : 207 - 232
[43] Quantum Exploration Algorithms for Multi-Armed Bandits
Wang, Daochen
You, Xuchen
Li, Tongyang
Childs, Andrew M.
THIRTY-FIFTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, THIRTY-THIRD CONFERENCE ON INNOVATIVE APPLICATIONS OF ARTIFICIAL INTELLIGENCE AND THE ELEVENTH SYMPOSIUM ON EDUCATIONAL ADVANCES IN ARTIFICIAL INTELLIGENCE, 2021, 35 : 10102 - 10110
[44] Thompson Sampling for Budgeted Multi-armed Bandits
Xia, Yingce
Li, Haifang
Qin, Tao
Yu, Nenghai
Liu, Tie-Yan
PROCEEDINGS OF THE TWENTY-FOURTH INTERNATIONAL JOINT CONFERENCE ON ARTIFICIAL INTELLIGENCE (IJCAI), 2015, : 3960 - 3966
[45] Global Multi-armed Bandits with Holder Continuity
Atan, Onur
Tekin, Cem
van der Schaar, Mihaela
ARTIFICIAL INTELLIGENCE AND STATISTICS, VOL 38, 2015, 38 : 28 - 36
[46] Multi-armed Bandits with Metric Switching Costs
Guha, Sudipto
Munagala, Kamesh
AUTOMATA, LANGUAGES AND PROGRAMMING, PT II, PROCEEDINGS, 2009, 5556 : 496 - +
[47] Multiplayer Modeling via Multi-Armed Bandits
Gray, Robert C.
Zhu, Jichen
Ontanon, Santiago
2021 IEEE CONFERENCE ON GAMES (COG), 2021, : 695 - 702
[48] On Interruptible Pure Exploration in Multi-Armed Bandits
Shleyfman, Alexander
Komenda, Antonin
Domshlak, Carmel
PROCEEDINGS OF THE TWENTY-NINTH AAAI CONFERENCE ON ARTIFICIAL INTELLIGENCE, 2015, : 3592 - 3598
[49] Survey on Applications of Multi-Armed and Contextual Bandits
Bouneffouf, Djallel
Rish, Irina
Aggarwal, Charu
2020 IEEE CONGRESS ON EVOLUTIONARY COMPUTATION (CEC), 2020,
[50] Combinatorial Multi-armed Bandits for Real-Time Strategy Games
Ontanon, Santiago
JOURNAL OF ARTIFICIAL INTELLIGENCE RESEARCH, 2017, 58 : 665 - 702

← 1 2 3 4 5 →