(PDF) Some Reward–penalty Rules for the Multi-Armed Bandit

Some Reward–penalty Rules for the Multi-Armed Bandit Problem Which Are Asymptotically Optimal

Advances in Applied Probability - United Kingdom

doi 10.1017/s0001867800021121

Full Text

Abstract

Available in full text

Categories

Applied Mathematics

Date

March 1, 1983

Authors

K. D. Glazebrook

Publisher

Cambridge University Press (CUP)

Related search

Gambling in a Rigged Casino: The Adversarial Multi-Armed Bandit Problem

English

Minimax Lower Bounds for the Two-Armed Bandit Problem

SSRN Electronic Journal

English

Revisiting the Multi-Armed Bandit Model for the Optimal Design of Clinical Trials: Benefits and Drawbacks

English

Asymptotically Optimal Contextual Bandit Algorithm Using Hierarchical Structures

IEEE Transactions on Neural Networks and Learning Systems

Computer Networks

Computer Science Applications

Artificial Intelligence

English

Choosing Multi-Issue Negotiating Object Based on Trust and K-Armed Bandit Problem

Ruan Jian Xue Bao/Journal of Software

English

A Multi-Armed Bandit Model Selection for Cold-Start User Recommendation

English

Generalized Bayesian Pursuit: A Novel Scheme for Multi-Armed Bernoulli Bandit Problems

IFIP Advances in Information and Communication Technology

Computer Networks

Information Systems

English

Customer Acquisition via Display Advertising Using Multi-Armed Bandit Experiments

SSRN Electronic Journal

English

Asymptotically Optimal Planning for Non-Myopic Multi-Robot Information Gathering

English