Institute of Information Theory and Automation

You are here

Bibliography

Conference Paper (international conference)

Constrained Risk-Sensitive Markov Decision Chains

Sladký Karel

: Operations Research Proceedings 2008, p. 363-368 , Eds: Fleischmann B., Borgwardt K. H., Klein R., Tuma A.

: Operations Research 2008, (Augsburg, DE, 03.09.2008-05.09.2008)

: CEZ:AV0Z10750506

: GA402/08/0107, GA ČR, GA402/07/1113, GA ČR

: Markov decision chains, exponential utility functions, constraints

(eng): For a classical Markov decision chain we suppose that the streams of transition rewards are evaluated by an exponential utility function. Attention is focused on the asymptotic properties of the expected utility and the corresponding certainty equivalents if the optimal values considered with respect to transition rewards must fulfill certain additional constraint on the expected utility or the certainty equivalent generated by different transition rewards. Our analysis is based policy iterations applied on a collection of nonnegative matrices arising in the recursive formulas for the growth of expected utilities.

(cze): Pro markovský rozhodovací proces se předpokládá, že náhodné posloupnosti obdržených výnosů jsou vyhodnocovány pomocí exponenciální užitkové funkce. Vyšetřují se limitní vlastnosti očekávané hodnoty užitkové funkce i odpovídajího ekvivalentu za jistoty za podmínky, že optimální hodnoty musí splňovat určitá omezení. Optimální řízení lze pak nalézt iterativním postupem v souboru nezáporných matic sestrojených pomocí vztahů pro růst očekávaného užitku.

: BB

2019-01-07 08:39