Ústav teorie informace a automatizace

Jste zde

Bibliografie

Conference Paper (international conference)

Algorithmic procedures for mean variance optimality in Markov decision chains

Sladký Karel, Sitař Milan

: Operation Research Proceedings 2005, p. 799-804 , Eds: Haasis H. D., Kopfer H., Schonberger J.

: Operations Research 2006, (Bremen, DE, 06.09.2005-08.09.2005)

: CEZ:AV0Z10750506

: GA402/05/0115, GA ČR, GA402/04/1294, GA ČR

: Markov decision chains, mean-variance optimality, algorithmic procedures

(eng): In this note we discussed some algorithmic procedures for finding optimal policies of Markov decision chains with respect to various mean variance optimality criteria. To this end, we present formulas for the growth rate and asymptotic behavior of the variance of total cumulative reward. Finally, algorithmic procedures of policy internation type for finding efficient policies with respect to various mean variance optimality criteria along with computational experience are discussed.

(cze): V práci se diskutují algoritmické postupy pro nalezení optimálního řízení markovských rozhodovancích procesů vzhledem k různým typům průměrné časové optimality. Nejprve se uvádí vztahy pro míru růstu a asymptotické chování variance celkového kumulovaného výnosu. Dále jsou uvedeny algorithmické postupy typu "iterace v prostoru řízení" pro nalezení eficientních řízení pro různá kriteria optimality typu střední hodnota-rozptyl.

: 12B

: BB

07.01.2019 - 08:39