Aproximativní metody návrhu strategií rozhodování za neurčitosti
advisor: | Václav Šmídl |
e-mail: | show e-mail |
type: | bachelor thesis |
branch of study: | MI_MM |
key words: | dynamické programování, aproximace, plně pravděpodobnostní návrh |
description: | 1.Seznamte se s metodikou plně pravděpodobnostního návrhu strategie rozhodování. Tato metodika je založena na volbě ztrátové funkce ve tvaru statistické divergence a je používána při návrhu strategií adaptivního řízení či poradních systémů. Hlavní výhodou této volby je explicitní vzorec pro optimální strategii řízení. Širšímu rozšíření této metodologie brání výpočetní složitost. 2.Seznamte se s obvyklými metodikami aproximativního návrhu řídících strategií pro klasickou formulaci rozhodovací úlohy, např. actor-critic a jeho variantami HDP, DHP. 3.Navrhněte approximativní metodiku výpočtu řídící strategie pro plně pravděpodobnostní návrh. Demonstrujte její funkčnost na návrhu vhodném vícerozměrovém systému. |
references: | [1] Si J., Barto A.G., Powell W.B., Wunsch D., Handbook of learning and approximate dynamic programming. IEEE Press Series on Computational Intelligence, 2004. [2] Kárný, M. Towards fully probablistic design. Automatica, 32(12), 1986. [3] Bertsekas, D.P., Dynamic Programming and Optimal Control, Athena Scientific 2000. |
last update: | 20.11.2017 21:59:13 |
administrator for this page:
Ľubomíra Dvořáková | last update: 09/12/2011