Aproximativní metody návrhu strategií rozhodování za neurčitosti
školitel: | Václav Šmídl |
e-mail: | zobrazit e-mail |
typ práce: | bakalářská práce |
zaměření: | MI_MM |
klíčová slova: | dynamické programování, aproximace, plně pravděpodobnostní návrh |
popis: | 1.Seznamte se s metodikou plně pravděpodobnostního návrhu strategie rozhodování. Tato metodika je založena na volbě ztrátové funkce ve tvaru statistické divergence a je používána při návrhu strategií adaptivního řízení či poradních systémů. Hlavní výhodou této volby je explicitní vzorec pro optimální strategii řízení. Širšímu rozšíření této metodologie brání výpočetní složitost. 2.Seznamte se s obvyklými metodikami aproximativního návrhu řídících strategií pro klasickou formulaci rozhodovací úlohy, např. actor-critic a jeho variantami HDP, DHP. 3.Navrhněte approximativní metodiku výpočtu řídící strategie pro plně pravděpodobnostní návrh. Demonstrujte její funkčnost na návrhu vhodném vícerozměrovém systému. |
literatura: | [1] Si J., Barto A.G., Powell W.B., Wunsch D., Handbook of learning and approximate dynamic programming. IEEE Press Series on Computational Intelligence, 2004. [2] Kárný, M. Towards fully probablistic design. Automatica, 32(12), 1986. [3] Bertsekas, D.P., Dynamic Programming and Optimal Control, Athena Scientific 2000. |
naposledy změněno: | 20.11.2017 21:59:13 |
za obsah této stránky zodpovídá:
Pavel Strachota | naposledy změněno: 9.9.2021