Aproximativní metody návrhu strategií rozhodování za neurčitosti

školitel: Václav Šmídl
e-mail: zobrazit e-mail
typ práce: bakalářská práce
zaměření: MI_MM
klíčová slova: dynamické programování, aproximace, plně pravděpodobnostní návrh
popis: 1.Seznamte se s metodikou plně pravděpodobnostního návrhu strategie rozhodování. Tato metodika je založena na volbě ztrátové funkce ve tvaru statistické divergence a je používána při návrhu strategií adaptivního řízení či poradních systémů. Hlavní výhodou této volby je explicitní vzorec pro optimální strategii řízení. Širšímu rozšíření této metodologie brání výpočetní složitost. 2.Seznamte se s obvyklými metodikami aproximativního návrhu řídících strategií pro klasickou formulaci rozhodovací úlohy, např. actor-critic a jeho variantami HDP, DHP. 3.Navrhněte approximativní metodiku výpočtu řídící strategie pro plně pravděpodobnostní návrh. Demonstrujte její funkčnost na návrhu vhodném vícerozměrovém systému.
literatura: [1] Si J., Barto A.G., Powell W.B., Wunsch D., Handbook of learning and approximate dynamic programming. IEEE Press Series on Computational Intelligence, 2004. [2] Kárný, M. Towards fully probablistic design. Automatica, 32(12), 1986. [3] Bertsekas, D.P., Dynamic Programming and Optimal Control, Athena Scientific 2000.
naposledy změněno: 20.11.2017 21:59:13

za obsah této stránky zodpovídá: Ľubomíra Dvořáková | naposledy změněno: 12.9.2011
Trojanova 13, 120 00 Praha 2, tel. 224 358 540, pevná linka 224 923 098, fax 234 358 643
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky