Aproximativní metody návrhu strategií rozhodování za neurčitosti

advisor: Václav Šmídl
e-mail: show e-mail
type: bachelor thesis
branch of study: MI_MM
key words: dynamické programování, aproximace, plně pravděpodobnostní návrh
description: 1.Seznamte se s metodikou plně pravděpodobnostního návrhu strategie rozhodování. Tato metodika je založena na volbě ztrátové funkce ve tvaru statistické divergence a je používána při návrhu strategií adaptivního řízení či poradních systémů. Hlavní výhodou této volby je explicitní vzorec pro optimální strategii řízení. Širšímu rozšíření této metodologie brání výpočetní složitost. 2.Seznamte se s obvyklými metodikami aproximativního návrhu řídících strategií pro klasickou formulaci rozhodovací úlohy, např. actor-critic a jeho variantami HDP, DHP. 3.Navrhněte approximativní metodiku výpočtu řídící strategie pro plně pravděpodobnostní návrh. Demonstrujte její funkčnost na návrhu vhodném vícerozměrovém systému.
references: [1] Si J., Barto A.G., Powell W.B., Wunsch D., Handbook of learning and approximate dynamic programming. IEEE Press Series on Computational Intelligence, 2004. [2] Kárný, M. Towards fully probablistic design. Automatica, 32(12), 1986. [3] Bertsekas, D.P., Dynamic Programming and Optimal Control, Athena Scientific 2000.
last update: 20.11.2017 21:59:13

administrator for this page: Ľubomíra Dvořáková | last update: 09/12/2011
Trojanova 13, 120 00 Praha 2, tel. +420 770 127 494
Czech Technical Univeristy in Prague | Faculty of Nuclear Sciences and Physical Engineering | Department of Mathematics