Může optimální rozhodování a učení obelstít jednorukého banditu?

školitel: Miroslav Kárný
e-mail: zobrazit e-mail
typ práce: bakalářská práce, diplomová práce
zaměření: MI_MM, II_SIMI, II_TS
klíčová slova: Rozhodování za neurčitosti, Bayesovske odhadováni, řízení
popis: Pravděpodobnostní dynamické systémy nachází uplatnění v široké škále oborů od techniky přes ekonomi a medicínu až po elektronickou demokracii. Lze jimi modelovat například složitá průmyslová zařízení, dopravní toky, lymfatický systém končetiny, nebo třeba výherní automat známý jako jednoruký bandita. Často se setkáváme s případy, kdy je znám parametrizovaný model daného systému, ale jeho parametry nejsou přesně známy. Základní problém, který je pak nutno řešit, bývá odhadování těchto parametrů z pozorovaných (naměřených) dat - učení. V případě, že daný systém obsahuje také řídící vstupy, přidává se dále problém nalezení optimálních hodnot vstupů takových, aby řízený systém co nejlépe sledoval předem zvolený cíl. Velmi zajímavá úloha vzniká kombinací dvou předchozích - učení a řízení současně. Zvolené hodnoty vstupních veličin mají pochopitelně vliv na chování systému, ale zároveň ovlivňují kvalitu učení. Vyvstává tak otázka, zda volit strategii řízení, která se vzhledem k právě dostupným znalostem jeví jako optimální, nebo zda dělat "úmyslné chyby", které za cenu krátkodobě horšího řízení přinesou lepší odhad parametrů systému a tím umožní dosáhnout celkově lepších výsledků. Úkoly: 1. Seznamte se se základy dynamického rozhodování za neurčitosti. 2. Porovnejte různé strategie řízení systému s neznámými parametry. 3. Najděte tyto strategie pro jednoduchý systém a implementujte je. 4. Experimentálně porovnejte získané výsledky řízení.
literatura: Miroslav Kárný, Ivan Nagy: Dynamic Bayesian Decision-Making: a guide with examples http://www.utia.cas.cz/user_data/scientific/AS_dept/psfiles/as.ps
naposledy změněno: 18.09.2012 11:54:44

za obsah této stránky zodpovídá: Radek Fučík | naposledy změněno: 12.9.2011
Trojanova 13, 120 00 Praha 2, tel. 224 358 540, pevná linka 224 923 098, fax 234 358 643
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky