Odhady hustot pravděpodobnosti - Globální téma - Asymptotika, Konsistence, Robustnost, Identifikace modelu

školitel: Ing. Václav Kůs, Ph.D.
e-mail: zobrazit e-mail
typ práce: bakalářská práce, diplomová práce
zaměření: MI_MM, MI_AMSM, II_SIMI, II_TS
klíčová slova: Metriky, informační divergence, odhady s minimální vzdáleností, robustnost, eficience
odkaz: http://gams.fjfi.cvut.cz/topics/topics.html
popis: Globálním obsahem tématu budou odhady hustot pravděpodobnosti založené na metodě minimální vzdálenosti a jejich statistické vlastnosti. Na toto téma může být vypsáno několik různých prací, konkrétní téma práce může být pojato jak teoreticky tak čistě simulačně nebo cokoli mezi tím.

Pro danou vzdálenost D definujeme odhad f hustoty f_0 jako takovou hustotu z dané množiny hustot L, pro kterou je vzdálenost D jí odpovídající distribuční funkce F od empirické distribuční funkce F_n minimální. Pro takovéto odhady bude vyšetřována jejich konsistence, robustnost a eficience v různých informačních divergencích a metrikách. Divergence v jistém smyslu zobecňuje na prostoru distribučních funkcí pojem metriky - nepožaduje obecně symetrii a platnost trojúhelníkové nerovnosti (viz napr. Shannonova entropie, Kullbackova informace, Pearson-Neymannova divergence, Power disparita,...). Budou používány a odvozovány dominační vztahy mezi jednotlivými divergencemi a dalšími metrikami jako např. Kolmogorovova vzdálenost, Totální variace, Cramér-von Misesova, Réniyho rozložitelné vzdálenosti, subdivergence,...

Následně naprogramované metody odhadu hustot mohou být odzkoušeny na generovaných pseudonáhodných posloupnostech, numericky bude ověřen řád konsistence v dané divergenci D a numericky prošetřena robustnost odhadu, tzn. citlivost odhadu na "nepřesnost" dat při různém stupni a typu znečištění datových souborů, např. při znečištění Gaussovým, rovnoměrným, Cauchyho, Logistickým či Laplaceovým rozdělením,... Některou práci lze též orientovat na průzkum vlastností dvou- a tří-parametrického Weibullova rozdělení, které je velmi často používáno v oblastech analýzy dat o přežití a v teorii spolehlivosti konstrukcí a postupů v mnoha různých oblastech průmyslu, pojišťovnictví, ekonomie,...

Projekt je řešen ve spolupráci s Universidad Miguel Hernandéz, CIO, Elche, Španělsko.
literatura: Rozsáhlá... Bude zadáno po domluvě konkrétní verze tématu z oblasti buď divergencí, statistických vzdáleností, vlastností robustnosti a eficience, apod.
poznámka: V rámci tohoto globálního tématu může být vypsáno několik různě zaměřených témat, povahou buď teoretická, teoreticko-simulační, testovací, aplikační, .... Závisí na osobní domluvě.
Téma vyžaduje skutečné nasazení a chuť ponořit se do této nádherné problematiky ohledně výběru metod, odvození jejich vlastností, přípravy algoritmů, testování na simulovaných datech,...
naposledy změněno: 20.02.2012 14:20:26

za obsah této stránky zodpovídá: Ľubomíra Dvořáková | naposledy změněno: 12.9.2011
Trojanova 13, 120 00 Praha 2, tel. 224 358 540, pevná linka 224 923 098, fax 234 358 643
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky