Ing. Václav Kůs, Ph.D.

Václav Kůs - fotografie
e-mail: zobrazit e-mail
telefon: +420 22435 8547
místnost: 107c
konzultační hodiny: podle dohody emailem
 
rozvrh
předmět kód vyučující zs ls zs kr. ls kr.
Bayesovské principy ve statistice01BAPS Kůs 3+0 zk - - 3 -
Předmět:Bayesovské principy ve statistice01BAPSIng. Kůs Václav Ph.D.----
Anotace:Cílem přednášky je předložit matematické principy teorie rozhodování s náhodnými prvky, principy optimálních a robustních strategií a jejich vzájemné vazby spolu s výpočetními technikami pro jejich reálné použití. Postupy budou ilustrovány na praktických úlohách z prostředí statistických bodových a intervalových odhadů a testování statistických hypotéz.
Osnova:1. Postačující statistiky, univerzální principy klasické statistiky, princip postačitelnosti, podmíněnosti, věrohodnosti, sekvenční princip a vztahy mezi nimi, bayesovský princip, bayesovský úplný model a výhody jeho použití.
2. Ztrátové a rizikové funkce, užitková funkce a podmínky pro existenci užitkové funkce, obecná rozhodovací funkce. Optimální rozhodnutí a úplné třídy optimálních strategií.
3. Konvexní ztrátové funkce, Rao-Blackwellova věta, principy stejnoměrně nejlepší strategie, nestrannost, konstrukce UMVUE, příklady.
4. Bayesovská optimální rozhodovací strategie, apriorní a aposteriorní bayesovské riziko. Systémy apriorních informací, princip neurčitosti.
5. Jeffreysovy hustoty, konjugované systémy apriorních hustot, limitní aposteriorní hustoty, příklady pro známá rozdělení.
6. Minimaxní strategie, princip přípustnosti řešení rozhodovací úlohy a jejich vztah k bayesovskému řešení, Steinův efekt pro sféricky symetrická rozdělení.
7. Skórové funkce a jejich robustní vlastnosti, Shannonova entropie, f-divergence, princip maximální entropie, nové zobecněné třídy divergencí a jejich metrické a robustní vlastnosti.
8. Bodové odhady s minimální vzdáleností/divergencí, rozhodovací funkce s minimální Kolmogorovskou, Lévyho a diskrepanční vzdáleností, jejich L1 konsistence a kvalitativní robustnost, kolmogorovská entropie, Vapnik-Chervonenkisova dimenze a její použití.
9. Numerické aproximace, přesnost vícedimenzionálních procedur, Monte Carlo přístupy nalezení optimálního rozhodnutí, vzorkování podle důležitosti, konvergence metody, Metropolisův algoritmus.
10. Laplaceova asymptotická expanze do druhého řádu, úlohy v plně exponenciální formě, podmínky regularity pro stochastickou expanzi/aproximaci, výsledky Kass-Tierney-Kadaneho.
11. Hierarchický Bayes, Empirický Bayes, Variační Bayes - základní přístupy a příklady.
12. Bayesovské testování hypotéz pro různé ztrátové funkce, vlastnosti.
Osnova cvičení:
Cíle:Znalosti:
Rozšíření klasických principů rozhodování s náhodnými prvky a jejich použití v optimalizačních stochastických úlohách s důrazem na Bayesovské metody.

Schopnosti:
Orientace v různých statistických strategiích a jejich vlastnostech. Výpočetní aspekty.
Požadavky:Základní kurzy matematické analýzy a pravděpodobnosti - 01MAA3-4 nebo 01MAB3-4, 01MIP nebo 01PRST.
Rozsah práce:Zpracování a odvození závěrečné úlohy pro konkrétní rozdělení a vybrané rozhodovací strategie v rozsahu 3 stran textu.
Kličová slova:Bodový stat. odhad, ztrátová funkce, apriorní informace, bayesovské riziko, robustní optimální strategie, metoda minimální vzdálenosti, f-divergence, výpočet metodou Monte-Carlo.
Literatura:Povinná literatura:
[1] Berger J.O., Statistical Decision Theory and Bayesian Analysis, Springer, N.Y., 1985.
[2] Maitra A.P., Sudderth W.D., Discrete Gambling and Sochastic Games, Springer, 1996.

Doporučená literatura:
[3] Fishman G.S., Monte Carlo, Springer, 1996.
[4] Bernardo J.M., Smith A.F.M., Bayesian Theory, Wiley, 1994.

Matematická statistika01MAS Kůs - - 2+0 zk - 3
Předmět:Matematická statistika01MASIng. Kůs Václav Ph.D.----
Anotace:Náplní předmětu je použití statistických metod probraných v rámci předmětu 01MAS. Probrány Fisherovy informační matice statistických modelů, hledání nejlepších nestranných odhadů, odhady parametrů metodou momentů a metodou maximální věrohodnosti, nalezení kritických oborů pro testy statistických hypotéz pomocí Neyman-Pearsonova lemmatu a poměrem věrohodností, intervaly spolehlivosti a neparametrické odhady hustot pravděpodobnosti.
Osnova:1. Nestranné odhady s minimálním rozptylem, Fisherova informační matice, Rao-Cramérova nerovnost, Bhattacharryova nerovnost.
2. Odhady metodou momentů. Princip maximální věrohodnosti, konsistence, asymptotická normalita a eficience MLE odhadů.
3. Testování jednoduchých a složených hypotéz. Neyman - Pearsonovo lemma.
4. Stejnoměrně nejsilnější testy. Znáhodněné testování hypotéz, zobecněné Neyman - Pearsonovo lemma.
5. Test poměrem věrohodností, t-test, F-test.
6. Neparametrické modely, empirická distribuční funkce a empirická hustota a jejich vlastnosti,
7. Histogramy a jádrové odhady hustoty (adaptivní), vlastnosti.
8. Pearsonův test dobré shody, Kolmogorov-Smirnovův test.
9. Konfidenční množiny a intervaly spolehlivosti, pivotální veličiny, invertování přípustných oblastí, Prattův teorém.
Osnova cvičení:
Cíle:Znalosti:
Bodové převážně asymptotické odhady parametrů modelu a testování statistických hypotéz v parametrických i neparametrických pravděpodobnostních rodinách. Konfidenční množiny a konstrukce statistických testů a intervalů spolehlivosti pro daná rozdělení pravděpodobnosti.

Schopnosti:
Zpracovávat základní statistické modely odhadu a testování stat. hypotéz s hlubším pochopením náhodných zákonitostí jak z teoretického pohledu tak vzhledem k praktickému použití v konkrétních situacích ve statistice a zpracování dat.

Požadavky:01MIP nebo 01PRST
Rozsah práce:Pravidelné domácí úlohy k řešení a jejich oprava s konzultacemi.
Kličová slova:Nestranné odhady, informační matice, odhady metodou momentů, princip maximální věrohodnosti, eficience, statistická hypotéza, stejnoměrně nejsilnější test, test poměrem věrohodností, neparametrické modely, empirická distribuční funkce, histogram, jádrový odhad hustoty, testy dobré shody, konfidenční množiny, intervaly spolehlivosti.
Literatura:Povinná literatura:
[1] Anděl J., Základy matematické statistiky, MatFyzPress, Praha, 2005.
[2] Shao J., Mathematical Statistics, Springer, 1999.

Doporučená literatura:
[3] Schervish M.J., Theory of Statistics, Springer, 1995.
[4] Lehmann E.L., Point Estimation, Wiley, N.Y., 1984.
[5] Lehmann E.L., Testing Statistical Hypotheses, Springer, N.Y., 1986.

Modelování extrémních událostí01MEX Krbálek, Kůs - - 2+0 zk - 2
Předmět:Modelování extrémních událostí01MEXIng. Kůs Václav Ph.D.-2+0 ZK-2
Anotace:Obsahem předmětu je výklad modelů popisujících extrémní události, tedy události, které se vyskytují s velmi nízkou pravděpodobností, ale mají značný vliv na chování popisovaného modelu. Vyložena bude fluktuace náhodných sum a fluktuace náhodného maxima, probírány jednotlivá rozdělení vhodná pro modelování extrémních událostí a různé modely a jejich aplikace. Teoretické poznatky budou aplikovány na reálná data.
Osnova:1. Motivační příklad z oblasti agregovaného provozu v počítačové síti, způsoby jeho řešení (machine learning), on-off approximace.
2. Distribution free nerovnosti (Cantelli, Chernoff, Hoeffding,...).
3. Neparametrické odhady hustot a jejich chvostů (adaptivní jádrový odhad, transformace dat), semiparametrické odhady hustot (Barronův).
4. Rozdělení pro modelování extremálních hodnot s těžkými chvosty, zobecněné Pareto, log-gamma, log-normální, heavy-tailed Weibullovo, zobecněné Gumbelovo rozdělení extremálních hodnot - odhady parametrů těchto rozdělení a jejich asymptotické vlastnosti.
5. PP a QQ ploty pro fitování správného rozdělení extremálních hodnot, ME - mean excess funkce, její empirické odhady a použití.
6. Doba návratu (pojistné) události, uspořádané statistiky, Gumbelova metoda překročení úrovně.
7. Fluktuace náhodných sum, stabilní a alfa-stabilní distribuce, spektrální representace stabilní distribuce.
8. Fluktuace náhodného maxima: Gumbelova, Fréchetova a Weibullova distribuce jako limitní rozdělení maximální hodnoty iid veličin, Fisher-Tippettův zákon.
9. Obor stabilní slabé konvergence maxima Mn (oblasti přitažlivosti maxima), aplikace na rozdělení a střední hodnotu překročení dané hranice - POT úlohy.
10. Modely se subexponenciální distribucí pro modelování rozdělení s těžkými chvosty, třída funkcí R_alfa, s regulární variací řádu alfa v nekonečnu, Karamatův teorém.
11. Aplikace na povodňová data, data z pojišťovnictví (kumulativní počet pojistných událostí), četné ukázky.
Osnova cvičení:
Cíle:Znalosti:
Matematické modely popisující události, které se vyskytují s relativně nízkou pravděpodobností, ale s významným vlivem na chování celého modelovaného systému, různá rozdělení vhodná pro modelování extrémních událostí, GEV, GPD, jejich vlastnosti, oblasti přitažlivosti maxima, POT metody.

Schopnosti:
Tyto modely aplikovat na konkrétních příkladech jako jsou reálná data z povodní, požárů, oblastí pojistných a finančních rizik,... s cílem předpovědí extrémních událostí, tzn. použití na reálná data s cílem predikce.
Požadavky:01MIP nebo 01PRST. 01MAS.
Rozsah práce:Semestrální práce - zpracování konkrétních zadaných povodňových dat z UK řeky, předvedení výsledků ke zkoušce.
Kličová slova:Odhady agregovaného síťového provozu, odhady chvostů rozdělení, distribution-free nerovnosti, neparametrické a semiparametrické odhady, fluktuace náhodných sum, fluktuace náhodného maxima, alfa-stabilní rozdělení, oblasti přitažlivosti maxima, GEV, Gumbelovo rozdělení, Weibullovo rozdělení, zobecněné Paretovo rozdělení (GPD).
Literatura:Povinná literatura:
[1] P. Embrechts, C. Klüppelberg, T. Mikosch, Modelling Extremal Events, New York Springer, 1997.

Doporučená literatura:
[2] S. Coles, An Introduction to Statistical Modeling of Extreme Values, Springer-Verlag London, 2001.
[3] P. Embrechts, H. Schmidli, Modelling of extremal events in insurance and finance, New York, Springer, 1994.

Míra a pravděpodobnost01MIP Kůs 4+2 z,zk - - 6 -
Předmět:Míra a pravděpodobnost01MIPdoc. Ing. Hobza Tomáš Ph.D. / Ing. Kůs Václav Ph.D.----
Anotace:Předmět je věnován důkladnějšímu úvodu do teorie pravděpodobnosti na úrovni teorie míry a to jak pro diskrétní modely a spojitá rozložení, tak pro obecná rozložení náhodných veličin. Probrány jsou příklady rozdělení včetně vícerozměrného Gaussova rozdělení a jejich vlastnosti. Dále neintegrální i integrální charakteristiky veličin (E,D...), typy konvergencí v prostoru náhodných veličin (Lp, P, s.j., D) a jsou odvozeny různé varianty limitních vět (ZVČ, CLT).
Osnova:1. Axiomy pravděpodobnostního prostoru, sigma-algebry, pravděpodobnostní míra.
2. Závislé a nezávislé jevy. Borelovské množiny, měřitelné funkce, náhodné veličiny a rozdělení pravděpodobnosti.
3. Radon-Nikodymova věta. Diskrétní a absolutně spojitá rozdělení, příklady.
4. Produktivní míra, integrál podle pravděpodobnostní míry.
5. Střední hodnota náhodné veličiny, obecné a centrální momenty.
6. Prostory Lp, Schwarzova nerovnost, Čebyševova nerovnost, kovariance.
7. Charakteristická funkce a její vlastnosti, použití, reprodukční vlastnosti rozdělení.
8. Konvergence skoro jistě, podle středu, podle pravděpodobnosti.
9. Zákony velkých čísel (Čebyšev, Kolmogorov,...).
10. Slabá konvergence, její vlastnosti, Lévyho věta, Slutskyho lemma.
11. Centrální limitní věty, Lindeberg-Fellerův základní CLT, charakterizační Lindebergova podmínka, Berry-Esseenova věta.
12. Vícerozměrné normální rozdělení, vlastnosti.
13. Cochranova věta a nezávislost výběrového průměru a rozptylu, populace, přirozená prodloužení, konstrukce posloupnosti nezávislých pozorování.
Osnova cvičení:Řešení úloh a cvičení z oblastí:
1. Axiomy pravděpodobnostního prostoru.
2. Závislé a nezávislé jevy.
3. Konkrétní diskrétní rozdělení, jejich vlastnosti (Binomické, Poissonovo, Pascalovo, Geometrické, Hypergeometrické, Multinomické rozdělení).
4. Konkrétní absolutně spojitá rozdělení, jejich vlastnosti (Rovnoměrné, Gamma, Beta, Normální, Exponenciální,...).
5. Konstrukce nových rozdělení transformacemi (Studentovo, Chi-kvadrát, Fisher-Snedecerovo) a jejich kvantily.
6. Výpočet charakteristických funkcí, středních hodnot a momentů konkrétních rozdělení.
7. Kovariance a korelace vybraných veličin.
8. Zákony velkých čísel a Centrální limitní věty - asymptotika a ukázky použití.
9. Dvourozměrné normální rozdělení.
Cíle:Znalosti:
Pojmy a souvislosti v následujících oblastech: Pravděpodobnostní míra, jevy, náhodné veličiny, rozdělení pravděpodobnosti, střední hodnota, kovariance, charakteristická funkce, konvergence, limitní věty, vícerozměrné normální rozdělení.

Schopnosti:
Na úrovni teorie míry schopnost zpracovávat základní pravděpodobnostní modely s hlubším pochopením náhodných zákonitostí jak v teoretii tak vzhledem k praktickému použití.
Požadavky:01MAA3-4 nebo 01MAAB3-4.
Rozsah práce:Pravidelné týdenní domácí úlohy. Opravované a konzultované s jednotlivými studenty.
Kličová slova:Pravděpodobnostní míra, jevy, náhodné veličiny, rozdělení pravděpodobnosti, střední hodnota, kovariance, charakteristická funkce, konvergence, limitní věty, normální rozdělení.
Literatura:Povinná literatura:
[1] Rényi A., Teorie pravděpodobnosti, Academia, Praha, 1972.
[2] Taylor J.C., An Introduction to Measure and Probability, Springer, 1997.

Doporučená literatura:
[3] Jacod J., Protter P., Probability Essentials, Springer, 2000.
[4] Schervish M.J., Theory of Statistics, Springer, 1995.

Spolehlivost systémů a klinické experimenty01SKE Kůs - - 2+0 kz - 3
Předmět:Spolehlivost systémů a klinické experimenty01SKEIng. Kůs Václav Ph.D.-2+0 KZ-3
Anotace:Cílem přednášky je předložit matematické principy obecné teorie spolehlivosti systémů a techniky analýzy dat o přežití, spolehlivost komponentních systémů, některé asymptotické výsledky teorie spolehlivosti, koncept cenzorovaných experimentů a jejich zpracování v klinickém výzkumu (life-time modely). Postupy budou ilustrovány na praktických úlohách zpracování dat ze zkoušek životnosti materiálů a z klinického výzkumu.
Osnova:1. Funkce spolehlivosti, střední doba do poruchy, intenzita poruch, podmíněná spolehlivost, střední reziduální doba života.
2. Systémy s monotonní intenzitou poruch a jejich charakterizace, TTT transfromace a její využití.
3. Binomické, exponenciální rozdělení, Poissonův proces, Weibullovo rozdělení a jeho flexibilita, praktické příklady.
4. Zobecněné Gamma a Erlangovo rozdělení, Rayleighovo rozdělení, Inverzní Gaussovo, Birnbaum-Saundersův model.
5. Analýza spolehlivosti komponentních systémů, sériový, paralelní, k-oo-n, můstkové systémy, pivotální dekompozice.
6. Opravitelné a zálohované systémy, perfektní a neperfektní přepínače, výpočty spolehlivosti.
7. Asymptotické rozdělení minimální doby do poruchy, sériově-paralelní systémy, Gumbelovo rozdělení.
8. Životnostní data - cenzorování (typu I, typu II, náhodné, smíšené), maximálně věrohodné a bayesovské odhady v cenzorovaných systémech.
9. Neparametrické přístupy, Kaplanův-Meierův odhad spolehlivosti, Nelsonův odhad kumulativní intenzity poruch.
10. Coxův model proporcionálních rizik, jeho vlastnosti, testování PH předpokladu, použití, ukázka.
11. Praktické aplikace v klinickém výzkumu, případové studie v biometrii, zpracování konkrétních dat.
Osnova cvičení:
Cíle:Znalosti:
Statistické postupy pro analýzu životnosti objektů s náhodným chováním a jejich použití ve spolehlivostních stochastických úlohách.

Schopnosti:
Orientace v různých stochastických spolehlivostních více komponentních systémech a jejich vlastnostech.
Požadavky:01MAS nebo 01PRST
Rozsah práce:Zpracování konkrétního souboru dat z klinického výzkumu a individuální presentace výstupů.
Kličová slova:Funkce spolehlivosti, intenzita poruch, Weibullovo rozdělení, komponentní systémy, asymptotické metody, censorování, aplikace, klinický výzkum.
Literatura:Povinná literatura:
[1] Rausand M., Hoyland A., System Reliability Theory: Models, Statistical Methods, and Applications, Second Ed., Willey, 2004.

Doporučená literatura:
[2] Kleinbaum D.G., Survival Analysis, Springer, 1996.
[3] Lange N, et al., Case studies in Biometry, Wiley, 1994.
[4] Kovalenko I.N., Kuznetsov N.Y., Pegg P.A., Mathematical theory of reliability of time dependent systems with practical applications, Wiley, 1997.

Statistická teorie rozhodování01STR Kůs - - 2+0 zk - 2
Předmět:Statistická teorie rozhodování01STRIng. Kůs Václav Ph.D.-2+0 ZK-2
Anotace:Obsahem předmětu jsou statistické techniky pro obecné rozhodovací postupy založené na optimalizaci vhodného stochastického kritéria, jejich vzájemné srovnání z hlediska jejich vlastností a použití.
Osnova:1. Obecné principy klasické statistiky.
2. Ztrátové a rizikové funkce, rozhodovací funkce, optimální rozhodnutí a strategie.
3. Bayesovská a minimaxní řešení rozhodovacích úloh, princip přípustnosti a jeho důsledky pro klasickou statistiku.
4. Konvexní ztrátové funkce, vlastnosti bayesovských odhadů.
5. Nestrannost, postačitelnost, Rao-Blackwellova věta a její použití pro nalezení UMVUE.
6. Odhady s minimální vzdáleností.
7. Výpočetní aspekty bayesovských metod, klasické numerické postupy, pravděpodobnostní a aproximativní metody výpočtu.
8. Ukázka použití pro případ pozorování z oblasti analýzy dat o přežití při náhodném cenzorování dat.
Osnova cvičení:
Cíle:Znalosti:
Principy teorie rozhodování s náhodnými prvky a jejich použití v optimalizačních úlohách.

Schopnosti:
Úspěšně vyřešit zadanou praktickou úlohu z oblasti strategie rozhodování, najít správný model rizika, aplikovat ho a dovést výpočet do numerického schématu pro konečné získání rozhodovací funkce.
Požadavky:01MAS nebo 01PRST, doporučeno 01MIP.
Rozsah práce:
Kličová slova:Ztrátová funkce, optimální strategie, bayesovské riziko, minimaxní řešení, přípustnost, aproximativní výpočet.
Literatura:Povinná literatura:
[1] Berger J.O., Statistical Decision Theory and Bayesian Analysis, Springer, N.Y., 1985.

Doporučená literatura:
[2] Fishman G.S., Monte Carlo, Springer, 1996.

Divergenční statistické metody a jejich aplikace ve fyzice elementárních částic (Fermilab / CERN)

školitel: Ing. Václav Kůs, Ph.D.
e-mail: zobrazit e-mail
typ práce: dizertační práce
zaměření: MI_MM, MI_AMSM, II_SIMI
klíčová slova: Phi-divergence, Statistické vzdálenosti, Robustnost, Eficience, experimenty D0, NOvA, DUNE
popis: Cílem tématu je odvodit a aplikovat nové odhady hustot pravděpodobnosti založené na jádrových metodách a dále na metodě minimální vzdálenosti (divergence), prozkoumat jejich statistické vlastnosti jak teoreticky, tak experimentálně, provést teoretické i simulační testování a srovnání dosažených odhadů se stávajícími používanými metodami. Následně tyto postupy aplikovat v oblasti separace signálů elementárních částic z urychlovačů Fermilab (resp. Cern) a na neutrinové experimenty NOvA a DUNE. Očekávaným výstupem práce jsou vedle teoretických výsledků také konkrétní praktické výsledky z fyziky vysokých energií. ----------------------------------- Práce doktoranda na tomto teoreticko-aplikovaném tématu tedy spočívá ve dvou fázích: ----------------------------------- I) FÁZE VÝVOJE NOVÝCH INFORMAČNĚ-TEORETICKÝCH DIVERGENCÍ A METRIK, ODVOZENÍ TEORETICKÝCH VLASTNOSTÍ NOVÝCH DIVERGENCÍ A STATISTICKÝCH ODHADŮ, TESTOVANÍ VLASTNOSTÍ A IDENTIFIKACE MODELU: Pro danou vzdálenost D definujeme odhad f hustoty f_0 jako takovou hustotu z dané množiny hustot L, pro kterou je vzdálenost D jí odpovídající distribuční funkce F od empirické distribuční funkce F_n minimální. Pro takovéto odhady bude vyšetřována jejich robustnost, eficience a konsistence vzhledem k různým informačním divergencím a metrikám. Půjde např. o tzv. blendované divergence, LeCamovy, nové Kolmogorov-Cramérovy vzdálenosti a power disparity pro různé hodnoty vstupních parametrů. K tomu účelu budou používány a odvozovány dominační vztahy mezi jednotlivými divergencemi a ostatními metrikami (Kolmogorov, Totální variace, Cramér-von Mises). V hlavním zorném úhlu práce budou velmi perspektivní nedávno definované skórové funkce M_\rho, které ještě dále zobecňují pojem divergencí a zahrnují v sobě vedle histogramových odhadů i Kolmogorovské odhady neznámé hustoty pravděpodobnosti. Tyto divergenční metody odhadů hustot budou srovnány jak s maximálně věrohodnými parametrickými odhady, tak především s pokročilejšími jádrovými odhady typu ‚adaptive kernel + least squares cross validation‘. Následně naprogramované metody odhadu hustot budou odzkoušeny na generovaných pseudonáhodných posloupnostech, numericky bude ověřen řád konsistence v dané divergenci D a numericky prošetřena robustnost odhadů při různém stupni a typu znečištění datových souborů, např. při znečištění Gaussovým, rovnoměrným, Cauchyho, Logistickým či Laplaceovým rozdělením. ------------------------------------ Tato první fáze úkolu je řešena ve spolupráci s Universidad Miguel Hernandéz, CIO, Elche, Španělsko (prof. D. Morales). ------------------------------------ Předpokládá se, že doktorand v rámci této etapy výzkumu navštíví zmíněnou spolupracující instituci na dlouhodobý pobyt, pravděpodobně Erasmus+. ------------------------------------ (II) FÁZE VÝVOJE A APLIKACE DIVERGENČNÍCH METOD NA SEPARACI SIGNÁLU V ROZPADOVÝCH KANÁLECH EXPERIMENTU D0/ATLAS A NA DATOVÉ SADY Z NEUTRINOVÉHO EXPERIMENTU NOvA a DUNE ve-FERMILABu: Úkolem bude vytěžit maximum informací z dat získaných na experimentech Fermilab (D0, NOvA, DUNE) nebo CERN (Atlas). Při zpracovaní dat budou použity pokročilé statisticky orientované robustní metody separace signálu, které byly testovány ve fázi I. Tato aplikačně zaměřená oblast v sobě zahrnuje práci s fyzikální strukturou poskytnutých dat a s tím spojenou vhodnou selekci podmnožin fyzikálních parametrů. Rozvíjena bude dále separační metoda založená na divergenčním rozhodovacím stromě s učitelem (ozn. SDDT – viz diplomová práce P.Bouře), přičemž v uzlech SDDT stromu by měly být použity právě jádrové a divergenční metody odhadů hustot vyvinuté ve fázi I. Divergenční separace bude srovnána se zobecněnými lineárními modely (ZLM), které jsou podobné s fyziky obecně používanými CUT-ovacími postupy. Součástí práce bude testování shody Monte Carlo simulací s reálnými daty pro vážená data. Použití běžných statistických testů (χ2, Kolmogorov-Smirnov, power divergence) je problematické, protože nejsou v literatuře rozpracovány právě pro případ vážených dat, přesto je fyzikální komunita používá k rozhodnutím o selekci proměnných pro separace. Regulární použití těchto testů by mělo být vyjasněno v rámci této disertační práce. Klíčem k úspěšnému použití separačních metod bude vyvinutí vhodné techniky zvané ‚projection pursuit‘ pro vícedimenzionální data, používající k redukci dimenze úlohy projekce založené na tzv. projekčním indexu I(f), který budeme volit ve formě vhodné divergence, viz sekce 6.5.3 v knize Silverman, B.W., Density Estimation for Statistics and Data Analysis, Chapman & Hall, 1986. Účelem fáze II je zpřesnění fyzikálních vlastností těchto částic a upřesnění charakteristik zkoumaných rozpadových procesů (D0/Atlas) a dále především odhady pravděpodobností oscilací neutrin (NOvA + DUNE). ----------------------------------- Tato druhá fáze je řešena ve spolupráci s Fyzikálním ústavem AV ČR (Dr. Lokajíček) a s Fermiho národní laboratoří FNAL v Illinois, USA (Dr. Andreas Jung z D0, Dr. Maury Goodman z DUNE). Doktorand bude začleněn do týmu HEP výzkumné podskupiny v rámci KM: Václav Kůs, Vladislav Šimák, Petr Vokáč, Jiří Franc + studenti. ----------------------------------- V rámci této druhé etapy bude student navštěvovat každoročně Fermilab. ------------------------------------
literatura: [1] Frýdlová, I. - Vajda, I. - Kůs, V.: Modified Power Divergence Estimators In Normal Model- Simulation And Comparative Study. Kybernetika. 2012, vol. 48, no. 4, p. 795-808. ISSN 0023-5954. [2] Kůs, V.: Nonparametric density estimates consistent of the order of n(-1/2) in the L-1-norm. Metrika. 2004, vol. 60, no. 1, p. 1-14. ISSN 0026-1335. [3] V. Kůs - D. Morales - I. Vajda: Extensions of the Parametric Families of Divergences Used in Statistical Inference, Kybernetika, volume 44 (2008), number 1 , pages 95-112. [4] Kůs, V.: Blended phi-divergences with examples. Kybernetika. 2003, vol. 39, no. 1, p. 43-54. ISSN 0023-5954. [5] Hrabáková, J. - Kůs, V.: The Consistency and Robustness of Modified Cramér - Von Mises and Kolmogorov - Cramér Estimators. Communication in Statistics-Theory and Method. 2013, vol. 42, no. 20, p. 3665-3677. ISSN 0361-0926. [6] Štěpánek, M. - Franc, J. - Kůs, V.: Model based clustering method as a new multivariate technique in high energy physics. Journal of Physics: Conference Series. 2014, vol. 490, no. 1, art. no. 012225, ISSN 1742-6588. [7] Franc, J. - Bouř, P. - Štěpánek, M. - Kůs, V.: New Statistical Techniques in the Measurement of the inclusive Top Pair Production Cross Section. In Top 2014 Conference proceeding. Stanford: Stanford University, 2014. [8] Finger, R. - Kůs, V.: Minimum score statistical estimation and its robustness. Forum Statisticum Slovacum. 2015, vol. XI, no. 6, p. 46-53. ISSN 1336-7420. [9] Štěpánek, M. - Franc, J. - Kůs, V.: Modification of Gaussian mixture models for data classification in high energy physics. Journal of Physics: Conference Series. 2015, vol. 574, no. 1, art. no. 012150, ISSN 1742-6588. [10] Jung, A. - Franc, J. - Stěpánek, M.- et al. (v rámci D0 kolaborace): Measurement of the inclusive ttbar production cross section in ppbar collisions at sqrt s = 1.96 TeV and determination of the top quark pole mass, (in EB Editorial Bord Fermilab). ------------------------------------ Další odborná nezávislá literatura z oboru MDE, HEP, FNAL reporty, konferenční příspěvky v PoS (It), IEEE Xplore,...
poznámka: Výzkumná skupina při KM, jejímž členem bude příslušný PGS student, naváže na podporu MŠMT CZ v rámci grantu LG12020 (Advanced statistical analysis and non-statistical separation techniques for physical processing detection in data sets sampled by means of elementary particle accelerators), příjemce V.Kůs (KM), 2012-2014, a bude pokračovat s podporou následujících projektů: - LG 15047 (Collaboration on experiments in Fermi National Accelerator Laboratory, USA), příjemce Dr. Lokajíček z FzÚ, spolupříjemce Kdaiz+KM, 2015-2017. - LM 2015068 (Research infrastructure for FERMILAB), příjemce Dr. Lokajíček z FzÚ, spolupříjemce Kdaiz+KM, 2016-2019.
naposledy změněno: 23.05.2016 10:36:12

Robustní bodové odhady a testování statistických hypotéz s aplikacemi v elastické defektoskopii

školitel: Ing. Václav Kůs, Ph.D.
e-mail: zobrazit e-mail
typ práce: dizertační práce
zaměření: MI_MM, MI_AMSM, II_SIMI
klíčová slova: Phi-divergence, Statistické testy, Robustnost, Eficience, Akustická emise, PM identifikace
popis: Cílem tématu je odvodit nové robustní varianty parametrických i neparametrických statistických testů hypotéz založených na odhadech s minimální divergencí, prozkoumat jejich statistické vlastnosti eficience a robustnosti prostřednictvím jejich influenčních funkcí (IF) a porovnat jejich gross error sensitivitu. Provést teoretické i simulační srovnání odvozených testů se stávajícími používanými metodami, následně tyto testy aplikovat v oblasti nedestruktivní detekce materiálových vad a struktury elastických materiálů. Očekávaným výstupem disertační práce jsou nejen teoretické výsledky vlastností nových testů, ale také konkrétní praktické výsledky z průmyslových diagnostických úloh. ----------------------------------- Práce doktoranda na tomto teoreticko-aplikovaném tématu tedy spočívá ve dvou fázích: ----------------------------------- I) FÁZE VÝVOJE NOVÝCH INFORMAČNĚ-TEORETICKÝCH DIVERGENČNÍCH TESTŮ, ODVOZENÍ JEJICH TEORETICKÝCH VLASTNOSTÍ, TESTOVANÍ ROBUSTNÍCH VLASTNOSTÍ: V hlavním zorném úhlu práce budou velmi perspektivní nedávno definované odhady s minimální Rényiho rozložitelnou vzdáleností. Ty budou použity pro konstrukci nových robustifikovaných testů hypotéz pro vybrané rodiny pravděpodobnostních hustot včetně odvození příslušných influenčních funkcí a gross error sensitivit použitých Rényiho odhadů. Bude pokračováno ve výzkumu zobecněného Waldova testu (viz diplomová práce p. R.Fingera), spočítány testovací statistiky pro další rodiny hustot a bude ověřena závislost robustnosti testů na volitelném vstupním parametru použité divergence. V dalším kroku bude teoreticky vyšetřována asymptotika testovací statistiky 2nD_R ve formě Rényiho vzdálenosti D_R mezi robustně odhadnutou hustotou f_\hat{\theta} a skutečnou hustotou modelu f_\theta, kde \hat{\theta} značí divergenční odhad parametru na základě vhodné verze zvolené Rényho rozložitelné divergence. Tyto nové testy budou rozpracovány pro případ Exponenciálního rozdělení a Gaussovy rodiny, případně Weibullovy distribuce, pokud to bude výpočetně schůdné. Pomocí navržené testovací statistiky, založené na vzdálenosti D_R mezi hustotami dvou různých náhodných výběrů, bude testována dvouvýběrová hypotéza typu \tehat_1=\theta_2. Pro tento test bude muset doktorand odvodit vlastní asymptotické rozdělení Rényiho rozložitelné testovací statistiky. Pomocnou ruku v tomto směru by měly podat nedávné příbuzné výsledky v této oblasti, viz např. Basu A, Mandal A, Martin N, Pardo L: Testing statistical hypotheses based on the density power divergence, Inst.Statist.Math. 2013, 65(2). Asymptotické vlastnosti a robustnost odvozených testů budou odzkoušeny na generovaných pseudonáhodných posloupnostech, simulací bude ověřen průběh empirické hladiny a síly testů při různém stupni a typu znečištění datových souborů, např. při \eps-znečištění gaussovským šumem. ------------------------------------ Tato první fáze úkolu bude řešena ve spolupráci s Universidad Compultence de Madrid, Španělsko (prof. L. Pardo). ------------------------------------ Předpokládá se, že student v rámci této etapy výzkumu navštíví zmíněnou spolupracující instituci na dlouhodobý pobyt, pravděpodobně Erasmus+. ------------------------------------ II) FÁZE VÝVOJE A APLIKACE DIVERGENČNÍCH METOD NA KLASIFIKACI ZDROJŮ AKUSTICKÉ EMISE A IDENTIFIKACI ELASTICITY V HYSTEREZNÍCH MATERIÁLECH: Půjde o klasifikaci zdrojů akustické emise (AE), tzn. charakterizovat typ a případně velikost zdroje AE (mikrotrhlina, únik substance, závada, úder, typ materiálu,...) s přihlédnutím k nehomogenitám materiálů. K tomu účelu je nutné aplikovat stochastické metody detekce příchodů signálů jako jsou např. standardní CUSUM nebo Singular Spectral Analysis (SSA). My se budeme však soustředit na ty přístupy využívající k detekci signálů právě testování statistických hypotéz pomocí nových divergenčních kritérií, např. při testování rozptylu v časové řadě signálu. Pro klasifikaci zdrojů AE by měly být použity stochastické klasifikátory ve formě divergenčních rozhodovacích stromů (phiDT), které ve svých uzlech snižují dimenzi úlohy výběrem separačních proměnných pomocí divergenčních testů hypotéz pro shodu/neshodu rozdělení jednotlivých příznaků. Zde budou využity divergenční robustní testy z fáze I. Následovat bude i aplikace vyvinutých robustních statistických testů hypotéz na zkoumání statistické významnosti změny tzv. indexů porušení (damage indexes) po provedení identifikace neznámé struktury elastického hysterezního materiálu, tzn. po identifikaci dvourozměrné hustoty pravděpodobnosti s kompaktním nosičem v Preisach-Mayergoyzově (PM) prostoru. Tyto divergenční testy budou použity pro testování a porovnání indexů poškození anti-vibračních nosníků výškových budov před a po poškozujícím zatížení. ----------------------------------- Tato fáze je řešena ve spolupráci s - University of Granada, Dept. Applied Physics, Researching Group SNADS (Signal and Numerical Analysis in Dynamical Systems) (Dr. A. Gallego), - INSA Val de Loire, Blois, Francie (prof. S. Dos Santos), - Ústavem termomechaniky AV ČR (ing. Z. Převorovský, CSc.). ----------------------------------- V rámci této druhé etapy doktorand navštíví uvedené spolupracující instituce v rámci grantu SGS - Aplikace stochastických modelů na vybrané socio-fyzikální monitorovací systémy, 2015-2017 + případné pokračování. -----------------------------------
literatura: [1] Kůs, V.: Nonparametric density estimates consistent of the order of n(-1/2) in the L-1-norm. Metrika. 2004, vol. 60, no. 1, p. 1-14. ISSN 0026-1335. [2] V. Kůs - D. Morales - I. Vajda: Extensions of the Parametric Families of Divergences Used in Statistical Inference, Kybernetika, volume 44 (2008), number 1 , pages 95-112. [3] Kůs, V.: Blended phi-divergences with examples. Kybernetika. 2003, vol. 39, no. 1, p. 43-54. ISSN 0023-5954. [4] V. Kůs - M. Záveský - Z. Převorovský: Acoustic Emission Defects Localized by Means of Geodetic Iterative Procedure - Algorithms, Tests, AE Experiment, Proceedings of 30th EWGAE and 7th ICAE, pp. 536-547, Granada 2012. [5] Farová, Z. - Kůs, V. - Dos Santos, S.: Classification and Separation of Emitted Signals through phi-Divergence Based Algorithms. In SPMS 2012 Proceedings. Prague: CTU, 2012, vol. 3, p. 41-50. ISBN 978-80-01-05130-6. [6] Kůs, V. - Tláskal, J. - Farová, Z. - Dos Santos, S.: Signal Detection, Separation & Classification under Random Noise Background. In BEC 2012 - Proceedings of the 13th Biennial Baltic Electronics Conference. Tallinn: Tallinn Technical University, 2012, p. 287-290. ISBN 978-1-4673-2772-5. [7] Frýdlová, I. - Vajda, I. - Kůs, V.: Modified Power Divergence Estimators In Normal Model- Simulation And Comparative Study. Kybernetika. 2012, vol. 48, no. 4, p. 795-808. ISSN 0023-5954. [8] Papoušková J., Kůs V., Dos Santos S., PM space Density Identification for Nonlinear Physical Systems: L2 and D-Minimization Methods, POMA (publisher ASA - Acoustical Society of America), 2012, Vol 16, pp. 045018 (11 pages). [9] Hrabáková, J. - Kůs, V.: The Consistency and Robustness of Modified Cramér - Von Mises and Kolmogorov - Cramér Estimators. Communication in Statistics-Theory and Method. 2013, vol. 42, no. 20, p. 3665-3677. ISSN 0361-0926. [10] Finger, R. - Kůs, V.: Minimum score statistical estimation and its robustness. Forum Statisticum Slovacum. 2015, vol. XI, no. 6, p. 46-53. ISSN 1336-7420. ------------------------------------ Další odborná nezávislá literatura z oboru MDE, AE, v POMA (USA), AIP (USA), IEEE Xplore,... ------------------------------------
naposledy změněno: 23.05.2016 10:40:12

za obsah této stránky zodpovídá: Radek Fučík | naposledy změněno: 7.8.2011
Trojanova 13, 120 00 Praha 2, tel. 224 358 540, pevná linka 224 923 098, fax 234 358 643
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky