Divergenční statistické metody a jejich aplikace ve fyzice elementárních částic (Fermilab / CERN)

advisor: Ing. Václav Kůs, Ph.D.
e-mail: show e-mail
type: phd thesis
branch of study: MI_MM, MI_AMSM, II_SIMI
key words: Phi-divergence, Statistické vzdálenosti, Robustnost, Eficience, experimenty D0, NOvA, DUNE
description: Cílem tématu je odvodit a aplikovat nové odhady hustot pravděpodobnosti založené na jádrových metodách a dále na metodě minimální vzdálenosti (divergence), prozkoumat jejich statistické vlastnosti jak teoreticky, tak experimentálně, provést teoretické i simulační testování a srovnání dosažených odhadů se stávajícími používanými metodami. Následně tyto postupy aplikovat v oblasti separace signálů elementárních částic z urychlovačů Fermilab (resp. Cern) a na neutrinové experimenty NOvA a DUNE. Očekávaným výstupem práce jsou vedle teoretických výsledků také konkrétní praktické výsledky z fyziky vysokých energií. ----------------------------------- Práce doktoranda na tomto teoreticko-aplikovaném tématu tedy spočívá ve dvou fázích: ----------------------------------- I) FÁZE VÝVOJE NOVÝCH INFORMAČNĚ-TEORETICKÝCH DIVERGENCÍ A METRIK, ODVOZENÍ TEORETICKÝCH VLASTNOSTÍ NOVÝCH DIVERGENCÍ A STATISTICKÝCH ODHADŮ, TESTOVANÍ VLASTNOSTÍ A IDENTIFIKACE MODELU: Pro danou vzdálenost D definujeme odhad f hustoty f_0 jako takovou hustotu z dané množiny hustot L, pro kterou je vzdálenost D jí odpovídající distribuční funkce F od empirické distribuční funkce F_n minimální. Pro takovéto odhady bude vyšetřována jejich robustnost, eficience a konsistence vzhledem k různým informačním divergencím a metrikám. Půjde např. o tzv. blendované divergence, LeCamovy, nové Kolmogorov-Cramérovy vzdálenosti a power disparity pro různé hodnoty vstupních parametrů. K tomu účelu budou používány a odvozovány dominační vztahy mezi jednotlivými divergencemi a ostatními metrikami (Kolmogorov, Totální variace, Cramér-von Mises). V hlavním zorném úhlu práce budou velmi perspektivní nedávno definované skórové funkce M_rho, které ještě dále zobecňují pojem divergencí a zahrnují v sobě vedle histogramových odhadů i Kolmogorovské odhady neznámé hustoty pravděpodobnosti. Tyto divergenční metody odhadů hustot budou srovnány jak s maximálně věrohodnými parametrickými odhady, tak především s pokročilejšími jádrovými odhady typu ‚adaptive kernel + least squares cross validation‘. Následně naprogramované metody odhadu hustot budou odzkoušeny na generovaných pseudonáhodných posloupnostech, numericky bude ověřen řád konsistence v dané divergenci D a numericky prošetřena robustnost odhadů při různém stupni a typu znečištění datových souborů, např. při znečištění Gaussovým, rovnoměrným, Cauchyho, Logistickým či Laplaceovým rozdělením. ------------------------------------ Tato první fáze úkolu je řešena ve spolupráci s Universidad Miguel Hernandéz, CIO, Elche, Španělsko (prof. D. Morales). ------------------------------------ Předpokládá se, že doktorand v rámci této etapy výzkumu navštíví zmíněnou spolupracující instituci na dlouhodobý pobyt, pravděpodobně Erasmus+. ------------------------------------ (II) FÁZE VÝVOJE A APLIKACE DIVERGENČNÍCH METOD NA SEPARACI SIGNÁLU V ROZPADOVÝCH KANÁLECH EXPERIMENTU D0/ATLAS A NA DATOVÉ SADY Z NEUTRINOVÉHO EXPERIMENTU NOvA a DUNE ve-FERMILABu: Úkolem bude vytěžit maximum informací z dat získaných na experimentech Fermilab (D0, NOvA, DUNE) nebo CERN (Atlas). Při zpracovaní dat budou použity pokročilé statisticky orientované robustní metody separace signálu, které byly testovány ve fázi I. Tato aplikačně zaměřená oblast v sobě zahrnuje práci s fyzikální strukturou poskytnutých dat a s tím spojenou vhodnou selekci podmnožin fyzikálních parametrů. Rozvíjena bude dále separační metoda založená na divergenčním rozhodovacím stromě s učitelem (ozn. SDDT – viz diplomová práce P.Bouře), přičemž v uzlech SDDT stromu by měly být použity právě jádrové a divergenční metody odhadů hustot vyvinuté ve fázi I. Divergenční separace bude srovnána se zobecněnými lineárními modely (ZLM), které jsou podobné s fyziky obecně používanými CUT-ovacími postupy. Součástí práce bude testování shody Monte Carlo simulací s reálnými daty pro vážená data. Použití běžných statistických testů (χ2, Kolmogorov-Smirnov, power divergence) je problematické, protože nejsou v literatuře rozpracovány právě pro případ vážených dat, přesto je fyzikální komunita používá k rozhodnutím o selekci proměnných pro separace. Regulární použití těchto testů by mělo být vyjasněno v rámci této disertační práce. Klíčem k úspěšnému použití separačních metod bude vyvinutí vhodné techniky zvané ‚projection pursuit‘ pro vícedimenzionální data, používající k redukci dimenze úlohy projekce založené na tzv. projekčním indexu I(f), který budeme volit ve formě vhodné divergence, viz sekce 6.5.3 v knize Silverman, B.W., Density Estimation for Statistics and Data Analysis, Chapman & Hall, 1986. Účelem fáze II je zpřesnění fyzikálních vlastností těchto částic a upřesnění charakteristik zkoumaných rozpadových procesů (D0/Atlas) a dále především odhady pravděpodobností oscilací neutrin (NOvA + DUNE). ----------------------------------- Tato druhá fáze je řešena ve spolupráci s Fyzikálním ústavem AV ČR (Dr. Lokajíček) a s Fermiho národní laboratoří FNAL v Illinois, USA (Dr. Andreas Jung z D0, Dr. Maury Goodman z DUNE). Doktorand bude začleněn do týmu HEP výzkumné podskupiny v rámci KM: Václav Kůs, Vladislav Šimák, Petr Vokáč, Jiří Franc + studenti. ----------------------------------- V rámci této druhé etapy bude student navštěvovat každoročně Fermilab. ------------------------------------
references: [1] Frýdlová, I. - Vajda, I. - Kůs, V.: Modified Power Divergence Estimators In Normal Model- Simulation And Comparative Study. Kybernetika. 2012, vol. 48, no. 4, p. 795-808. ISSN 0023-5954. [2] Kůs, V.: Nonparametric density estimates consistent of the order of n(-1/2) in the L-1-norm. Metrika. 2004, vol. 60, no. 1, p. 1-14. ISSN 0026-1335. [3] V. Kůs - D. Morales - I. Vajda: Extensions of the Parametric Families of Divergences Used in Statistical Inference, Kybernetika, volume 44 (2008), number 1 , pages 95-112. [4] Kůs, V.: Blended phi-divergences with examples. Kybernetika. 2003, vol. 39, no. 1, p. 43-54. ISSN 0023-5954. [5] Hrabáková, J. - Kůs, V.: The Consistency and Robustness of Modified Cramér - Von Mises and Kolmogorov - Cramér Estimators. Communication in Statistics-Theory and Method. 2013, vol. 42, no. 20, p. 3665-3677. ISSN 0361-0926. [6] Štěpánek, M. - Franc, J. - Kůs, V.: Model based clustering method as a new multivariate technique in high energy physics. Journal of Physics: Conference Series. 2014, vol. 490, no. 1, art. no. 012225, ISSN 1742-6588. [7] Franc, J. - Bouř, P. - Štěpánek, M. - Kůs, V.: New Statistical Techniques in the Measurement of the inclusive Top Pair Production Cross Section. In Top 2014 Conference proceeding. Stanford: Stanford University, 2014. [8] Finger, R. - Kůs, V.: Minimum score statistical estimation and its robustness. Forum Statisticum Slovacum. 2015, vol. XI, no. 6, p. 46-53. ISSN 1336-7420. [9] Štěpánek, M. - Franc, J. - Kůs, V.: Modification of Gaussian mixture models for data classification in high energy physics. Journal of Physics: Conference Series. 2015, vol. 574, no. 1, art. no. 012150, ISSN 1742-6588. [10] Jung, A. - Franc, J. - Stěpánek, M.- et al. (v rámci D0 kolaborace): Measurement of the inclusive ttbar production cross section in ppbar collisions at sqrt s = 1.96 TeV and determination of the top quark pole mass, (in EB Editorial Bord Fermilab). ------------------------------------ Další odborná nezávislá literatura z oboru MDE, HEP, FNAL reporty, konferenční příspěvky v PoS (It), IEEE Xplore,...
note: Výzkumná skupina při KM, jejímž členem bude příslušný PGS student, naváže na podporu MŠMT CZ v rámci grantu LG12020 (Advanced statistical analysis and non-statistical separation techniques for physical processing detection in data sets sampled by means of elementary particle accelerators), příjemce V.Kůs (KM), 2012-2014, a bude pokračovat s podporou následujících projektů: - LG 15047 (Collaboration on experiments in Fermi National Accelerator Laboratory, USA), příjemce Dr. Lokajíček z FzÚ, spolupříjemce Kdaiz+KM, 2015-2017. - LM 2015068 (Research infrastructure for FERMILAB), příjemce Dr. Lokajíček z FzÚ, spolupříjemce Kdaiz+KM, 2016-2019.
last update: 03.03.2021 17:43:18

administrator for this page: Ľubomíra Dvořáková | last update: 09/12/2011
Trojanova 13, 120 00 Praha 2, tel. +420 770 127 494
Czech Technical Univeristy in Prague | Faculty of Nuclear Sciences and Physical Engineering | Department of Mathematics