Data mining s využitím Boltzmannovy entropie

školitel: doc. Ing. Jaromír Kukal, Ph.D.
e-mail: zobrazit e-mail
typ práce: bakalářská práce, diplomová práce
zaměření: MI_MM, MI_AMSM, MINF, APIN
klíčová slova: dolování dat, počet stavů systému, identifikační stromy, náhodné lesy, data wrapping
popis: Celá řada metod dolování dat a strojového učení je založena na klasické Shannonově entropii. Tu je v aplikacích možné nahradit Rényiovou entropií, jejíž parametr ovlivňuje chování jednotlivých metod. Pokud nechceme při zpracování dat vycházet z teoretických pravděpodobností jevů nebo jejich odhadu, pak můžeme využít základní nástroj statistické termodynamiky - Boltzmannovu entropii úměrnou logaritmu počtu stavů systému, kterou určíme z absolutních četností jevů pomocí elementární kombinatoriky. Tak se otevírají nové cesty zpracovávání kontingenčních tabulek, vytváření identifikačních stromů, generování náhodných lesů, redukce dimenze dat a dalších nástrojů data miningu. Předpokladem je znalost základů matematické statistiky, kombinatoriky a programování v MATLABu.
literatura: [1] Dlask, M., Kukal, J., Translation and Rotation Invariant Method of Renyi Dimension Estimation, Chaos, Solitons & Fractals, 114(C):536-541 (2018)

[2] Berka, P., Dobývání znalostí z databází, Academia (2003)
naposledy změněno: 12.03.2022 23:29:16

za obsah této stránky zodpovídá: Pavel Strachota | naposledy změněno: 9.9.2021
Trojanova 13, 120 00 Praha 2, tel. +420 770 127 494
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky