Data mining s využitím Boltzmannovy entropie
školitel: | doc. Ing. Jaromír Kukal, Ph.D. |
e-mail: | zobrazit e-mail |
typ práce: | bakalářská práce, diplomová práce |
zaměření: | MI_MM, MI_AMSM, MINF, APIN |
klíčová slova: | dolování dat, počet stavů systému, identifikační stromy, náhodné lesy, data wrapping |
popis: | Celá řada metod dolování dat a strojového učení je založena na klasické Shannonově entropii. Tu je v aplikacích možné nahradit Rényiovou entropií, jejíž parametr ovlivňuje chování jednotlivých metod. Pokud nechceme při zpracování dat vycházet z teoretických pravděpodobností jevů nebo jejich odhadu, pak můžeme využít základní nástroj statistické termodynamiky - Boltzmannovu entropii úměrnou logaritmu počtu stavů systému, kterou určíme z absolutních četností jevů pomocí elementární kombinatoriky. Tak se otevírají nové cesty zpracovávání kontingenčních tabulek, vytváření identifikačních stromů, generování náhodných lesů, redukce dimenze dat a dalších nástrojů data miningu. Předpokladem je znalost základů matematické statistiky, kombinatoriky a programování v MATLABu. |
literatura: | [1] Dlask, M., Kukal, J., Translation and Rotation Invariant Method of Renyi Dimension Estimation, Chaos, Solitons & Fractals, 114(C):536-541 (2018)
[2] Berka, P., Dobývání znalostí z databází, Academia (2003) |
naposledy změněno: | 12.03.2022 23:29:16 |
za obsah této stránky zodpovídá:
Čestmír Burdík | naposledy změněno: 9.9.2021