Data mining s využitím Boltzmannovy entropie
advisor: | doc. Ing. Jaromír Kukal, Ph.D. |
e-mail: | show e-mail |
type: | bachelor thesis, master thesis |
branch of study: | MI_MM, MI_AMSM, MINF, APIN |
key words: | dolování dat, počet stavů systému, identifikační stromy, náhodné lesy, data wrapping |
description: | Celá řada metod dolování dat a strojového učení je založena na klasické Shannonově entropii. Tu je v aplikacích možné nahradit Rényiovou entropií, jejíž parametr ovlivňuje chování jednotlivých metod. Pokud nechceme při zpracování dat vycházet z teoretických pravděpodobností jevů nebo jejich odhadu, pak můžeme využít základní nástroj statistické termodynamiky - Boltzmannovu entropii úměrnou logaritmu počtu stavů systému, kterou určíme z absolutních četností jevů pomocí elementární kombinatoriky. Tak se otevírají nové cesty zpracovávání kontingenčních tabulek, vytváření identifikačních stromů, generování náhodných lesů, redukce dimenze dat a dalších nástrojů data miningu. Předpokladem je znalost základů matematické statistiky, kombinatoriky a programování v MATLABu. |
references: | [1] Dlask, M., Kukal, J., Translation and Rotation Invariant Method of Renyi Dimension Estimation, Chaos, Solitons & Fractals, 114(C):536-541 (2018)
[2] Berka, P., Dobývání znalostí z databází, Academia (2003) |
last update: | 12.03.2022 23:29:16 |
administrator for this page:
Ľubomíra Dvořáková | last update: 09/12/2011