Data mining s využitím Boltzmannovy entropie

advisor: doc. Ing. Jaromír Kukal, Ph.D.
e-mail: show e-mail
type: bachelor thesis, master thesis
branch of study: MI_MM, MI_AMSM, MINF, APIN
key words: dolování dat, počet stavů systému, identifikační stromy, náhodné lesy, data wrapping
description: Celá řada metod dolování dat a strojového učení je založena na klasické Shannonově entropii. Tu je v aplikacích možné nahradit Rényiovou entropií, jejíž parametr ovlivňuje chování jednotlivých metod. Pokud nechceme při zpracování dat vycházet z teoretických pravděpodobností jevů nebo jejich odhadu, pak můžeme využít základní nástroj statistické termodynamiky - Boltzmannovu entropii úměrnou logaritmu počtu stavů systému, kterou určíme z absolutních četností jevů pomocí elementární kombinatoriky. Tak se otevírají nové cesty zpracovávání kontingenčních tabulek, vytváření identifikačních stromů, generování náhodných lesů, redukce dimenze dat a dalších nástrojů data miningu. Předpokladem je znalost základů matematické statistiky, kombinatoriky a programování v MATLABu.
references: [1] Dlask, M., Kukal, J., Translation and Rotation Invariant Method of Renyi Dimension Estimation, Chaos, Solitons & Fractals, 114(C):536-541 (2018)

[2] Berka, P., Dobývání znalostí z databází, Academia (2003)
last update: 12.03.2022 23:29:16

administrator for this page: Ľubomíra Dvořáková | last update: 09/12/2011
Trojanova 13, 120 00 Praha 2, tel. +420 770 127 494
Czech Technical Univeristy in Prague | Faculty of Nuclear Sciences and Physical Engineering | Department of Mathematics