Klasifikace sekvencí pomocí pravidel vytěžených z dat

školitel: Martin Holeňa
e-mail: zobrazit e-mail
typ práce:
zaměření: MI_MM, MI_AMSM, MINF, APIN
klíčová slova: vytěžování dat (data mining), získávání pravidel z dat, klasifikační pravidla, klasifikace sekvencí
popis: Jedním z klíčových směrů vytěžování dat (data mining) je získávat z dat znalosti reprezentované jako pravidla, tj. implikace nějaké formální logiky. Velký význam pravidlové reprezentace spočívá v tom, že je typicky mnohem srozumitelnější člověku než reprezentace numerická, zvláště když uživatelé získaných znalostí jsou z jiné oblasti než analýza dat a matematika. K hlavním typům pravidel patří pravidla klasifikační, v nichž premisou implikace je konjunkce podmínek na klasifikovaný objekt a důsledkem je příslušnost ke konkrétní třídě. Jejich srozumitelnost je zvláště cenná u objektů se složitější strukturou, na které nelze přímočaře použít úspěšné numerické klasifikátory jako umělé neuronové sítě či klasifikátory založené na opěrných vektorech nadrovin (support vector machines). Důležitým typem takových objektů jsou sekvence kombinací kategoriálních a numerických atributů, často se vyskytující v přírodních vědách, ale také např. v síťové bezpečnosti. Právě takovým typem dat se bude zabývat navržená diplomová práce. Diplomant se seznámí s problematikou klasifikačních pravidel a zejména detailně klasifikačními pravidly pro sekvence kombinací kategoriálních a numerických atributů typu diskriminační kronika (diskriminant chronicle). Naučí se také dobře používat existující pythonovskou implementaci metody pro získávání tohoto typu pravidel z dat. V rámci diplomové práce zobecní tuto metodu ze skalárních celočíselných atributů na vektorové obecné numerické atributy a odpovídajícím způsobem rozšíří její implementaci. Zdokonalenou metodu otestuje na reálných datech dodaných vedoucím práce.
literatura: viz http://www2.cs.cas.cz/~martin/diplomka53.html
naposledy změněno: 02.09.2020 11:12:28

za obsah této stránky zodpovídá: Radek Fučík | naposledy změněno: 12.9.2011
Trojanova 13, 120 00 Praha 2, tel. 224 358 540, pevná linka 224 923 098, fax 234 358 643
České vysoké učení technické v Praze | Fakulta jaderná a fyzikálně inženýrská | Katedra matematiky