Ústav teorie informace a automatizace

Jste zde

BSc./Mgr. Téma: Metody shlukování strukturovaných dat (Šmídl)

Typ práce: 
bakalářská
diplomová
Kontakt/telefon: 
ÚTIA AV ČR, v.v.i., oddělení AS, 266052420
Klíčová slova: 
strojové učení, strukturovaná data, shlukování

Shlukování je klasická statistická metoda používaná ve strojovém učení na datech, na kterých je definována vzdálenost (například Eukleidova vzdálenost vektorů). V praxi se ovšem setkáváme s daty, která mají složitější relační strukturu, např. obsah nákupního košíku v e-shopu. Definice vzdálenosti mezi takovými daty je mnohem složitější. Nabízí se využít metody statistického popisu dat, které se vzdálenosti učí. Pro zmíněná data je vhodným modelem bodový proces. Metody shlukování založené na těchto metodách jsou zatím velice jednoduché. Cílem práce je seznámit se s klasickými metodymi používanými na vektorových datech, vytvořit obdobné metody pro bodové procesy a aplikovat je na dodaná reálná data.

Literatura: 

1. Bishop, Christopher M. Pattern recognition and machine learning. Vol. 4. No. 4. New York: springer, 2006.

2. Vo, B. N., Dam, N., Phung, D., Tran, Q. N., & Vo, B. T. (2018). Model-based learning for point pattern data. Pattern Recognition, 84, 136-151.

3. Šmídl, V., & Quinn, A. (2006). The variational Bayes method in signal processing. Springer Science & Business Media.

10.10.2022 - 10:37