Institute of Information Theory and Automation

You are here

BSc./Mgr. Téma: Metody shlukování strukturovaných dat (Šmídl)

Type of Work: 
bachelor
diploma
Affiliation/Phone: 
ÚTIA AV ČR, v.v.i., oddělení AS, 266052420
Keywords: 
strojové učení, strukturovaná data, shlukování

Shlukování je klasická statistická metoda používaná ve strojovém učení na datech, na kterých je definována vzdálenost (například Eukleidova vzdálenost vektorů). V praxi se ovšem setkáváme s daty, která mají složitější relační strukturu, např. obsah nákupního košíku v e-shopu. Definice vzdálenosti mezi takovými daty je mnohem složitější. Nabízí se využít metody statistického popisu dat, které se vzdálenosti učí. Pro zmíněná data je vhodným modelem bodový proces. Metody shlukování založené na těchto metodách jsou zatím velice jednoduché. Cílem práce je seznámit se s klasickými metodymi používanými na vektorových datech, vytvořit obdobné metody pro bodové procesy a aplikovat je na dodaná reálná data.

Bibliography: 

1. Bishop, Christopher M. Pattern recognition and machine learning. Vol. 4. No. 4. New York: springer, 2006.

2. Vo, B. N., Dam, N., Phung, D., Tran, Q. N., & Vo, B. T. (2018). Model-based learning for point pattern data. Pattern Recognition, 84, 136-151.

3. Šmídl, V., & Quinn, A. (2006). The variational Bayes method in signal processing. Springer Science & Business Media.

2022-10-10 10:37