Institute of Information Theory and Automation

You are here

Publication details

Criteria Ensembles in Feature Selection

Conference Paper (international conference)

Somol Petr, Grim Jiří, Pudil Pavel


serial: Multiple Classifier Systems, LNCS 5519, p. 304-313 , Eds: Benediktsson J.A., Kittler J., Roli F.

action: Multiple Classifier Systems, (Reykjavik, IS, 10.06.2009-12.06.2009)

research: CEZ:AV0Z10750506

project(s): 1M0572, GA MŠk, GA102/08/0593, GA ČR, 2C06019, GA MŠk

keywords: feature selection, criterion, ensemble, combining criteria

abstract (eng):

In feature selection the effect of over-fitting may lead to serious degradation of generalization ability. We introduce the concept of combining multiple feature selection criteria in feature selection methods with the aim to obtain feature subsets that generalize better. The concept is applicable with many existing feature selection methods. Here we discuss in more detail the family of sequential search methods. The concept does not specify which criteria to combine – to illustrate its feasibility we give a simple example of combining the estimated accuracy of k-nearest neighbor classifiers for various k.We perform the experiments on a number of datasets. The potential to improve is clearly seen on improved classifier performance on independent test data as well as on improved feature selection stability.

abstract (cze):

Efekt přetrénování může při výběru příznaků výrazně zhoršit generalizační schopnost. Představujeme koncept kombinování několika kritérií výběru příznaků s cílem získat příznaky které lépe generalizují. V této práci se věnujeme podrobněji implementaci ve skupině sekvenčních metod. Abychom ukázali smysl konceptu, provedli jsme vzorové experimenty za použití klasifikátorů "k-nejbližších sousedů" v roli kritérií pro různé hodnoty k. Potenciál kombinování kritérií je jasně vidět na zlepšené úspěšnosti klasifikace nezávislých dat a na zlepšené stabilitě výběru příznaků.

RIV: BD

2012-12-21 16:10