Conference Paper (international conference)
serial: Proceedings of the International Conference on Statistics - Investment in the Future, p. 1-7 , Eds: Krovák J.
action: Statistics - Investment in the Future, (Prague, CZ, 06.09.2004-07.09.2004)
research: CEZ:AV0Z1075907
project(s): FP6-507752, Commission EU, GA402/02/1271, GA ČR
keywords: statistical databases, information analysis, statistical models
abstract (eng):
We describe a new method of information oriented data analysis (data mining) based on a quick evaluation of a virtual list of several hundreds of thousands of sub-populations. The sub-populations can be ordered according to different criteria like conditional probability of a value, conditional entropy of a variable or mutual informativity of a pair of variables. In this way we can identify causal relations between values and variables in a qualitatively new way.
abstract (cze):
V práci je popsána kvalitativně nová možnost informační analýzy statistických databází (datamining) s využitím statistického modelu. Metoda je založena na rychlém vyhodnocení virtuálního seznamu několika set tisíc subpopulací a jejich uspořádání z hlediska zvoleného kriteria, jako je např. podmíněná pravděpodobnost nějaké vlastnosti, podmíněná entropie nebo Shannonovská informace dvojice proměnných. Uvedeným způsobem lze identifikovat např. kauzální vztahy nominálních proměnných
Cosati: 05A, 05W, 05R
RIV: AO