Institute of Information Theory and Automation

You are here

Bibliography

Conference Paper (international conference)

Problem of Missing Data in Census - Who Are the Non-Response Respondents?

Hora Jan

: Statistics - Investment in the future 2, p. 1-15

: Statistics - Investment in the future 2, (Praha, CZ, 14.09.2009-15.09.2009)

: CEZ:AV0Z10750506

: GA102/07/1594, GA ČR, 1M0572, GA MŠk, 2C06019, GA MŠk

: Census information, Statistical model, Missing data, Non-response substitution

: http://library.utia.cas.cz/separaty/2009/RO/hora-problem of missing data in census who are the non response respondents.pdf

(eng): The confidentiality of census data is known to be rather restrictive for economic and social research. To improve the availability of census information we have proposed recently a new method of interactive presentation of census results by means of statistical models. The method is based on estimation of the joint probability distribution of data records in the form of a distribution mixture. The estimated mixture model can be used as a knowledge base of a probabilistic expert system and in this way we can derive the statistical information from the distribution mixture without any further access to the original database. The statistical model does not contain the original data and therefore the final interactive software product can be made freely available via internet without any confidentiality concerns.

(cze): Interaktivní reprodukce výsledků sčítání lidu pomocí statistického modelu nabízí v této souvislosti alternativní publikační možnost s dokonale zabezpečenou ochranou anonymity dat. Základem metody je odhad statistického modelu původní databáze ve tvaru diskrétní součinové směsi, která je následně použita jako báze znalostí pravděpodobnostního expertního systému. Interaktivní statistický model umožňuje odvozování libovolně podmíněných tabulek resp. histogramů s uživatelským komfortem, který je srovnatelný nebo lepší než v případě souboru mikrodat. Odhadnutá distribuční směs neobsahuje původní data, takže výsledný interaktivní softwarový produkt může být zpřístupněn všem uživatelům bez jakéhokoli omezení.

: IN

2019-01-07 08:39