dobór pytań w metodzie zliczania odpowiedzi ( item count method )

17

Upload: fola

Post on 04-Jan-2016

45 views

Category:

Documents


0 download

DESCRIPTION

Dobór pytań w metodzie zliczania odpowiedzi ( Item Count Method ). Michał Mierzwa. Pytanie o charakterystykę niewrażliwą. Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej: Przykład: - PowerPoint PPT Presentation

TRANSCRIPT

Pytanie o charakterystykę niewrażliwą to pytanie, na którą z dużym prawdopodobieństwem respondenci udzielą odpowiedzi prawdziwej:

Przykład:› Czy urodziłaś/eś się w styczniu?› Czy umiesz pływać?

Pytanie o charakterystykę wrażliwą to pytanie, na którą respondenci mogą nie chcieć udzielić odpowiedzi lub udzieliliby odpowiedzi fałszywej.

Przykład:› Czy w Twoim zakładzie pracy

rozpowszechniane są narkotyki?› Czy kiedykolwiek wręczyłaś/eś łapówkę?

Metoda mająca na celu uzyskanie wiarygodnych wyników dotyczących kwestii wrażliwych. Polega na sformułowaniu pytań w taki sposób, aby respondenci byli skłonni udzielać prawdziwych odpowiedzi na pytania o charakterystyce wrażliwej. Po przeprowadzeniu badania ankietowego zliczane są odpowiedzi w sposób, który pozwala na wiarygodne oszacowanie odsetka występowania charakterystyki wrażliwej wśród respondentów.

Niech oznacza populację o znanej liczebności , oraz› , jeśli i-ta osoba posiada wrażliwą

charakterystykę , oraz› , jeśli i-ta osoba posiada

- dopełnienie

Problem stanowi estymacja frakcji występowania charakterystyki wrażliwej

(1,..., ,..., )U i N

1i

0i CAA

N

1

N

ii

A N

Zastosowanie Metody Zliczania Odpowiedzi wymaga stworzenia dwóch list z pytaniami, na których znajduje się G takich samych pytań niewrażliwych.

Niech:› jeśli i-ta osoba posiada niewrażliwą

charakterystykę F , oraz› jeśli i-ta osoba posiada

- dopełnienie F

1iF

0iF

CF

Pytanie G+1 na pierwszej liście uwzględnia wrażliwą charakterystykę A, niewrażliwą F oraz obydwie te charakterystyki jednocześnie

Pytanie G+1 na drugiej liście zawiera dopełnienie charakterystyki A, dopełnienie charakterystyki F oraz iloczyn dopełnień charakterystyk wrażliwej i niewrażliwej C CA F

A F

Następnie dwie niezależne próby i są losowane z populacji wykorzystując plan losowania . Respondenci z pierwszej próby proszeni są o podanie dotyczącej ich liczby zachowań

z listy pierwszej. Respondenci z drugiej próby proszeni są o podanie dotyczącej ich liczby zachowań z listy drugiej. Stąd w populacji:

1U U A F AF AFy x

1A U U Fy x

1s 2sU

sP

1,2,...,iy i N

ix

Estymator parametru ˆ ˆˆ 1A U U Fy x

Estymator frakcji charakterystyki wrażliwej

Estymator średniej liczby zachowań w pierwszej grupie respondentów

Estymator średniej liczby zachowań w drugiej grupie respondentów

Znana frakcja pytania dodatkowego G+1

ˆA

ˆUy

ˆUx

F

Na jakim poziomie należy ustalić frakcję charakterystyki F,

Jak w przybliżeniu powinna kształtować się frakcja odpowiedzi poszczególnych pytań z zestawu G,

Ile powinna wynosić liczba pytań G - tak, aby błąd średniokwadratowy estymatora był jak najmniejszy.

Symulacje badawcze przeprowadzone zostały metodą Monte Carlo o liczbie iteracji 10 000 w programie R. Liczebność respondentów grupy 1. i 2. założona została na poziomie 50. Obliczenia wykonano dla frakcji 0.1, 0.2, 0,3 … 0.9.

frakcja 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9

0,1 0,108 0,120 0,128 0,134 0,134 0,132 0,128 0,121 0,107

0,2 0,120 0,130 0,139 0,140 0,145 0,142 0,140 0,131 0,120

0,3 0,128 0,139 0,147 0,150 0,150 0,151 0,147 0,138 0,129

0,4 0,132 0,142 0,150 0,155 0,156 0,155 0,149 0,142 0,132

0,5 0,133 0,142 0,150 0,157 0,157 0,155 0,151 0,146 0,135

0,6 0,134 0,143 0,151 0,154 0,154 0,154 0,150 0,141 0,133

0,7 0,127 0,137 0,146 0,149 0,150 0,150 0,145 0,140 0,128

0,8 0,119 0,131 0,138 0,143 0,145 0,143 0,138 0,130 0,120

0,9 0,107 0,118 0,130 0,132 0,133 0,134 0,126 0,122 0,106

ˆ( )ARMSE

ˆ( )ARMSE

liczba pytań G 1 2 3 4 5 6 0,10431 0,13247 0,15421 0,17366 0,18973 0,20409przyrost bezwzględny RMSE 0,02816 0,02175 0,01945 0,01608 0,01436

ˆ( )ARMSE

ˆ( )ARMSE

liczba pytań G 1 2 3 4 5 6 0,12672 0,16228 0,18768 0,21439 0,23594 0,25810przyrost bezwzględny RMSE 0,03553 0,02539 0,02671 0,02155 0,02215

ˆ( )ARMSE

0,2F 0,1A

0,5F 0,1A

Frakcja pytań dodatkowych =0,2

Frakcja pytań dodatkowych =0,5

Dla grupy 1 i 2› Czy dojeżdżasz na uczelnię środkami komunikacji miejskiej?› Czy obchodzisz urodziny w czwartym kwartale?

Tylko dla grupy 1› Czy korzystałeś/aś ze świadczeń socjalnych na uczelni (np. stypendium

socjalne) lub ostatnia cyfra twojego numeru albumu jest równa lub większa od 2 lub jedno i drugie?

Tylko dla grupy 2› Czy nigdy nie korzystałeś/aś ze świadczeń socjalnych na uczelni (np.

stypendium socjalne) lub ostatnia cyfra twojego numeru albumu jest mniejsza lub równa 1 lub jedno i drugie?

Frakcja pytania F (o numer albumu) jest znana i wynosi 0,205.

Cassel C.M., Särndal C.E., Wretman J.H., Foundations of Inference in Survey Sampling, John Wiley & Sons, New York-London-Sydney-Toronto, 1977.

Chaudhuri A., Christofides T. C., Item Count Technique in estimating the proportion of people with a sensitive feature, Journal of Statistical Planning and Inference, 137, pp. 2007.

Fox J. P., Randomize Item Theory Response Models, Journal of Educational and Behavioral Statistics, Vol. 30, No. 2, pp., 2005.

Kuk A. Y. C., Asking Sensitive Questions Indirectly, Biometrika, Vol. 77, No. 2 Jun., 1990. Pal S., Estimating The Proportion Of People Bearing Sensitive Issue With an Option To

Item Count Lists And Randomized Response, Statistics In Transitions- new series, Vol. 8, No. 2, pp., 2007.

R Development Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org, 2012.

Rouse B. A., Kozel N. J., Louise G. Richards, Self Report Methods of Estimating Drug Use: Meeting Current Challenges to Validity, NIDA Research Monograph 57, 1985.

Tsuchiya T., Domain Estimators for the Item Count Technique, Survey Methodology, Vol. 31, no. 1, pp., 2005.

Wywiał J. Elementy metody reprezentacyjnej z wykorzystaniem statystycznego pakietu SPSS. Akademia Ekonomiczna w Katowicach, Katowice 1999.