arhiv druŽboslovnih podatkov in sekundarna analiza podatkov

Post on 09-Jan-2016

60 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

ARHIV DRUŽBOSLOVNIH PODATKOV in SEKUNDARNA ANALIZA PODATKOV. Irena Vipavc Brvar ADP, Univerza v Ljubljani, oktober 2013. Vsebina predavanja. Vsebina. Splošno o arhivu in mikro podatkih Sekundarna analiza Metapodaki Dostop do metapodatkov in podatkov preko ADP - PowerPoint PPT Presentation

TRANSCRIPT

ARHIV DRUŽBOSLOVNIH PODATKOVin

SEKUNDARNA ANALIZA PODATKOV

Irena Vipavc Brvar ADP, Univerza v Ljubljani, oktober

2013

• Splošno o arhivu in mikro podatkih• Sekundarna analiza• Metapodaki• Dostop do metapodatkov in podatkov preko ADP• Analiza podatkov v Nesstarju• Mednarodne podatkovne baze

Vsebina V

seb

ina p

red

avan

ja

AD

PArhiv družboslovnih podatkov

• je osrednji slovenski družboslovni arhiv podatkov,

• pokriva vsa pomembnejša družboslovna področja,

Naloge:

• shranjuje podatke iz preteklih raziskav za ponovno uporabo (zagotavlja, da so podatki ohranjeni pred tehnološko zastarelostjo in fizičnim uničenjem),

• preveri, potrdi in pripravi podatke in pripadajočo dokumentacijo raziskave,

• uporabnikom omogoča enostaven dostop do podatkov v številnih formatih in

• nudi storitve s področja metodologije in statističnih obdelav.

Splo

šno o

arh

ivu

Kaj so podatki? O

pod

atkih

”podatki” - računalniško berljive podatkovne datoteke

.. prepisi intervjujev, avdio in video zapisi

Mikro podatki O

pod

atkih

Mikro podatki O

podatkih

Mikro podatki O

podatkih

Sekundarna analiza S

eku

nd

arn

a a

naliza

Shematski prikaz paradigne sekundarne analize (Toš, 1988)

Razloge za uporabo sekundarne analize lahko razdelimo v tri skupine (Hayman v Štebe, 1999):

• Konceptualno-vsebinski razlogi (primerjava med različnimi časovnimi obdobji; že testirani vprašalniki; različni nameni uporabe)

• Metodološki razlogi (kombinacija več virov podatkov; slabost – nepoznavanje podrobnosti zbranih podatkov- kakovost)

• Ekonomski razlogi (prihranek denarja in časa)

Seku

ndarn

a a

nliza

Sekundarna analiza

Sekundarna analiza S

eku

ndarn

a a

naliza

Uporabimo že zbrane podatke za testiranje hipotez in jih ne zbiramo sami.

Se nanaša na raziskovalno prakso, ki vključuje izkoriščanje podatkov, ki jih je zbral nekdo drugi ali podatkov, ki so bili primarno zbrani za nek drug namen (npr. administrativni zapisi).

Ključni elementi s katerimi se srečujemo so:• dostop do podatkov in njihova uporabnost• ohranjevanje zaupnosti in zasebnosti, ki jih

je respondentom jamčil primarni raziskovalec• lastninske pravice in lastništvo nad podatki

Metapodatke lahko definiramo kot “vse informacije potrebne za obveščanje in procesiranje statističnih struktur”. (Grossmann v Vipavc in Klep, 2003).

Pri kakovostnem oblikovanju metapodatkovnih standardov imajo velik pomen uporabniki informacij.

razvoj standardov (DDI) Mednarodna izmenjava opisov raziskav (zapis v XML) Možnost analize podatkov

Metapodatki M

eta

podatki

• podatke,• spremljajočo dokumentacijo, • informacije o vzorčenju,... podatke, ki se lahko

zgubijo.

Spremljajoča dokumentacija naj vsebuje informacije kot izvor podatkov; kaj je bil osnovni namen zbiranja; kdo so bili avtorji in naročniki oz. sponzorji; kako so bili podatki zbrani; kakšni so pravni pogoji uporabe podatkov; opis spremenljivk; kako so bili podatki združeni – kodirna shema; v kakšnem formatu je hranjena računalniško berljiva podatkovna datoteka; na katerem mediju je hranjena.......

Kaj hraniti K

aj h

ranim

o

Standard na katerem temelji priprava vsebin za ADP je XML DDI (The Data Documentation Initiative).

Po tem standardu je kodirna knjiga sestavljena iz:

• Opis dokumenta (Document Description)• Opis raziskave (Study Description)

• Naslov, avtor, izdelava in distribucija• Vsebina raziskave• Metodologija• Dostop do podatkov

• Opis podatkov (Data Files Description)• Opis spremenljivk (Variable Description)• Ostali dokumenti (Other Documentation)

Standard DDI 2.0 D

DI 2

.0

_

Pregled raziskav po seznamih

Opis spremenljivkOpis raziskave Opis podatkov Ostali dokumenti

Iska

nj

e

po

da

tkov

o

pis razisk

av

e

Ne pozabimo CITIRATI gradiva, ki smo ga uporabili. Citiramo tako vprašalnike, kodirne knjige, kot tudi podatkovne datoteke.Primeri citiranja so na razpolago v opisih raziskav. Seveda ga prilagodimo pravilom objave svojih gradiv.

Viri se navajajo tako na koncu kot pod samo tabelo ali grafom!

Citiranje C

itiranje

NESSTAR jevirtualna podatkovna knjižnica, ki omogoča iskanje, lociranje, pregledovanje in snemanje mnogo raznovrstnih statističnih in drugih podatkov in metapodatkov.

Nessta

rNesstar

Nessta

r

Nessta

r

Opi

s

razi

sk

av

e

Nessta

rPreprosta analiza podatkov z Nesstarjem – primer SJM

Nessta

r

Nessta

r

Nessta

rZa analizo podatkov potrebujemo uporabniško ime in geslo za NESSTAR.

IZPOLNIM NAROČILO

registracija R

egistra

cija za

dosto

p d

o g

radiv

a

_

1

2

3

registracija R

egistra

cija za

dosto

p d

o g

radiv

a

_

!

Geslo je veljavno do konca tekočega

študijskega leta

Pri uporabniškem imenu namesto "@"

vpišete "AT“

Nessta

r

Nessta

r

Nessta

rRezultate dvo-dimenzionalnih tabel (predvsem, kadar se število enot med skupinami razlikuje) prikazujemo v odstotkih po neodvisni spremenljivki. Običaj je, da se neodvisna spremenljivka (npr. spol) prikazuje v stolpcu, odvisna pa v vrstici.

Nessta

r

Nessta

r

Nessta

rIskanje spremenljivke

Nessta

rOkna za napredno iskanje

Nessta

rSJM032

Nessta

r

Nesssta

r

Nessta

r

Nessta

r

Nessta

r stolp

ični g

rafiko

n

Nessta

r izvoz v

Exce

l

SJM032 - SJM932

Kaj naj stori ženska, ko ima majhnega otroka, ki še ne hodi v šolo

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

moški ženski moški ženski

SJM032 SJM932

ostane naj doma

zaposli s skrajšanimdelovnim časomzaposli s polnimdelovnim časom

Primerjava SJM032 in SJM932 po spolu N

essta

r

V nalogo dodamo še podatke iz mednarodne datoteke.

Ne pozabimo na ugodnosti, ki izhajajo iz mednarodnega sodelovanja arhivov!!

Mednarodne M

ednaro

dne p

od

atko

vne b

aze

ISSP 2002 M

ednaro

dne p

od

atko

vne b

aze

ISSP 2002 M

ednaro

dne p

od

atko

vne b

aze

ISSP 1994 M

ednaro

dne p

od

atko

vne b

aze

MED

NARO

DN

I PODATKI

CESSDA M

ednaro

dne p

od

atko

vne b

aze

MED

NARO

DN

I PODATKI

CESSDA ARCHIVES - EUROPE M

ednaro

dne p

od

atko

vne b

aze

MED

NARO

DN

I PODATKI

CESSDA M

ednaro

dne p

od

atko

vne b

aze

Mednaro

dne p

od

atko

vne b

aze

GESIS – Leibniz Institute for the Social Sciences

•Mednarodna splošna družboslovna anketa (ISSP)

•Evrobarometer

•Evrobarometer držav kandidatk

•Evrobarometer srednje in vzhodne Evrope

•Evropska raziskava vrednot (EVS)

Mednaro

dne p

od

atko

vne b

aze

Mednaro

dne p

od

atko

vne b

aze

Motivacijski seminar, april 2009

Možnost kompleksnih analiz:• domačih in tujih kontinuiranih raziskav• vključevanje časovne komponente• študij specializiranih populacij

primerjalnih mednarodnih datotek• večnivojska analiza• upoštevanje merske kvalitete spremenljivk

Prednosti uporabe gradiv podatkovnih arhivov S

eku

ndarn

a a

naliza

Princip ekvivalence – Jowel: How comparable is comparative research?Heterogenost populacije že na nacionalnem nivoju (jezik, običaji izražanja, izobrazba) – mednarodne razlike v sistemih razmišljanja, institucionalnih okvirih in vrednotahMetodološki enotni standardi, prevajanje vprašalnikov

Problemi mednarodnih anket S

eku

ndarn

a a

naliza

Prosto dostopne za raziskovalne namene

ISSP – International Social Survey ProgrammeMednarodna splošna družboslovna anketa [1985 – 2004)• Vloga države; razumevanje vloge državljana• Družbeni stiki• Neenakost• Družina• Stališča o delu; odnos do dela• Raziskava o vernosti in cerkvi• Ekologija• Narodna identiteta

POMEMBNEJŠE MEDNARODNE RAZISKAVE S

eku

ndarn

a a

naliza

EB – Eurobarometer [1975 – 2002) CEEB – Central and Eastern EB [1990 – 1997]Evrobarometer srednje in vzhodne EvropeCCEB – Candidate Countries EB [2001 – 2004]Evrobarometer držav kandidatk

Politične in ekonomske spremembe; Evropska unija; mediji; družbene razmere v državah kandidatkah; mladina v novi Evropi; kultura; identiteta in vrednote; Euro, širitev EU in finančne storitve; pokojninski sistem; zdravje; itd..

Seku

ndarn

a a

naliza

EVS – European Values Study [1981, 1990, 1999)

http://zacat.gesis.org/webview/index.jsp

EES – European Election Study [2004]CSES – Comparative Study of Electoral Systems [1996 – 2001, 2001 – 2005)ESS – European Social Survey [2002, 2004)ICVS – International Crime Victimisation Survey [1998 – 2000)

Seku

ndarn

a a

naliza

Poglavitni cilj Evropske družboslovne raziskave (ESS) je pospeševanje razvoja evropskih primerjalnih družboslovnih znanosti. Njen namen je sistematična raziskava stališč, značilnosti in navad evropskih državljanov, v povezavi z vrsto pomembnih gospodarskih, družbenih in političnih področij. Raziskava poteka v več kot 20 evropskih državah. Vsebinsko je raziskava razdeljena na več sklopov. Jedro sestavljajo vprašanja za opazovanje dinamike stališč. Gre za ponavljanje skupine vprašanj, ki se od meritve do meritve ne spreminja, saj je poudarek na opazovanju srednjeročnih in dolgoročnih sprememb. Jedro vprašalnika ESS vsakokrat vključuje kazalce delovanja ključnih družbenih sistemov (gospodarstvo, sociala, izobraževanje, zdravstvo idr.), politične participacije, vrednot, kakovosti življenja ipd.

Evropska družboslovna raziskava E

SS

Posamezniki starejši od 15 let, živeči v zasebnih gospodinjstvih, ne glede na njihovo narodnost, državljanstvo, jezik ali pravni status v sodelujočih državah.

Populacija Po

pu

lacija

Pri analizi vzorčenih podatkov je zelo pomembno uteževanje. Omogoča, da damo različne uteži različnim enotam v zgodbi analize. Običajno se uporablja za popravek odklona od vzorca, ki naj bi predstavljal določeno populacijo.

Če ste, na primer, zmerili višino 50 moških in 10 žensk v določeni državi z enako spolno porazdelitvijo bo povprečna višina tega vzorca odstopala od povprečne višine v celotni populaciji, saj so moški običajno višji od žensk. Vzorec je zato potrebno utežiti in tako “približati” dejanski populaciji. Potrebno je torej zmanjšati vpliv moške večine v vzorcu. Višine moških množimo z 0,2, višine žensk pa z 1 (moški: 50*0.2=10, ženske: 10*1=10).

Uteževanje U

teže

vanje

• vzorčna utež (design weight - dweight). Kar nekaj držav vključenih v raziskavo ni moglo zagotoviti enake verjetnosti za vključitev posameznikov starejših od 15 let. Tako so v določenih državah bolj zastopani posamezniki iz določenih skupin (npr. posamezniki iz večjih družin) in drugi manj. Te "napake" odpravimo z vzorčno utežjo.

• populacijska utež (the Population Size weight - pweight). To utež uporabljamo pri primerjavi dveh ali več držav. Utež upošteva, da je večina držav vključenih v raziskavo imela enako velikost vzorca ne glede na velikost njihove dejanske populacije. Verjetnostna teorija namreč dokazuje, da je vzorec 1000 respondentov enako uporaben za državo z 10 milijoni prebivalci kot za države s samo 1 milijonom. Brez uteževanja bi združeni podatki nad-reprezentirali manjše države. Populacijska utež torej uvaja takšno prilagoditev, da je država predstavljena proporcionalno glede na svojo velikost.

V ESS sta ponujeni dve uteži,ki jih lahko uporabimo (velikokrat moramo):

Ute

ževanje

Pri prikazovanju tabel v odstotkih morate vedno uporabiti utežene podatke.

Osnovni pravili:-vedno uporabimo vzorčno utež in-kadar primerjamo podatke dveh ali več držav in kadar jih združujemo v skupine (npr. države članice EU) moramo uporabiti tako vzorčno kot populacijsko utež.

Ute

ževanje

“How interested in politics":

Weighted and unweighted valid

frequencies.

Uteževanje

Uteževanje U

teže

vanje

Nessta

r

Konec

Za dodatna pojasnila smo dostopni na: arhiv.podatkov@fdv.uni-lj.si

top related