의미분석망 분석 통계청 논문

14
통계연구(2012), 제17권 제2호, 53-66 언어네트워크분석을 이용한 통계법 내용분석 장정우 1) ∙ 최경호 2) 요약 언어네트워크분석은 최근 국내 언론매체 연구를 중심으로 소수연구들에서 실시되고 있는 연구방 법론으로, 재난안전관리기본법을 대상으로 한 류상일 등(2011)과 대통령의 연설문을 대상으로 한 이창길(2010)의 연구 등이 언어네트워크분석을 사용한 연구에 해당된다. 그러나 아직까지 통계법 에 대하여 계량적인 접근을 시도한 연구는 드물다. 이에 본 연구에서는 언어네트워크분석을 이 용하여 통계법에 대한 내용분석을 수행해 보았다. 현재 통계법은 법률 제10196호로 2010년 3월 31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성되어 있다. 그 결과 분석대상으로 삼은 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치 에 있음을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 국가에 있어 서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체제 구축이 되어 야 효율적인 국가통계운용이 된다고 할 수 있겠다. 텍스트로 구성된 자료를 계량적으로 분석하 여 시각적으로 확인해 보았다는 점에서 본 연구는 차별화 되었다고 할 수 있으며, 통계법을 법리 적인 측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법 등과의 비교연구 시 기초자료로 활용될 수 있을 것이다. 주요용어 : 계량적 접근, 내용분석, 언어네트워크분석, 통계법 1. 서론 통계제도는 한 나라에서 필요로 하는 통계정보를 어떤 체계로 생산하느냐에 따라 집중형 통계제도와 분산형 통계제도로 대별할 수 있다. 집중형 통계제도는 모든 통계 활동이 하나의 전문화된 통계작성기관에 집중되어 각 기관에서 필요로 하는 통계를 모두 작성․공급토록 되어 있는 통계제도이며, 분산형 통계제도는 통계활동이 각 기 관에 분산되어 각 기관의 고유 업무수행에 필요한 통계를 자체적으로 작성․이용하는 통계제도로서 우리나라 통계제도는 기본적으로 분산형 통계제도에 가깝다고 할 수 있 다(김재신, 1996). 그런데 분산형 통계제도 하에서는 통계중복 생산으로 인한 자원의 낭비, 응답자의 응답부담 가중, 질 낮은 통계의 생산 등 적지 않은 문제가 발생될 소 지가 있다. 이에 분산형 통계제도를 채택하는 국가에서는 발생할 수 있는 문제점을 종합조정하고 통계작성 체계를 정비함으로써 통계의 신뢰성과 통계제도 운용의 효율 1) 서울대학교 대학원 법학과, 석사과정. E-mail: [email protected] 2) 교신저자. 전주대학교 기초의과학과(통계학), 교수. E-mail: [email protected]

Upload: yubyeol-kim

Post on 14-Jul-2015

149 views

Category:

Marketing


4 download

TRANSCRIPT

통계연구(2012), 제17권 제2호, 53-66

언어네트워크분석을 이용한 통계법 내용분석

장정우1) ∙ 최경호2)

요약

언어네트워크분석은 최근 국내 언론매체 연구를 중심으로 소수연구들에서 실시되고 있는 연구방

법론으로, 재난안전관리기본법을 대상으로 한 류상일 등(2011)과 대통령의 연설문을 대상으로 한

이창길(2010)의 연구 등이 언어네트워크분석을 사용한 연구에 해당된다. 그러나 아직까지 통계법

에 대하여 계량적인 접근을 시도한 연구는 드물다. 이에 본 연구에서는 언어네트워크분석을 이

용하여 통계법에 대한 내용분석을 수행해 보았다. 현재 통계법은 법률 제10196호로 2010년 3월

31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성되어 있다.

그 결과 분석대상으로 삼은 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 중요한 위치

에 있음을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 국가에 있어

서는 통계청장의 역할이 무엇보다도 중요하며, 결국 통계청장을 중심으로 협력체제 구축이 되어

야 효율적인 국가통계운용이 된다고 할 수 있겠다. 텍스트로 구성된 자료를 계량적으로 분석하

여 시각적으로 확인해 보았다는 점에서 본 연구는 차별화 되었다고 할 수 있으며, 통계법을 법리

적인 측면에서가 아닌 기술통계적인 측면에서 분석해 봄으로써 향후 다른 국가의 통계법 등과의

비교연구 시 기초자료로 활용될 수 있을 것이다.

주요용어 : 계량적 접근, 내용분석, 언어네트워크분석, 통계법

1. 서론

통계제도는 한 나라에서 필요로 하는 통계정보를 어떤 체계로 생산하느냐에 따라

집 형 통계제도와 분산형 통계제도로 별할 수 있다. 집 형 통계제도는 모든 통계

활동이 하나의 문화된 통계작성기 에 집 되어 각 기 에서 필요로 하는 통계를

모두 작성․공 토록 되어 있는 통계제도이며, 분산형 통계제도는 통계활동이 각 기

에 분산되어 각 기 의 고유 업무수행에 필요한 통계를 자체 으로 작성․이용하는

통계제도로서 우리나라 통계제도는 기본 으로 분산형 통계제도에 가깝다고 할 수 있

다(김재신, 1996). 그런데 분산형 통계제도 하에서는 통계 복 생산으로 인한 자원의

낭비, 응답자의 응답부담 가 , 질 낮은 통계의 생산 등 지 않은 문제가 발생될 소

지가 있다. 이에 분산형 통계제도를 채택하는 국가에서는 발생할 수 있는 문제 을

종합조정하고 통계작성 체계를 정비함으로써 통계의 신뢰성과 통계제도 운용의 효율

1) 서울 학교 학원 법학과, 석사과정. E-mail: [email protected]

2) 교신 자. 주 학교 기 의과학과(통계학), 교수. E-mail: [email protected]

54 장정우 ․ 최경호

성 확보를 하여 통계법을 두고 있다. 우리나라도 외는 아니어서, 법률 제10196호

로 2010년 3월 31일 일부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부

칙으로 구성된 통계법이 있다.

통계에 한 사항을 종합 으로 조정하고 체계를 정비함으로써 통계의 진실성과

통계제도의 효율성 확립을 도모하기 한 통계법이 제정․운용되고 있음에도 불구하

고, 아직까지 통계법 자체에 한 연구는 드문 실정이다. 특히 통계법이 효율 으로

운용되기 해서는 가( 는 무엇이) 심이 되어야 하며, 어떤 기 ( 는 조직)들이

유기 인 조체제를 구축해야 하는지 등에 한 객 이고 계량 인 분석이 필요하

다. 이를 한 연구방법으로 최근에 각 을 받고 있는 연구방법으로 언어네트워크분

석(semantic network analysis)이 있다. 언어네트워크분석은 사회네트워크분석(social

network analysis)을 응용한 내용분석의 한 방법으로, 단어가 특정형태로 다른 언어들

과 조합되어 특별한 의미체계를 만드는 경향이 있기 때문에, 단어들 사이의 의미 네

트워크 행렬(semantic network matrix)을 만들어서 사회네트워크분석의 에서 시

각화한 분석방법이다.

본 연구에서는 언어네트워크분석을 통하여 통계법을 내용분석함으로서 특징과 그

구조 모습에 해 계량 측면에서 살펴보고자 한다. 본 연구는 통계법을 법리 인

측면에서가 아닌 기술통계 인 측면에서 분석해 으로써 향후 다른 국가의 통계법

등과의 비교연구 시 기 자료로 활용될 수 있을 것으로 사료된다.

2. 통계법 개정현황

행 통계법(시행 2010.7.1, 법률 제10196호, 2010.3.31, 일부개정)은 7개의 장과 41

개의 조문, 그리고 부칙으로 구성되어 있다. 이 법의 근간이 되는 2005년도 통계법 개

정작업 황(국가통계인 라 강화 추진단, 2005)을 심으로, 개정의 필요성, 주요 검

토사항 등에 하여 살펴보면 다음과 같다. 변하는 통계환경 변화에 능동 으로

처하고 다양한 통계수요에 히 부응하며, 국내 통계의 종합 조정강화 통계

원회 등 기구․제도 개선을 통한 통계의 품질개선과 업무의 효율성을 증 시킬 필요

가 발생되었다. 이에 ‘국가통계인 라 강화방안’을 근거로 통계법 개정(안)이 작성되었

는데, 주요 검토사항으로는 국가통계 원회신설(개편), 통계품질 리강화, 행정자료 통

계목 활용화, 통계연구기 등 통계기반 강화 내용 등이 선정되었다. 이에 더하여

세부 작업 과정에는, 법 개정 련 규정검토, 주요 개정사항의 주제별 정리, 국내

외국의 통계법 제도 검토, 통계작성기 (정부, 민간 등)회의, 개정 통계법(안) 작성

등이 포함되었다.

2005년도 통계법 개정작업의 주요내용을 정리해 보면 다음과 같다.

첫째, 통계발 계획 수립. 새로운 통계수요를 반 한 통계발 방향을 제시할 필요

에 따라, ‘통계청장은 통계의 발 을 하여 통계발 계획을 3~5년 단 로 수립․시행

언어네트워크분석을 이용한 통계법 내용분석 55

할 수 있다’는 조항을 신설하 다.

둘째, 국가통계 원회 설립. 자문 원회 성격의 심의․의결 기능을 담당하는 조직

의 필요성에 따라, ‘정부는 통계정책 통계작성․보 에 한 주요사항을 심의․의

결하기 하여 국가통계 원회를 둔다’는 조항을 신설하 다.

셋째, 통계품질진단. 통계품질 진단을 한 명문규정을 신설하고자, ‘국가통계 원

회 원장은 통계작성 제반 과정을 진단할 수 있다’는 조항을 신설하 다.

넷째, 행정자료의 제공. 부처간 행정자료 공유를 한 명문규정 신설의 필요에 따

라, ‘통계작성기 의 장이 통계작성을 하여 행정자료를 청구한때는 행정기 공

공기 등은 특별한 사유가 없는 한 응하여야 한다’는 조항을 신설하 다.

다섯째, 공표 의 사 신고제 폐지, 공표 지 명령제 도입. 통계작성기 책임 공

표 자율성 보장을 하여, ‘공표 의 의무 폐지 공표 지 명령제 도입’에 한

조항을 부분 개정하 다.

3. 연구방법

3.1 언어 연결망 분석

언어네트워크 혹은 언어 연결망 분석은 구성요소들 간의 계를 찾아내 시스템의

구조를 악하는 사회네트워크분석을 의사소통메시지에 용한 방법론으로, 공유된

의미를 통해 의사소통 구조를 악하는데 유용한 방법이다. 언어네트워크분석에서 도

출된 네트워크 구조 간의 차이를 비교함에 있어 활용되는 지표에는 개별 노드

(node)의 국소 (local) 특성을 나타내는 연결선 수(degree), 네트워크의 역

(global) 특성을 나타내는 도(density) 그리고 심성(centrality) 등이 있다. 연결선

수와 련하여, 연결정도는 한 노드가 맺고 있는 결 의 숫자로서 정의된다. 사람 간

의 네트워크에서 친구가 많은 사람이나 혹은 마당발이라고 불리는 사람은 연결정도가

많은 사람이다. 이러한 사람들은 동원할 수 있는 자원이 많고, 정보의 흐름에서도 핵

심 인 역할을 한다. 만일 이런 사람을 연결망에서 제거한다면 연결망은 와해되다시

피 할 정도로 연결망 결속에 요한 역할을 담당한다. 을 노드의 수라 할 때, 도

란 가능한 총 계 수 에서 실제로 맺어진 계 수의 비율로

로 정의된

다(김용학, 2003). 심성은 각 노드가 심에 근 한 정도를 평가하는 지표로 집 도

(centralization)와는 다른 개념이다. 집 도는 네트워크 체가 한가지의 심으로 집

된 정도를 의미한다. 이에 반하여 심성은 각각의 노드가 네트워크 구조 내에서

얼마나 심에 치하고 있는가를 나타내는 지표이다(손동원, 2010). 심성에는 근

심성(closeness)과 개 심성(betweenness) 등이 있는데 각각 다음과 같다(허명회,

2010).

56 장정우 ․ 최경호

근 심성 : ≠

단, 는 노드 에서 에 이르는 ‘거리’ 즉 비근 도이므로 는 노드

에서 에 이르는 근 도의 개념이다.

개 심성 : ≠

≠ ≠

단, 는 노드 에서 ≠ 로 가는 최단경로의 수이고, 는 노드 에서

≠ ≠ 로 가는 최단경로 가운데 노드 ≠ 를 거치는 경로의 수이다.

3.2 분석자료

본 연구에서 분석 상으로 활용한 통계법은 법률 제10196호로 2010년 3월 31일 일

부 개정되고 2010년 7월 1일부터 시행되고 있는 7장 41조와 부칙으로 구성된 법률이

다. 체 7장 에서 내용분석으로 의미가 있다고 단된 네 개의 장을 선택하 다.

내용어 뿐만 아니라 기능어를 포함한 단어를 분석단 로 하 는데, 이 과정에서 “제1

조(목 )” 등과 같이 조문의 의미를 나타내는 용어는 분석 상에서 제외하 다. 단어

를 코딩하는 과정에서 조사(~는, ~은, ~이, ~가 등)와 기능어(~되어야 한다, ~말한다

등)는 가 생략하 다. 한 ‘통계의 작성․보 ’과 같은 표 은 ‘통계작성’과 ‘통계

보 ’으로 분리하여 그 뜻이 정확하게 되도록 분류 입력하 다. 다만 복성을 방

지하고 연결망의 단순화를 하여 ‘용어정의’나 ‘호’는 제외하 다. 이 과정에서 주 성

의 개입을 최소화하기 하여 윤수재 등(2011)에서와 같이 기 표를 작성하고 각자

코딩하여 차이가 있는 경우 논의를 통해 이를 통일하는 방식으로 더 이상 차이가 생

기지 않을 때까지 계속 반복하 다.

<표 3.1> 분석 상 법조문

장 제목 구성

1장 총칙 5개 조항

2장 통계의 작성․보 이용 기반 구축 10개 조항

4장 통계의 작성․보 이용 14개 조항

5장 통계응답자의 의무 보호 등 3개 조항

언어네트워크분석을 이용한 통계법 내용분석 57

3.3 분석도구

통계법에 한 언어네트워크분석을 해서는 먼 행렬을 만들어야 한다. 이를

해서 박한우 등(2004)이 만들고 공개한 KwKic을 활용하 다. KwKic 로그램은 KrKwic,

KrTitle, KrText 등 3개의 하 로그램으로 구성되어 있는데, 먼 KrKwic을 이용하여

핵심어를 악한다. 핵심어는 선택된 메시지에서 자주 출 하는 단어로 조작 정의된

다. 다음 KrTitle을 이용하여 공출 빈도(co-occurrence) 칭행렬을 도출한다. 공출

빈도 행렬이 만들어지면 R의 sna 패키지 내의 다양한 함수를 이용하여 도, 연결선

의 수, 앙성 지표 등을 구하고, 나아가 연결망 그래 등을 그리게 된다. 한편 지표

의 표 에 있어 연결선의 수는 김지수(2011)에서와 같이 상 크기로 환산하여 비

교하 다.

KwKic 로그램은 http://www.hanpark.net/에 공개된 소 트웨어로 내려 받아 설

치하면 된다. 도스버 이라 처음 사용하는데 야간 어려움이 있으나, 텍스트자료에

한 네트워크분석을 한 단계처리로는 매우 유용한 소 트웨어이다. 하 3개의

로그램 단어빈도분석이 주목 인 KwKic의 경우 입력 일은 ASCII 인코딩의 텍

스트 일형태로, 각 은 1,000개의 문자를 과하면 안 된다. 디폴트는 text.txt이다.

로그램을 실행하면, 텍스트 일형태의 wrdfrq.txt 일이 결과로서 생성된다. 다음

으로 하 로그램 KrTitle은 논문, 웹페이지, 기사, 특허, 법조문 등의 제목

요약문과 같이 비교 짧은 메시지를 분석하기 한 것이다. 이를 이용한 분석도

ASCII 인코딩의 텍스트 일형태여야 하며, 문자수가 공백을 포함하여 999개를 과

하면 안 된다. 분석결과 도출되는 coocc.dbf 일은 단어(words)x단어(words)의 1모드

공출 빈도 칭형 행렬인데, 이는 SPSS나 Excel 등에서 이용가능하다(박한우 등,

2004).

4. 언어네트워크분석

KwKic 로그램과 R의 sna 패키지 내의 다양한 함수를 이용하여 수행한 언어네

트워크분석 결과를 살펴보자. 먼 역 특성을 나타내는 도와 빈도수가 2이상인

단어의 목록은 <표 4.1>과 같다. 네트워크 내의 노드가 서로 얼마나 많은 계를 맺

고 있는지를 표 하기 한 지표인 도에 해서는 제1장 총칙이 가장 크게 나타났

다. 각 장의 크기가 크게 달라 큰 의미를 부여하기는 어렵지만 제4장의 경우 빈도수

가 2이상인 단어가 다른 장에 비하여 많게 나타났다. 각 장마다 그 장에서 추구하고

자 하는 목 을 나타내는 단어들이 심이 된 가운데, 제1장의 경우 통계보 , 통계이

용, 통계작성 등이 빈도수가 높은 것으로 나타났다. 이는 제1장이 통계법의 목 과 기

본이념 그리고 국가의 책무 등을 정하고 있는 부분인 바, 통계의 보 과 이용 작

성에 한 필요사항이 많이 언 된 때문인 것으로 사료된다.

58 장정우 ․ 최경호

<표 4.1> 도와 빈도수가 2이상인 단어

장 도 빈도수가 2이상인 단어

1장 1.156통계보 , 통계이용, 통계작성, 통계, 통계법, 국가, 비 보장, 자료제출,

통계작성기 장, 통계청장

2장 0.519

통계청장, 통계작성기 장, 정기통계품질진단, 통령령, 수시통계품질

진단, 통계작성, 자체통계품질진단, 통계보 , 통계, 통계교육, 통계작성

기 , 국가통계 원회, 방법, 산, 인력, 차, 기술지원, 기획재정부장

, 통계이용, 통계종사자, 통계책임

4장 0.321

통계작성기 장, 통계청장, 통계작성, 통계자료, 제공, 통령령, 행정자

료, 의, 개인, 단체, 법인, 통계, 승인, 승인취소, 통계작성기 , 표 분

류, 고시, 요청, 통계간행물, 통계공표, 통계데이터베이스구축, 공표, 요

청기 장, 자료제출, 제공기 장, 제공방법, 지정통계작성, 조요청, 공

공기 장, 계인, 권고, 발간, 발간내역, 변경, 분류코드, 새로운, 소요

경비, 요구, 자료, 작성, 작성 지, 정보보호조치, 제한, 조사, 조사 상,

조사방법, 지방자치단체장, 지정통계, 질문, 통계데이터베이스, 통계데이

터베이스연계, 통계데이터베이스통합, 통계이용자, 표 화, 확인

5장 0.220 통계작성, 개인, 단체, 법인

4.1 제1장 총칙에 대한 분석

제1장 총칙은 모두 5개의 조항으로 구성되어 있는데, 주요 단어에 한 연결선의

수와 근 심성을 살펴보면 <표 4.2>와 같다. 연결선의 수는 ‘통계작성’이 가장 큰

가운데 ‘통계보 ’과 ‘통계이용’이 그 다음 큰 것으로 나타났다. 이는 연결망 그래 로

부터도 확인할 수 있다. <그림 4.1>에서 볼 수 있듯이 계망의 심에 이들 3 단어

가 있음을 알 수 있다. 결국 제1장 총칙은 통계의 작성과 보 과 이용에 필요한 제반

사항을 정하는 부분임을 알 수 있다.

<표 4.2> 제1장의 연결선의 수와 근 심성

단어 연결선의 수 근 심성 단어 연결선의 수 근 심성

통계보 0.192 2.91 국가 0.019 0.71

통계이용 0.163 2.46 비 보장 0.067 1.23

통계작성 0.269 3.20 자료제출 0.077 1.83

통계 0.000 0.00 통계작성기 장 0.087 1.98

통계법 0.067 1.31 통계청장 0.058 1.27

언어네트워크분석을 이용한 통계법 내용분석 59

<그림 4.1> 제1장에 한 연결망 그래

비교를 하여 국통계법에 한 언어네트워크분석 결과를 간략하게 살펴보자.

본 연구에서 활용한 국통계법은 1983년 12월 8일 제6차 국민의회 상임 원회의 3차

모임에서 채택되고, 1996년 5월 15일 채택된 국통계법 개정에 한 국민의회 상임

원회의 결정에 다라 개정된 법률이다(통계청, 2001). 법체계가 다르기 때문에 우리

나라 통계법과 응비교는 어렵기에, 일단 우리나라 통계법의 총칙과 유사한 제1장

일반 조항에 한 연결망 그래 를 그려보면 <그림 4.2>와 같다. 체 8조로 되어

있어 내용이 우리나라 제1장 총칙보다 많음을 감안하더라도 법률에서 사용된 단어가

우리나라 보다 훨씬 다양한 것으로 나타났다. 그러함에도 불구하고 연결망의 도가

0.94로 나타나 단어들 간의 연결 계 정도가 높음을 알 수 있다. 한편 근 심성에

해서는 ‘국가’가 2.92로 가장 높고, 다음으로 통계작업(2.84), 통계자료(2.41), 통계법

(2.35), 통계기구(2.17)의 순으로 나타나, 국가가 심이 된다는 에서 통계의 작성과

이용․보 이 심이 되는 우리나라와는 많은 차이가 있음을 알 수 있다. 국통계행

정시스템에 한 면 한 분석이 있어야 하나, 일단 이러한 차이는 국이 사회주의국

가이기 때문에 기인한 것으로 여겨진다.

60 장정우 ․ 최경호

<그림 4.2> 국통계법 제1장 연결망 그래

4.2 제2장 통계의 작성 ∙ 보급 및 이용 기반 구축에 대한 분석

모두 10개의 조항으로 구성된 제2장에 한 주요 단어의 연결선의 수와 근 심

성을 살펴보면 <표 4.3>와 같다. 각각의 노드가 네트워크 구조 내에서 얼마나 심에

치하고 있는가를 나타내는 심성지표 의 하나인 근 심성에 해서는 ‘통계청

장’이 가장 큰 값을 보이고 있다. 이는 연결망 그래 로 부터도 확인 가능하다. 이로

부터 제2장의 법령이 시행되는데 있어서는 통계청장이 가장 용한 역할을 담당함을

알 수 있다. 참고로 통계청장은 정부조직법 제23조(기획재정부) ⑩항(통계청에 청장 1

명과 차장 1명을 두되, 청장은 정무직으로 하고, 차장은 고 공무원단에 속하는 별정

직국가공무원으로 보한다)에 그 근거를 두고 있다.

<표 4.3> 제2장의 연결선의 수와 근 심성

단어 연결선의 수 근 심성 단어 연결선의 수 근 심성

통계청장 0.174 2.17 국가통계 원회 0.041 0.66

통계작성기 장 0.000 0.00 방법 0.046 1.07

정기통계품질진단 0.096 1.78 산 0.055 1.23

통령령 0.110 1.56 인력 0.041 1.40

수시통계품질진단 0.000 1.62 차 0.018 1.01

통계작성 0.073 0.00 기술지원 0.018 0.89

자체통계품질진단 0.106 1.45 기획재정부장 0.028 0.63

통계보 0.000 1.61 통계이용 0.023 0.87

통계 0.041 0.00 통계종사자 0.018 0.92

통계교육 0.000 1.45 통계책임 0.000 0.63

통계작성기 0.023 0.00 1

언어네트워크분석을 이용한 통계법 내용분석 61

<그림 4.3> 제2장에 한 연결망 그래

4.3 제4장 통계의 작성∙보급 및 이용에 대한 분석

모두 14개 조항으로 구성된 제4장에서는 통계작성의 승인, 통계작성 승인의 취소,

표 분류, 행정자료의 제공, 자료제출명령, 실지조사 등에 한 내용을 규정하고 있다.

제4장의 주요 단어에 한 연결선의 수와 근 심성은 <표 4.4>와 같다. <표 4.4>와

<그림 4.4>로부터 제4장의 핵심이 되는 단어는 통계작성, 통계자료, 통계청장 등임을

알 수 있다. 제4장의 목 인 통계의 작성과 보 이용에 있어서도 역시 통계청장

의 역할이 매우 요함을 알 수 있다. 즉, 법령으로 규정된 통계법의 효율 운용을

해서는, 무엇보다도 통계청장의 역할이 요함을 계량 으로 확인할 수 있다.

<표 4.4> 제4장의 연결선의 수와 근 심성

단어 연결선의 수 근 심성 단어 연결선의 수 근 심성

통계작성기 장 0.000 0.00 공공기 장 0.011 0.67

통계청장 0.078 2.83 계인 0.006 0.79

통계작성 0.192 3.59 권고 0.006 1.03

통계자료 0.065 2.93 발간 0.000 0.00

제공 0.000 0.00 발간내역 0.000 0.00

통령령 0.029 1.57 변경 0.015 1.23

행정자료 0.051 1.58 분류코드 0.008 0.86

의 0.048 2.32 새로운 0.008 1.03

개인 0.058 2.31 소요경비 0.013 0.89

단체 0.067 2.45 요구 0.012 1.05

법인 0.055 2.26 자료 0.000 0.00

62 장정우 ․ 최경호

단어 연결선의 수 근 심성 단어 연결선의 수 근 심성

통계 0.000 0.00 작성 0.000 0.00

승인 0.000 0.00 작성 지 0.000 0.00

승인취소 0.000 0.00 정보보호조치 0.018 1.00

통계작성기 0.000 0.00 제한 0.018 1.00

표 분류 0.027 1.85 조사 0.000 0.00

고시 0.019 1.57 조사 상 0.000 0.00

요청 0.000 0.00 조사방법 0.000 0.00

통계간행물 0.016 1.44 지방자치단체장 0.015 0.98

통계공표 0.013 1.27 지정통계 0.017 1.25

통계DB구축 0.000 0.00 질문 0.012 1.05

공표 0.023 1.92 통계DB 0.000 0.00

요청기 장 0.028 1.20 통계DB연계 0.000 0.00

자료제출 0.000 0.00 통계DB통합 0.000 0.00

제공기 장 0.028 1.20 통계이용자 0.006 0.70

제공방법 0.000 0.00 표 화 0.008 0.86

지정통계작성 0.017 1.25 확인 0.012 1.05

조요청 0.000 0.00 1

<그림 4.4> 제4장에 한 연결망 그래

언어네트워크분석을 이용한 통계법 내용분석 63

4.4 제5장 통계응답자의 의무 및 보호 등에 대한 분석

제5장은 단3개의 조항으로 이루어지는 등 체 인 내용이 많지 않을 뿐 아니라,

<표 4.1>에서 보듯이 빈도수가 2이상인 단어도 많지 않다. 따라서 각종 지표를 보는

것은 별 의미가 없기에 모든 단어를 상으로 연결망 그래 만 그려 보았다. <그림

4.5>에서 보듯이 비 보호와 련된 사항, 조사 응답에 한 사항 등 3개 정도의

그룹으로 분할됨을 알 수 있다. 체 인 연결정도가 작아 연결망의 도도 가장 낮

은 0.220으로 나타났다. 언어네트워크 측면에서 볼 때 제5장은 조항 간의 연결정도가

낮은 장이라고 하겠다.

<그림 4.5> 제5장에 한 연결망 그래

5. 결론

통계법을 해설한 김재신(1996)에 따르면, 통계법은 통계의 작성․보 이용과

그 기반구축 등에 하여 필요한 사항을 정함으로써 통계의 신뢰성과 통계제도 운용

의 효율성을 확보함을 목 으로 한다. 이와 같은 목 을 달성하기 하여 통계법은

통계청장에게 많은 권한과 의무를 부여하고 있는 바, 지정기 지정통계의 지정,

통계작성승인․공포 의․발간승인 등 일련의 통계작성활동에 한 조정 등의 권한과

64 장정우 ․ 최경호

함께 통계자료를 리 활용할 의무 통계작성과정에서 수집된 통계자료의 비 을

보호할 의무 등을 부여하여 정확한 통계가 시의성 있게 리 활용될 수 있도록 도모

하고 있다.

그런데 재까지 통계법이 실제로 목 달성을 하여 통계청장에게 많은 권한과

의무가 부여된 형태로 제정되었는지 여부를 계량 으로 확인할 수는 없었다. 그 이유

는 텍스트 주의 언어 자료를 계량 으로 분석하는 방법론이 많지 않았기 때문이

다. 그러나 최근 들어 이러한 문제에 한 해결방안의 일환으로 언어네트워크분석이

개발되었다. 이에 본 연구에서는 언어네트워크분석을 이용하여 통계법에 하여 내용

분석을 실시해 보았다.

그 결과 제1장과 제2장 그리고 제4장 등에서 모두 통계청장이 요한 치에 있음

을 확인할 수 있었다. 따라서 우리나라와 같은 분산형 통계제도를 운용하는 경우에

있어서는 통계청장의 역할이 무엇보다도 요하며, 결국 통계청장을 심으로 력체

제 구축이 되어야 효율 인 국가통계운용이 된다고 할 수 있겠다.

텍스트로 구성된 자료를 계량 으로 분석하여 시각 으로 확인해 본 , 그리고

통계법을 법리 인 측면에서가 아닌 기술통계 인 측면에서 분석해 본 등에서 본

연구는 차별화 되었다고 할 수 있다. 법체계가 달라 충분한 비교를 해 보진 못했으나

국통계법과의 비교를 통하여 의미 있는 차이 을 발견한 등에 비추어 볼 때, 향

후 다른 국가의 통계법 등과의 비교연구 시 기 자료로 활용될 수 있을 것으로 사료

된다. 다만 본 연구에서 객 이고 계량 인 분석방법을 통한 연구를 진행하기 하

여 언어네트워크분석을 활용한 실증 이고 계량 인 연구방법을 이용하 으나, 연구

분석 결과에 한 해석에서 일부 본 연구자의 주 인 단이 작용했을 수 있는 ,

그리고 단순히 통계법을 언어네트워크분석 한 결과로부터 도출된 결론이라는 은 분

명 본 연구의 한계이다.

(2012년 7월 9일 수, 2012년 7월 23일 수정, 2012년 9월 19일 채택)

언어네트워크분석을 이용한 통계법 내용분석 65

참고문헌

국가통계인 라 강화 추진단. (2005). <통계법 개정작업 황>, 통계청.

김용학. (2003). <사회 연결망 분석>, 박 사, 서울.

김재신. (1996). 통계법 해설, <1996 한국통계학회 춘계학술 회 발표논문집>, 1-6.

김지수 (2011). <갈등 당사자의 임 변화에 한 연구>, 앙 학교 학원 석사학

논문.

류상일, 남궁승태 (2011). 재난안 련 법제 분석, <한국 기 리논집>, 7(6), 29-46.

박한우, Leydesdorff, L. (2004). 한국어의 내용분석을 한 KrKwic 로그램의 이해와

용: Daum.net에서 제공된 지역 신에 한 뉴스를 상으로, <한국자료분

석학회지>, 6(5), 1377-1387.

윤수재, 김지수. (2011). 앙정부 정책만족도 개선방안에 한 내부고객과 외부 문가의

인식분석: 언어네트워크분석을 심으로, <한국정책학회보>, 20(3), 133-161.

이창길 (2010). 정권 기의 가치지향과 정책우선순 : 참여정부와 이명박정부의 언어네

트워크 비교분석, <한국행정학보>, 44(3), 165-189.

통계청 (2001). <주요 국가의 통계법령>, 통계기획국.

허명회 (2010). <R활용한 사회네트워크분석 입문>, 자유아카데미, 서울.

66 장정우 ․ 최경호

Statistics Act Content Analysis using Semantic Network Analysis

Jeong-Woo Jang1) ∙ Kyoung-Ho Choi2)

Abstract

Semantic network analysis is a research method which is being done in some studies, especially in the mass media study, and the study on the Disaster Safety Management Basic Act by Ryu Sang-il et al.(2011) and the study on the President's speech by Lee Chang-gil(2010) are the studies conducted by Semantic network analysis. But there have so far been few studies which make a quantitative approach to Statistics Act. So this study deals with the content analysis on the Statistics Act through Semantic network analysis. The present Statistics Act (Enforcement Date 1. Jul, 2010. Act No.10196. 31. Mar, 2010, Partial Amendment) is consist of 7 chapters and 41 articles and addenda. Consequently, it was found that the director of the Statistical Information Service holds a key position in Chapter 1, 2 and 4 analyzed here. So the role of the director of the Statistical Information Service is the most important in such country as Korea that adopts decentralized statistical system, and the cooperation with the director of the Statistical Information Service at the center is needed for the National Statistics to work effectively. This study is characterized by the visualization of the text material through quantitative analysis, and the analysis of Statistics Act in technical-statistical aspect rather than in legal aspect will provide the basis for the comparative study on Statistics Acts between the countries.

Key words : Quantitative approach, Content analysis, Semantic network matrix, Statistics Act.

1) Graduate school of Department of Law, Seoul National University. E-mail: [email protected]

2) (corresponding author) Professor of Basic Medical Science(Statistics Major), Jeonju University.

E-mail: [email protected]