20161222 기출문제해설강의

17
2016 경영지도사 시장조사론 2차 시험 기출문제 해설 2016. 12 2016. 12 [email protected] www.datatales.co.kr

Upload: fama-contents-marketing

Post on 13-Jan-2017

117 views

Category:

Education


3 download

TRANSCRIPT

2016 경영지도사 시장조사론2차 시험 기출문제 해설

2016. 122016. 12

[email protected]

【 문제 1 】 친환경 제품을 생산하고 있는 ㈜한국은 친환경제품 디자인을 3가지 유형으로개발하고 있다. ㈜한국의 마케팅관리자가 친환경제품 디자인이 친환경제품에 대한 소비자의태도에 미치는 영향을 분석하고자 한다. 이 마케팅 관리자는 소비자의 친환경의식이친환경제품에 대한 태도에 영향을 줄 가능성을 염두해 두고 조사하였고, 다음 <표1>과 같은결과를 얻었다.친환경의식과 친환경제품에 대한 태도는 리커트(Likert) 5점 척도로 측정하였다.다음 각 질문에 답하시오.(30점)

<표 1> 조사 결과

☞ 문제 解說 실제 시험 당일 문제를 풀어야 하는 분들 입장에서는 처음부터 조금 당황했을 수 있습니다. 그런데 사실은 문제에서 나오는통계분석 결과를 정확하게 알지 못하더라도 척도와 분석 간의 관계와 분산분석, 그리고 통계적 의사결정에 대해 알고 있다면 답변하는데무리가없는 문제입니다.

친환경의식이 리커트 척도 형태로 제시되어 많은 분들이 가변수를 이용한 회귀분석과 분산분석을 놓고 고민하셨을 것 같습니다.다중회귀분석의 특수한 예가 분산분석이고 분산분석의 특수한 예가 t검정이라는 점을 감안한다면 이 문제를 가변수를 이용한회귀분석으로 해결하는 것이 일반적입니다. 그런데 이미 문제에서 분산분석의 결과를 제시하고 있어 분산분석으로 문제를 해결하라는출제자의 의도가 엿보입니다.

문제의 분산분석결과는 이원분산분석법(two way ANOVA)의 결과입니다. 과거에는 이원분산분석법(two way ANOVA)과RCBD(Randomized Complete Block Design)을 준별하는 분위기였으나 이원분산분석법과 RCBD의 분석과정이 완전히 동일하기때문에 용어 상 이 둘의 구분이 분명하지는 않은 것 같습니다. 구획(block)이라는 용어 대신 treatment factor에 대응하는 blockingfactor라는 용어를 혼용하고도 있습니다. 이런 분석 상의 혼용에도 불구하고 일반적인 이원분산분석법과 RCBD는 실험설계 측면에서는완전히다르다는 점을 알아야겠습니다.

문제에서는 적시되어 않지만 디자인 유형은 일반적인 의미의 처리요인(treatment)인 반면, 리커트 척도로 제시한 친환경 의식은구획(block)으로 작용하고 있습니다. 디자인 유형과 친환경 의식을 무작위로 조합하여 응답자에게 처리할 수 있는 것이 아니라는 점을생각해보면 쉽게 알 수있습니다.

문제에서와 같이 친환경 의식의 수준으로 구획하는 이유는 친환경 의식을 제어하지 않으면 제품 디자인 유형이 제품에 대한 태도에미치는 영향을 왜곡할 수 있기 때문입니다. 예를 들어 우연히 특정 제품 디자인별 응답자들의 친환경 의식에 차이가 있다면 제품 디자인간의 실질적인 차이와는 무관하게 친환경 의식 차에 의해 마치 제품 디자인별로 제품에 대한 태도에 차이가 있는 것처럼 보일 수도있습니다. 실제로 아래와 같이 문제에 제시한 자료를 이용해 친환경 의식 수준을 제외한 일원분산분석법(one way ANOVA)를 실시해보면유의수준 0.05 하에서 제품 디자인별로 제품에 대한 태도에 차이가 있는 것으로 분석결과가 나온 것을 확인할 수있습니다.

☞ 문제 解說 실제 시험 당일 문제를 풀어야 하는 분들 입장에서는 처음부터 조금 당황했을 수 있습니다. 그런데 사실은 문제에서 나오는통계분석 결과를 정확하게 알지 못하더라도 척도와 분석 간의 관계와 분산분석, 그리고 통계적 의사결정에 대해 알고 있다면 답변하는데무리가없는 문제입니다.

친환경의식이 리커트 척도 형태로 제시되어 많은 분들이 가변수를 이용한 회귀분석과 분산분석을 놓고 고민하셨을 것 같습니다.다중회귀분석의 특수한 예가 분산분석이고 분산분석의 특수한 예가 t검정이라는 점을 감안한다면 이 문제를 가변수를 이용한회귀분석으로 해결하는 것이 일반적입니다. 그런데 이미 문제에서 분산분석의 결과를 제시하고 있어 분산분석으로 문제를 해결하라는출제자의 의도가 엿보입니다.

문제의 분산분석결과는 이원분산분석법(two way ANOVA)의 결과입니다. 과거에는 이원분산분석법(two way ANOVA)과RCBD(Randomized Complete Block Design)을 준별하는 분위기였으나 이원분산분석법과 RCBD의 분석과정이 완전히 동일하기때문에 용어 상 이 둘의 구분이 분명하지는 않은 것 같습니다. 구획(block)이라는 용어 대신 treatment factor에 대응하는 blockingfactor라는 용어를 혼용하고도 있습니다. 이런 분석 상의 혼용에도 불구하고 일반적인 이원분산분석법과 RCBD는 실험설계 측면에서는완전히다르다는 점을 알아야겠습니다.

문제에서는 적시되어 않지만 디자인 유형은 일반적인 의미의 처리요인(treatment)인 반면, 리커트 척도로 제시한 친환경 의식은구획(block)으로 작용하고 있습니다. 디자인 유형과 친환경 의식을 무작위로 조합하여 응답자에게 처리할 수 있는 것이 아니라는 점을생각해보면 쉽게 알 수있습니다.

문제에서와 같이 친환경 의식의 수준으로 구획하는 이유는 친환경 의식을 제어하지 않으면 제품 디자인 유형이 제품에 대한 태도에미치는 영향을 왜곡할 수 있기 때문입니다. 예를 들어 우연히 특정 제품 디자인별 응답자들의 친환경 의식에 차이가 있다면 제품 디자인간의 실질적인 차이와는 무관하게 친환경 의식 차에 의해 마치 제품 디자인별로 제품에 대한 태도에 차이가 있는 것처럼 보일 수도있습니다. 실제로 아래와 같이 문제에 제시한 자료를 이용해 친환경 의식 수준을 제외한 일원분산분석법(one way ANOVA)를 실시해보면유의수준 0.05 하에서 제품 디자인별로 제품에 대한 태도에 차이가 있는 것으로 분석결과가 나온 것을 확인할 수있습니다.

(1) 친환경제품 디자인이 친환경제품에 대한 소비자의 태도에 미치는 영향 분석에서 친환경의식 변수가 가지는 의미를 논하시오. (10점)

본 분석에서 디자인 유형 외에 친환경 제품에 대한 소비자의 태도의 차이를 설명하는 가장 강력한경쟁가설은 친환경 의식 수준의 차이입니다. 그러므로 친환경 의식 변수를 구획화하여 제어하지 않으면친환경 의식 변수가 친환경제품 디자인이 친환경제품에 대한 소비자 태도에 미치는 영향을 왜곡하는 변수로작용할 수 있습니다. 친환경 의식 변수의 영향을 배제하고 순수한 디자인 유형의 영향을 분리하기 위해친환경의식을 blocking factor로 활용하는이원분산분석법(two way ANOVA)을 활용하게됩니다.

(2) 조사 결과를 분석하기 위한 적정한 분석방법을 제시하고, 그 이유에 관하여 논하시오.(15점)

문제에서 독립변수인 디자인 유형은 질적 변수이며, 종속변수인 소비자 태도는 양적 변수이므로 분산분석을적용하는 것이 타당하며, 특히 친환경 의식으로 구획화한 이원분산분석법을 활용합니다. 물론, 친환경의식은 등간척도의 양적 변수이므로 이 문제는 디자인 유형을 가변수로 활용하는 회귀분석의 적용도가능합니다. 그러나 독립변수가 종속변수에 미치는 영향력까지 파악할 목적은 아니라면 별도의 데이터가공이필요하지않다는관점에서 분산분석이본 문제에는보다 효율적인분석방법일것으로판단됩니다.

(1) 친환경제품 디자인이 친환경제품에 대한 소비자의 태도에 미치는 영향 분석에서 친환경의식 변수가 가지는 의미를 논하시오. (10점)

본 분석에서 디자인 유형 외에 친환경 제품에 대한 소비자의 태도의 차이를 설명하는 가장 강력한경쟁가설은 친환경 의식 수준의 차이입니다. 그러므로 친환경 의식 변수를 구획화하여 제어하지 않으면친환경 의식 변수가 친환경제품 디자인이 친환경제품에 대한 소비자 태도에 미치는 영향을 왜곡하는 변수로작용할 수 있습니다. 친환경 의식 변수의 영향을 배제하고 순수한 디자인 유형의 영향을 분리하기 위해친환경의식을 blocking factor로 활용하는이원분산분석법(two way ANOVA)을 활용하게됩니다.

(2) 조사 결과를 분석하기 위한 적정한 분석방법을 제시하고, 그 이유에 관하여 논하시오.(15점)

문제에서 독립변수인 디자인 유형은 질적 변수이며, 종속변수인 소비자 태도는 양적 변수이므로 분산분석을적용하는 것이 타당하며, 특히 친환경 의식으로 구획화한 이원분산분석법을 활용합니다. 물론, 친환경의식은 등간척도의 양적 변수이므로 이 문제는 디자인 유형을 가변수로 활용하는 회귀분석의 적용도가능합니다. 그러나 독립변수가 종속변수에 미치는 영향력까지 파악할 목적은 아니라면 별도의 데이터가공이필요하지않다는관점에서 분산분석이본 문제에는보다 효율적인분석방법일것으로판단됩니다.

(3) 위 (2)의 분석방법을 적용하여 다음 <표 2>와 같은 결과를 얻었다. 이 분석 결과를 친환경제품에 대한 태도 분석의 주요 요인을 포함하여 분석결과 해석의 관점에서논하시오.(α=.05)(5점)

<표 2> 조사 결과

위 결과에서 친환경제품디자인 유형별 그룹 간 소비자 태도의 분산이 디자인 유형 그룹 내 분산보다 크다면 친횐경 제품 디자인 유형별로 제품에 대한 소비자 태도에 차이가 있다고 판단할 수 있습니다. 제품 디자인 유형별로 소비자 태도에 차이가 없다는 귀무가설 하에서 주어진 F값 관측치로 계산한 유의확률이0,998로 유의수준보다 더 큰 값을 보여 귀무가설을 기각할 강력한 증거를 제시하지 못하고 있습니다. 그러므로 제품디자인별 소비자태도에 차이가 있다는 주장은 받아들이기 어렵습니다. 반면, 친환경 인식 수준에따라제품에 대한 소비자 태도는 유의미한차이를보이는 것으로 나타났습니다.

☞ 위 분산분석표에서 제시하고 있는 자유도는 분산분석과 회귀분석 양 분석 모두와 맞지 않습니다. 물론 문제를 해결하는데에는 큰 관계가 없습니다.

【 문제 2 】 2016년 하계 올림픽 체조8강 경기에 출전한 각 국가대표 8명의 선수에 대해 두명의 심사위원이 서열척도로 평가한 다음의 평가순위 자료를 기초로 두 심사위원의 평가관련성 여부를 파악하고자 한다. 다음 <표1>에 기초하여 각 물음에 답변하시오.(30점)

<표 1> 국적별 8명 선수에 대한 두 심사위원의 평가순위

☞ 문제 解說 이 문제 역시 시험 당일 시험을 치러 가신 많은 분들을 당황하게 만들었을 것 같습니다. 그러나 다시 한번 살펴보면 시험당일 스피어만 상관계수를 처음 보신 분들도 문제 풀이에는 큰 지장이 없습니다. 상관분석의 의미를 알고 통계적 의사결정의 원리를이해하고 있다면 매우 단순한 계산문제입니다.

(1) 위 두 명의 심사위원 간 평가 관련성 여부를 검정하기 위한 귀무가설을 설정하시오.(10점)

귀무가설은 보수적 관점에서 현 상태를 지지하는 상황을 가정한다면 두 명의 심사위원이 서열척도로응답한 점수평가는 서로 양의 상관관계를 가지지 않는다고 귀무가설을 수립할 수 있습니다. 즉 아래스피어만 상관계수가 0보다 작거나 같다고 가정합니다. 이 경우 스프어만 상관계수가 0인 경우만 가설을검정하면 0보다 작은 모든 경우에도 성립하므로 가설검정은 스피어만상관계수가 0인 경우를 기준으로실시하게됩니다.(※ 단측검정인지 양측검정인지 분명하지는 않지만 문제에 제시된 자료가 단측검증용이고 심사위원 간평가가 공행하는지가 관심의 대상이라고 생각해서 단측검정을 기준으로 가설을 수립하고 검정하는 것으로정했습니다.)

(2) 위 (1)의 가설을 검정하기 위한 스피어만(Spearman)의 서열상관계수(rs)를 계산하여구하시오.(단, 소수점 넷째자리에서 반올림하여 소수점 셋째자리까지 구한다.)(10점)

서열상관계수 계산식

주어진스피어만상관계수계산식에 근거하여수치를산출하면 0.690이 나옵니다.

(3) 다음의 <표 2> 스피어만의 서열상관계수와 위 (2)의 계산결과를 이용하여 위 (1)의가설을 유의수준 5%에서 검정하고 그 결과를 해석하시오.(10점)

<표 2> 스피어만의 서열상관게수표

(단측검정)

주어진 유의수준과 표본크기 하에서의 임계치는 0.643이며 스피어만상관계수 관측값은0.690이므로, 관측값이 임계치보다 커 주어진 귀무가설 하에서 극단적인 값이 관찰되었다고할 수 있습니다. 그러므로 주어진 표본 하의 관측값에서는 귀무가설을 채택할 수 없습니다.

【 문제 3 】 변수간의 관계를 파악하는 분석(사례: 연령별로 선호하는 영화장르 분석)에서명목척도나 서열척도로 측정된 변수의 분포에 차이가 있는지를 파악하는 교차분석을 위하여카이자승(X2)검정을 할 수 있다. 카이자승검정을 위하여 2개의 범주형 변수들 간의교차분석표(cross-tabulation table)를 설명하고 카이자승 검정의 통계량을 산출하기 위해비교하는 두 수치를 설명하시오.(10점)

☞ 문제 解說 3번 문제는 통계적 의사결정과정과 교차분석에서의 카이자승검정의 절차를 이해하고 있다면 큰 무리 없이 답변이 가능한문제입니다.

카이자승(X2)검정통계량을 이용한 교차분석은 범주형 자료 즉 명목척도 또는 서열척도 변수의 관련성에대한분석입니다.

문제에서 연령별로 선호 영화장르의 비율에는 차이가 없다는 주장을 귀무가설로 설정한다면 귀무가설하에서는 연령별 선호 영화장르 비율은 동일하고 이는 전체 연령집단에서도 동일한 비율로 나타날것입니다.

귀무가설 하에서는 연령별 선호영화장르의 출현 빈도는 동일한 선호영화장르 출현 비율을 가지는다항분포를 따르게 되고 그 결과 실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의제곱합을영화장르별기대도수로나눈 값의 합은 카이자승분포를따르게 됩니다.

실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합은 교차분석에서의검정통계량이 되고 이 검정통계량의 관측치를 카이자승분포 하의 임계치와 비교하여 검정통계량의관측치가 주어진 유의수준 하에서의 임계치보다 큰 값이라면 귀무가설 하에서는 극단적인 값이 나온것으로 볼 수 있기 때문에 귀무가설을 유지할 수 없고 연령별로 선호 영화장르는 차이가 있다고 할 수있습니다.

카이자승(X2)검정통계량을 이용한 교차분석은 범주형 자료 즉 명목척도 또는 서열척도 변수의 관련성에대한분석입니다.

문제에서 연령별로 선호 영화장르의 비율에는 차이가 없다는 주장을 귀무가설로 설정한다면 귀무가설하에서는 연령별 선호 영화장르 비율은 동일하고 이는 전체 연령집단에서도 동일한 비율로 나타날것입니다.

귀무가설 하에서는 연령별 선호영화장르의 출현 빈도는 동일한 선호영화장르 출현 비율을 가지는다항분포를 따르게 되고 그 결과 실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의제곱합을영화장르별기대도수로나눈 값의 합은 카이자승분포를따르게 됩니다.

실제 관측도수와 귀무가설 하의 비율을 근거로 산출한 기대도수의 차이의 제곱합은 교차분석에서의검정통계량이 되고 이 검정통계량의 관측치를 카이자승분포 하의 임계치와 비교하여 검정통계량의관측치가 주어진 유의수준 하에서의 임계치보다 큰 값이라면 귀무가설 하에서는 극단적인 값이 나온것으로 볼 수 있기 때문에 귀무가설을 유지할 수 없고 연령별로 선호 영화장르는 차이가 있다고 할 수있습니다.

연령별 선호 영화장르 사례에 대한 자료구조를 파악하기 위해 교차분석표를 임의로 구성해 보았습니다.10대~40대 연령 응답자 총 1,600명을 대상으로 조사한 경우를 생각해보겠습니다. 10대는 279명, 20대는338명, 30대는 527명, 40대는 456명을 할당했습니다. 실제 설문조사를 진행했다고 가정하고 가상의 관측도수에근거한교차분석표를아래와 같이 만들어 보았습니다.

이제 귀무가설 하에서는 5개 영화 장르별 선호비율은 각각 43.4%, 20.1%, 16.1%, 8.2%, 12.2%로 연령별로 동일하다고 가정해보겠습니다. 이에 근거한 기대도수를 반영한 교차분석표는 아래와 같습니다. 10대 고어/슬래셔 장르를 예로 들면 10대에 할당한 표본크기 279명×43.4%를 곱하여 기대도수를 산출하면 됩니다.

검정통계량의 구체적인 값은 (200-121)2/121+(50-56)2/56+(60-45)2/45+ … +(72-56)2/56 = 2,013이됩니다. 귀무가설 하에서는 검정통계량의 표본분포는 자유도 (5-1)×(4-1)=12의 카이자승분포이므로 유의수준을 5%로 설정한다면 본 사례에서의 임계치는 21.03입니다. 그러므로 사례의 검정통계량 값은 주어진 귀무가설 하에서는 매우 극단적인 값으로 귀무가설에 대한 강력한 반증이 되고 연령별 선호 영화 장르에는차이가 있다고 판단할수 있습니다.

【 문 제 4 】 실 험 디 자 인 ( 실 험 설 계 ) 의 타 당 성 개 념 과 유 형 을 설 명 하 고 ,실험디자인(실험설계)의 타당성 유형들의 관계를 외생변수와 관련하여 설명하시오. (10명)

내적 타당성이란 조사의 설계와 분석이 원인과 결과 즉 인과관계를 정확하게 추론하는 정도를 말합니다.내적 타당성을 저해하는 외생변수로는 조사대상집단의 특성변화와 관련한 성숙요인과 역사적 요인이 있고,표본의 대표성과 관련한 선발요인, 상실요인 및 회귀요인이 있습니다. 관찰 및 측정방법과 관련해서는 검사요인과측정수단이문제가됩니다.

외적 타당성은 조사의 분석결과를 일반화시킬 수 있는 범위를 말합니다. 외적 타당성에서는 특히 다른모집단에 대한 일반화, 일반화가 가능한 시기 및 일반화가 가능한 상황이 문제가 됩니다. 조사대상집단의특성 변화 측면에서 본다면 조사기간이 길어지면 내적 타당성이 저해될 우려가 있는 반면, 일반화의가능성이 높아진다는 점에서 내적 타당성과 외적 타당성은 상충관계에 있다고 하겠습니다. 그러나, 표본의대표성과 관측 및 측정방법과 관련해서는 내적 타당성을 저해하는 여러 외생변수들이 외적 타당성까지저해한다고하겠습니다.

내적 타당성이란 조사의 설계와 분석이 원인과 결과 즉 인과관계를 정확하게 추론하는 정도를 말합니다.내적 타당성을 저해하는 외생변수로는 조사대상집단의 특성변화와 관련한 성숙요인과 역사적 요인이 있고,표본의 대표성과 관련한 선발요인, 상실요인 및 회귀요인이 있습니다. 관찰 및 측정방법과 관련해서는 검사요인과측정수단이문제가됩니다.

외적 타당성은 조사의 분석결과를 일반화시킬 수 있는 범위를 말합니다. 외적 타당성에서는 특히 다른모집단에 대한 일반화, 일반화가 가능한 시기 및 일반화가 가능한 상황이 문제가 됩니다. 조사대상집단의특성 변화 측면에서 본다면 조사기간이 길어지면 내적 타당성이 저해될 우려가 있는 반면, 일반화의가능성이 높아진다는 점에서 내적 타당성과 외적 타당성은 상충관계에 있다고 하겠습니다. 그러나, 표본의대표성과 관측 및 측정방법과 관련해서는 내적 타당성을 저해하는 여러 외생변수들이 외적 타당성까지저해한다고하겠습니다.

【 문제 5 】 제품만족도와 기업신뢰도라는 구성개념(construct)을 측정하기 위하여 각구성개념별로 복수의 설문문항을 사용하였다. 제품만족도와 기업신뢰도를 독립변수로 하고기업 수익성을 종속변수로 하는 회귀모형을 분석하고자 할 때, 두 독립변수의 측정항목을대상으로 요인분석을 실행하여 독립변수 값으로 투입하기 위한 방법을 설명하시오.(10점)

제품만족도와 기업신뢰도라는 추상적 개념을 측정도구 즉 설문이 얼마나 잘 반영하는지를 파악하기 위해요인분석을 적용하게 됩니다. 요인분석은 변수들 간의 상관관계가 높은 것끼리 묶어 공통요인을 추출하는다변량분석기법으로 입력변수들의 총분산을 이용해 공통요인을 추출하는 주성분분석과 입력변수들이 가지는 공통분산만을 이용해 공통요인을 추출하는 공통요인분석이 있습니다. 정보의 손실을 방지하기 위해주성분을적용하는것이 일반적입니다.

요인분석 실시결과 항목의 요인적재량(factor loading)이 0.6이상이면 분석대상 변수가 해당요인에 속하는것으로 판단하게 됩니다. 요인적재량이란 각 변수와 요인간의 상관계수로 해당 변수를 그 요인이 얼마나잘 설명해주는가를나타냅니다.

요인분석 결과 원래 의도한 구성개념대로 항목들이 하나의 요인으로 묶이고, 다른 개념으로 분류한항목들이다른 요인으로묶이는지 파악함으로써측정의 타당성을점검할 수 있습니다.

제품만족도와 기업신뢰도라는 추상적 개념을 측정도구 즉 설문이 얼마나 잘 반영하는지를 파악하기 위해요인분석을 적용하게 됩니다. 요인분석은 변수들 간의 상관관계가 높은 것끼리 묶어 공통요인을 추출하는다변량분석기법으로 입력변수들의 총분산을 이용해 공통요인을 추출하는 주성분분석과 입력변수들이 가지는 공통분산만을 이용해 공통요인을 추출하는 공통요인분석이 있습니다. 정보의 손실을 방지하기 위해주성분을적용하는것이 일반적입니다.

요인분석 실시결과 항목의 요인적재량(factor loading)이 0.6이상이면 분석대상 변수가 해당요인에 속하는것으로 판단하게 됩니다. 요인적재량이란 각 변수와 요인간의 상관계수로 해당 변수를 그 요인이 얼마나잘 설명해주는가를나타냅니다.

요인분석 결과 원래 의도한 구성개념대로 항목들이 하나의 요인으로 묶이고, 다른 개념으로 분류한항목들이다른 요인으로묶이는지 파악함으로써측정의 타당성을점검할 수 있습니다.

☞ 문제 5 다음페이지 계속

제품만족도와 기업신뢰도를 구성하는 세부항목을 이루는 변수들을 회귀분석을 위한독립변수로 활용할 경우, 독립변수들간의 강한 선형관계로 인해 회귀계수의 계산이불가능하거나 회귀계수의 표준오차를 과장하여 검정 자체가 불가능하게 만드는다중공선성의 문제가 발생하게 됩니다.

다중공선성의 문제를 보정하기 위한 방법으로 서로 공행하는 독립변수들을 하나의주성분으로 통합하여 이들 주성분에 종속변수를 회귀시키는 방법이 있습니다. 주성분분석은n개의 입력변수를 가지는 총분산을 n개의 주성분으로 다시 나타내고 총분산에 대한설명력이 높은 순서대로 주성분요인을 추출하는 방법입니다. 주성분분석에서 원래의변수들과 요인간의 관계를 분명히 하게 하기 위해 요인축을 회전하게 되는데 요인의 축들이직각이 되도록 회전하게 되면 요인 간의 상관관계가 거의 없어지므로 다중공선성을 보정할수 있습니다. 기존 독립변수 대신 주성분을 독립변수로 한 회귀분석을 실시하게 되면주성분들 간의 독립성이 보장되므로 다중공선성의 문제를 보정할 수 있습니다.

그러나, 회귀분석에 적용한 주성분들은 원래 독립변수들의 선형결합 형태를 취하고 있기때문에 직관적인 해석이 매우 어렵다는 취약점이 있습니다. 또한 독립변수의 총분산에 대한설명력이 가장 높은 주성분이라고 하더라도 이것이 반드시 종속변수와 가장 높은상관관계를 지는 것이 아니라는 한계가 있습니다.

제품만족도와 기업신뢰도를 구성하는 세부항목을 이루는 변수들을 회귀분석을 위한독립변수로 활용할 경우, 독립변수들간의 강한 선형관계로 인해 회귀계수의 계산이불가능하거나 회귀계수의 표준오차를 과장하여 검정 자체가 불가능하게 만드는다중공선성의 문제가 발생하게 됩니다.

다중공선성의 문제를 보정하기 위한 방법으로 서로 공행하는 독립변수들을 하나의주성분으로 통합하여 이들 주성분에 종속변수를 회귀시키는 방법이 있습니다. 주성분분석은n개의 입력변수를 가지는 총분산을 n개의 주성분으로 다시 나타내고 총분산에 대한설명력이 높은 순서대로 주성분요인을 추출하는 방법입니다. 주성분분석에서 원래의변수들과 요인간의 관계를 분명히 하게 하기 위해 요인축을 회전하게 되는데 요인의 축들이직각이 되도록 회전하게 되면 요인 간의 상관관계가 거의 없어지므로 다중공선성을 보정할수 있습니다. 기존 독립변수 대신 주성분을 독립변수로 한 회귀분석을 실시하게 되면주성분들 간의 독립성이 보장되므로 다중공선성의 문제를 보정할 수 있습니다.

그러나, 회귀분석에 적용한 주성분들은 원래 독립변수들의 선형결합 형태를 취하고 있기때문에 직관적인 해석이 매우 어렵다는 취약점이 있습니다. 또한 독립변수의 총분산에 대한설명력이 가장 높은 주성분이라고 하더라도 이것이 반드시 종속변수와 가장 높은상관관계를 지는 것이 아니라는 한계가 있습니다.

【 문제 6 】 층화표본추출법의 개념과 그 추출방법 2가지에 관하여 설명하시오. (10점)

추출확률이 정해져 있고 사전적으로 알 수 있어 표본추출로 인해 발생하는 오차에 대한 추정이 가능한확률표본추출방법에는 가장 기본적인 단순임의추출 외에 층화표본추출, 체계적 추출 및 집락추출의방법이있습니다.

층화표본추출법은 모집단을 이질적인 몇 개의 층(stratum)으로 구분하여 각 층별로 단순임의추출을적용하는 방법입니다. 층화표본추출법은 각 층별로 충분한 표본크기 확보가 가능하고 층간 이질성이 클경우조사의 정확성을증대시킬수 있습니다.

층화표본추출법에는 각 층의 크기만을 고려하는 비례배분과 분산까지 고려하는 최적배분의 방법이있습니다. 비례배분은 층당 조사비용과 분산이 동일할 경우 적용하는 방법으로 각 층이 모집단에서차지하는비율만큼표본을 할당하는방법입니다.

☞ 문제 6 다음페이지 계속

최적배분은 허용오차한계를 제약조건으로 조사비용을 극소화하는 표본할당방법을 찾은 것입니다.최적배분은 다시 네이만 배분(Neyman allocation)와 데밍 배분(Deming allocation)으로 구분할 수있습니다. 네이만 배분(Neyman allocation)은 표본크기가 일정하게 주어져 있고 층마다 조사단위별비용이 일정할 때 적용하는 방법으로 표본에 대한 할당은 각 층이 모집단에서 차지하는 비중 외에도 각층별분산에 비례하여표본을 할당합니다.

데밍 배분(Deming allocation)은 총비용이 일정하게 주어져 있고 조사단위당 비용이 층에 따라 크게변동할 때 적용하는 방법으로 각 층이 모집단에서 차지하는 비중이 클수록, 각 층의 분산이 클수록 표본을보다더 많이 할당하고각 층의 조사단위당비용이 높을수록표본을더 적게 할당하게됩니다.

데밍 배분(Deming allocation)은 총비용이 일정하게 주어져 있고 조사단위당 비용이 층에 따라 크게변동할 때 적용하는 방법으로 각 층이 모집단에서 차지하는 비중이 클수록, 각 층의 분산이 클수록 표본을보다더 많이 할당하고각 층의 조사단위당비용이 높을수록표본을더 적게 할당하게됩니다.

층화표본추출은 집단 간에 이질성이 존재할 경우 단순임의추출보다 더 정확하게 모집단을 대표하는표본을 추출할 수 있습니다. 그러나, 집단을 구분하는 변수가 잘못된 경우 오히려 대표성을 저해할 수있습니다.

http://onoffmix.com/event/86182온오프믹스(http://onoffmix.com/ )에서 ‘경영지도사’를 검색해 보세요.

2016년 12월 22일 오후 6시 30분~9시 30분, 서울 강남구 역삼로3길 17-6 영준빌딩 10층 비소사이어티

[email protected]

2016년 12월 22일 오후 6시 30분~9시 30분, 서울 강남구 역삼로3길 17-6 영준빌딩 10층 비소사이어티