-
(42)
Linear Model | Spring 2013
예제 데이터SMSA.xls사망률에 영향을 주는 변인
Chapter 4. Multiple Regression 연구모형도
변수 변수명 변수내용
종속변수 Mortality 사망률
기후
JanTemp 1월기온
JulyTemp 7월기온
RelHum 상대습도
Rain 강우량
사회경제
Education 교육수준
PopDensity 인구밀도
NonWhite 비백인비율
WC 화이트칼라 비율
pop/house 가구당 가족수
income 소득
환경
HCPot 오염물질1
NOxPot 오염물질2
S02Pot 오염물질3
city Mortality JanTemp JulyTemp RelHum Rain Education PopDensity NonWhite WC pop/house income HCPot NOxPot S02PotAkron, OH 921.87 27 71 59 36 11.4 3243 8.8 42.6 3.34 29560 21 15 59
Albany-Schenectady-Troy, NY 997.87 23 72 57 35 11 4281 3.5 50.7 3.14 31458 8 10 39
사망률
(기후)
1월기온(-)7월기온(+)상대습도(+)강우량(+)
(사회경제)
교육수준(-)인구밀도(+)비백인비율(+)WC 비율(+)가족수 (+?)소득(-)
(환경)
HCPot(+)NOcPot(+)SO2Pot(+)
-
(43)
Linear Model | Spring 2013
종속변수와 설명변수 분포가능하다면 좌우대칭 분포변수변환•우로 치우침 : x < ln(x) 설명변수 변환이상치/영향치 진단•잔차분석에서 가능
설명변수간 산점도다중공선성 사전 진단
상관계수•변수간 선형관계 정도 숫자값
Chapter 4. Multiple Regression 순서1. 산점도행렬&분포함수
-
(44)
Linear Model | Spring 2013
Chapter 4. Multiple Regression 순서1. 산점도행렬&분포함수 (그리기)
car 패키지 활용“|city”는 범주형 변수의 구별
변수변환우로 치우침 : 비백인비율, 소득좌로 치우침 : 교육수준
각 측정형변수가 정규분포 변환이필요하면 변환 후 이를 설명변수로사용한다.
-
(45)
Linear Model | Spring 2013
Chapter 4. Multiple Regression 순서1. 상관계수 분석
정규분포 변환 후 사용•회귀분석 내 모든 변수는 좌우대칭 필요
변수간 Pearson 상관계수•종속변수에 유의한 영향을 미치는설명변인 사전 검색, 물론 개별적 영향을준다고 전체 모형에서 유의한 것은아니다. (유의수준 20%, 다소 충분하게)
•유의한 설명변수 부호 연구모형도 부호와비교함. 상이하면 데이터 수집 및 이론재검증
•설명변수 간 유의한 상관 : 다중공선성사전 진단
-
(46)
Linear Model | Spring 2013
Chapter 4. Multiple Regression 순서1. 상관계수 결과
유의한 설명변수 상관계수 부호 구성도와 일치
-
(47)
Linear Model | Spring 2013
Chapter 4. Multiple Regression 순서1. 선형관계 진단
선형성이 위반되는설명변수가 보이지 않음
46-1