statistical inference using sas - east carolina university

Post on 09-Feb-2022

3 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Statistical Inference Using SASSAS Code Workshop Series

Qiang Wu

Department of Biostatistics, East Carolina University

February 10, 2012

1 / 87

Analyzing Categorical Data

2 / 87

Survey Data

3 / 87

Variable Description

Col. Description Var. Name Type1-3 Subject ID ID4-5 Age in years AGE Quantitative

6 Gender GENDER Categorical7 Race RACE Categorical8 Marital status MARITAL Categorical9 Education level EDUCATION Categorical

10 President doing good job PRESIDENT Likert Scale11 Arms budget increased ARMS Likert Scale12 Federal aid to cities CITIES Likert Scale

4 / 87

Data Format

PROC FORMAT;

VALUE $SEXFMT '1' = 'Male'

'2' = 'Female'

OTHER = 'Miscoded';

VALUE $RACE '1' = 'White'

'2' = 'African Am.'

'3' = 'Hispanic'

'4' = 'Other';

VALUE $OSCAR '1' = 'Single'

'2' = 'Married'

'3' = 'Widowed'

'4' = 'Divorced';

VALUE $EDUC '1' = 'High Sch or Less'

'2' = 'Two Yr. College'

'3' = 'Four Yr. College'

'4' = 'Graduate Degree';

VALUE LIKERT 1 = 'Str Disagree'

2 = 'Disagree'

3 = 'No Opinion'

4 = 'Agree'

5 = 'Str Agree';

RUN;

DATA QUEST;

INPUT ID $ 1-3

AGE 4-5

GENDER $ 6

RACE $ 7

MARITAL $ 8

EDUCATION $ 9

PRESIDENT 10

ARMS 11

CITIES 12;

LABEL MARITAL = "Marital Status"

EDUCATION = "Education Level"

PRESIDENT = "President Doing a Good Job"

ARMS = "Arms budget Increase"

CITIES = "Federal Aid to Cities";

FORMAT GENDER $SEXFMT.

RACE $RACE.

MARITAL $OSCAR.

EDUCATION $EDUC.

PRESIDENT ARMS CITIES LIKERT.;

DATALINES;

001091111232

002452222422

003351324442

004271111121

005682132333

006651243425

;

RUN;

5 / 87

Data Input

PROC FORMAT;

VALUE $SEXFMT '1' = 'Male'

'2' = 'Female'

OTHER = 'Miscoded';

VALUE $RACE '1' = 'White'

'2' = 'African Am.'

'3' = 'Hispanic'

'4' = 'Other';

VALUE $OSCAR '1' = 'Single'

'2' = 'Married'

'3' = 'Widowed'

'4' = 'Divorced';

VALUE $EDUC '1' = 'High Sch or Less'

'2' = 'Two Yr. College'

'3' = 'Four Yr. College'

'4' = 'Graduate Degree';

VALUE LIKERT 1 = 'Str Disagree'

2 = 'Disagree'

3 = 'No Opinion'

4 = 'Agree'

5 = 'Str Agree';

RUN;

DATA QUEST;

INPUT ID $ 1-3

AGE 4-5

GENDER $ 6

RACE $ 7

MARITAL $ 8

EDUCATION $ 9

PRESIDENT 10

ARMS 11

CITIES 12;

LABEL MARITAL = "Marital Status"

EDUCATION = "Education Level"

PRESIDENT = "President Doing a Good Job"

ARMS = "Arms budget Increase"

CITIES = "Federal Aid to Cities";

FORMAT GENDER $SEXFMT.

RACE $RACE.

MARITAL $OSCAR.

EDUCATION $EDUC.

PRESIDENT ARMS CITIES LIKERT.;

DATALINES;

001091111232

002452222422

003351324442

004271111121

005682132333

006651243425

;

RUN;

6 / 87

Charts and Frequency Tables

PROC GCHART DATA=QUEST;

VBAR GENDER RACE EDUCATION;

PIE GENDER RACE EDUCATION;

RUN;

PROC FREQ DATA=QUEST;

TITLE "Frequency Counts for Categorical Variables";

TABLES GENDER RACE MARITAL EDUCATION

PRESIDENT ARMS CITIES;

RUN;

PROC FREQ DATA=QUEST;

TITLE "One-sample test for binomial proportions";

TABLES GENDER / BINOMIAL;

RUN;

DATA ELECT;

INPUT GENDER $ CANDID $ COUNT;

DATALINES;

M DEWEY 40

F DEWEY 70

M TRUMAN 40

F TRUMAN 30

;

RUN;

PROC GCHART DATA=ELECT;

VBAR GENDER CANDID / SUMVAR=COUNT;

PIE GENDER CANDID / SUMVAR=COUNT;

RUN;

PATTERN1 COLOR=RED;

PATTERN2 COLOR=BLUE;

PATTERN3 COLOR=GREEN;

PROC GCHART DATA=ELECT;

VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;

run;

PROC FREQ DATA=ELECT;

TITLE "Two-way Tables and the Chi-square Test";

TABLES GENDER CANDID;

TABLES CANDID*GENDER / CHISQ;

WEIGHT COUNT;

RUN;

7 / 87

WUQ
Callout
PROC SGPLOT DATA=QUEST; VBAR GENDER; RUN;

Bar Charts and Pie Charts

8 / 87

Bar Charts from Sgplot

9 / 87

Frequency Tables

����������������������������������������� ������������������������ ����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

��������������������������������������������������������%�����&������%�����&�

������������������'"()"!�������������������$�������������������������$������

������������������*************************************************************

�������������������������������������+�������,,-,.�������������+��������,,-,.

��������������������%��������������������������-���������������,����������-��

����������������������������������������������������������%�����&������%�����&�

�����������������!/"������������������������$�������������������������$������

�����������������****************************************************************

�����������������0 ������������������������������-��������������������������-��

�����������������/�������/%-���������������������-������������������������1�-��

�����������������2� 3���������������������������,-,.�������������,����������-��

�������������������������������������������������4����

��������������������������������������������������������%�����&������%�����&�

�������������������/!5�/6������������������$�������������������������$������

������������������*************************************************************

������������������4����������������������������-��������������������������-��

�����������������������������������������������-���������������+��������,,-,.

������������������0���7�����������������������,-,.����������������������1�-��

������������������)�&�������������������������,-,.�������������,����������-��

�����������������������������������������"���������6�&��

������������������������������������������������������������%�����&������%�����&�

��������������")8/�59(������������������������$�������������������������$������

��������������*********************************************************************

��������������2�� �4� ����6� ���������������������-��������������������������-��

���������������7��:�-�����������������������������-���������������+��������,,-,.

�������������������:�-���������������������������,-,.����������������������1�-��

��������������'��������)��������������������������,-,.�������������,����������-��

������������������������������������$�� ������)�������'����;��

����������������������������������������������������������%�����&������%�����&�

�������������������$!"45)"(������������������$�������������������������$������

����������������*****************************************************************

����������������4���)� �������������������������,-,.�����������������������,-,.

����������������)� �����������������������������,-,.������������������������-��

����������������(��93���������������������������,-,.������������������������-��

����������������/��������������������������������-���������������,����������-��

����������������������������������������� ������������������������ ����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

���������������������������������������/�% ��������5����� �

����������������������������������������������������������%�����&������%�����&�

������������������������/!�4�����������������$�������������������������$������

����������������*****************************************************************

����������������)� ������������������������������-��������������������������-��

����������������(��93����������������������������-������������������������1�-��

����������������/�������������������������������,-,.�������������,����������-��

����������������������������������������������/����������

����������������������������������������������������������%�����&������%�����&�

����������������������5�5"4�����������������$�������������������������$������

����������������*****************************************************************

����������������4���)� �������������������������,-,.�����������������������,-,.

����������������)� ������������������������������-���������������+��������,,-,.

����������������(��93���������������������������,-,.����������������������1�-��

����������������4���/���������������������������,-,.�������������,����������-��

10 / 87

Z-tests for Proportions

�����������������������������9��< �%3����� ����������%����3��3������ �����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

��������������������������������������������������������%�����&������%�����&�

������������������'"()"!�������������������$�������������������������$������

������������������*************************************************************

�������������������������������������+�������,,-,.�������������+��������,,-,.

��������������������%��������������������������-���������������,����������-��

���������������������������������������=���%����$��3������

��������������������������������������������'"()"!�>�����

���������������������������������********************************

���������������������������������$��3�����������������������-,,,.

���������������������������������/4"������������������������-����

�����������������������������������?�6�7�������6�%���������-�1��

�����������������������������������?�833�������6�%���������-����

���������������������������������"@��������6�%��

�����������������������������������?�6�7�������6�%���������-���1

�����������������������������������?�833�������6�%���������-��,.

������������������������������������� �����2���$��3�������>��-�

���������������������������������/4"�������2����������������-��+�

���������������������������������A��������������������������-1�,�

���������������������������������9��< �����$��B��A����������-��.�

����������������������������������7�< �����$��B�CAC���������-+�+�

�����������������������������������������4�%3���4�D��>�,

11 / 87

Two-Way Tables

PROC GCHART DATA=QUEST;

VBAR GENDER RACE EDUCATION;

PIE GENDER RACE EDUCATION;

RUN;

PROC FREQ DATA=QUEST;

TITLE "Frequency Counts for Categorical Variables";

TABLES GENDER RACE MARITAL EDUCATION

PRESIDENT ARMS CITIES;

RUN;

PROC FREQ DATA=QUEST;

TITLE "One-sample test for binomial proportions";

TABLES GENDER / BINOMIAL;

RUN;

DATA ELECT;

INPUT GENDER $ CANDID $ COUNT;

DATALINES;

M DEWEY 40

F DEWEY 70

M TRUMAN 40

F TRUMAN 30

;

RUN;

PROC GCHART DATA=ELECT;

VBAR GENDER CANDID / SUMVAR=COUNT;

PIE GENDER CANDID / SUMVAR=COUNT;

RUN;

PATTERN1 COLOR=RED;

PATTERN2 COLOR=BLUE;

PATTERN3 COLOR=GREEN;

PROC GCHART DATA=ELECT;

VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;

run;

PROC FREQ DATA=ELECT;

TITLE "Two-way Tables and the Chi-square Test";

TABLES GENDER CANDID;

TABLES CANDID*GENDER / CHISQ;

WEIGHT COUNT;

RUN;

12 / 87

WUQ
Callout
PROC SGPLOT DATA=ELECT; VBAR GENDER / RESPONSE=COUNT; RUN;
WUQ
Callout
PROC SGPLOT DATA=ELECT; VBAR CANDID / RESPONSE=COUNT GROUP=GENDER; RUN;

Side-by-Side Bar Charts

13 / 87

Bar Charts from Sgplot

14 / 87

Two-Way Tables and Chi-square Tests

�������������������������������7�<7������� ������ �� �< �������� ������������������������������+������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

�������������������������������������������������������%�����&������%�����&��������������������'"()"!�����������������$�������������������������$�������������������������***********************************************************����������������������������������������������-�,������������������������-�,�����������������������������������1��������++-++������������1�����������-��

�������������������������������������������������������%�����&������%�����&��������������������/()5)�����������������$�������������������������$�������������������������***********************************************************�������������������)"0":��������������������,�-������������������������,�-����������������������!8�/(����������.���������1-1�������������1�����������-��

���������������������������������������������/()5)���'"()"!

�������������������������������/()5)�����'"()"!

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E��������E��������E��������������������������������������*********F********F********F�������������������������������)"0":����E�����.��E�����+��E�����������������������������������������������E���1-1��E����-���E��,�-������������������������������������������E��,�-,+�E���,-�,�E����������������������������������������E��.�-���E����-���E�������������������������������*********F********F********F��������������������������������!8�/(���E��������E�����+��E�����.�����������������������������������������E���,-,.�E����-���E���1-1�����������������������������������������E��+�-1,�E���.-�+�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F�������������������������������������������������������1��������1����������������������������������������������-�,����++-++������-��

�������������������������������7�<7������� ������ �� �< �������� �������������������������������������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

�����������������������������4���� ��� ��������������/()5)���'"()"!

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������.-+1�������-��,�����������������������6�G��� ����!����� �<4����������������.-+��������-��,��������������������������������/�H-� �<4�����������������,-,,�,�����-���1����������������������������<2��� D��� �<4�����������������.-+��������-��,+����������������������$ ������������������������������������-��������������������������������������������������������������-���1������������������������%��I �������������������������������-����

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K��������.���������������������������������6���< �����$��L>�������������-��1���������������������������������!�� �< �����$��B>������������-��+�

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-��1.

����������������������������������������4�%3���4�D��>��1�

15 / 87

Paired Comparisons

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

16 / 87

McNemar’s Tests

����������������������������������(�%��I ��� ������$������4�%3�� ��������������������������������,������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������="�9!"���/��"!

�������������������������������="�9!"�����/��"!

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E(�����&�E$� ���&�E��������������������������������������*********F********F********F�������������������������������(�����&��E��������E��������E�����+.����������������������������������������E����-���E����-���E��+.-������������������������������������������E��,1-���E����-���E����������������������������������������E����-,��E����-+.�E�������������������������������*********F********F********F�������������������������������$� ���&��E��������E��������E�����������������������������������������������E����-���E����-���E����-������������������������������������������E���,-,��E��+�-+��E����������������������������������������E��+1-���E��,�-���E�������������������������������*********F********F********F����������������������������������������������,���������1����������������������������������������������������,�-�������1-��������-��

�����������������������������4���� ��� ��������������="�9!"���/��"!

�������������������������������������������(�%��I ��� ��������������������������������������***********************�������������������������������������4���� ����J4K�����-�����������������������������������������)�����������������������������������������������������������$��B�4������������-����

�������������������������������������4�%3���M�33���������������������������������������������********************************���������������������������������M�33�����������������������-���1���������������������������������/4"������������������������-��+,�����������������������������������?�6�7�������6�%�������<�-�.�.�����������������������������������?�833�������6�%���������-��1�

����������������������������������������4�%3���4�D��>����

17 / 87

Odds Ratio

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

18 / 87

Odds Ratio

���������������������������������$�����%�����%3�������9�� �!����������������������������������.

����������������������������������������� ���!"#�$��������

��������������������������������������������"N$948!"���98�9�"

�������������������������������"N$948!"�����98�9�"

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E/4"����E9(�!96�E��������������������������������������*********F********F********F��������������������������������<:"4����E��������E��������E�����.�����������������������������������������E���,-,.�E���,-,.�E����-������������������������������������������E��.�-+��E���1-�.�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F��������������������������������<(9�����E��������E��������E�����������������������������������������������E����-���E��+�-���E��.,-,.����������������������������������������E��+�-+1�E���,-���E����������������������������������������E��,,-,.�E��1,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-��������-��������-��

���������������������������4���� ��� ��������������"N$948!"���98�9�"

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������,-..������L-��������������������������6�G��� ����!����� �<4����������������.-��.�����L-�����������������������������������/�H-� �<4������������������-,.�1����L-��������������������������������<2��� D��� �<4�����������������,-.�+�����L-��������������������������$ ������������������������������������-��,+����������������������������������������������������������-����������������������������%��I �������������������������������-��,+

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>���������-���"<��

��������������������������������������$����������J$K�����-���"<�����������������������������������7�< �����$��L>�$��������,-�+�"<��

����������������������������������������4�%3���4�D��>����

���������������������������������$�����%�����%3�������9�� �!����������������������������������1

����������������������������������������� ���!"#�$��������

����������������������������4�%%���4���� ��� �����"N$948!"���98�9�"

��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K

�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D�����������������������������,-.�+�����L-����������������������������������!�7������4���� �)�����������������,-.�+�����L-����������������������������������'�������/ �����������������������,-.�+�����L-����

������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K

�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-������������-1�1���������-1�.���������������J9�� �!����K����6�����������������������-������������-1�1���������-1�.�

������������� ���������������������<2��� D�����������-,+����������-������������-��+,��������������J����!� GK�����6�����������������������-,+����������-������������-��+,

������������� ���������������������<2��� D�����������-������������-�+����������-.++,��������������J����!� GK�����6�����������������������-������������-�+����������-.++,

�������������������������������������������4�%3���4�D��>����

19 / 87

Stratified Tables

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

20 / 87

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

�������������������������������46""$�����!"486�4

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���.-���E����-���E��+�-������������������������������������������E���,-,.�E��1�-���E����������������������������������������E���.-�+�E��+�-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����,�����������������������������������������E����-�,�E����-,��E���.-1�����������������������������������������E����-���E����-���E����������������������������������������E��+�-1,�E��,�-���E�������������������������������*********F********F********F����������������������������������������������������������������1����������������������������������������������-�1����1.-.�������-��

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-.��������-��++����������������������6�G��� ����!����� �<4�����������������-,+�+�����-��,��������������������������������/�H-� �<4������������������-���������-�1�.����������������������������<2��� D��� �<4������������������-,11������-��+1����������������������$ ������������������������������������-��+�����������������������������������������������������������-����������������������������%��I �������������������������������-��+�

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-�1����������������������������������!�� �< �����$��B>������������-�+��

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-�,.+

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-���������-�,������������������������M������I ����<�������������������������-��+������-���1����������������������4�����I ����<��������������������������-�.�������-���.

����������������������4�%�� I�)�C!��������������������������-�.�1�����-�+�.����������������������4�%�� I�)�!C��������������������������-�.�+�����-�1��

����������������������$��� ���������������������������������-��+������-���1����������������������43���%��������������������������������-��+������-���1

����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-�+�.�����-�+1�����������������������6�%����4%%����������������������������-���������-��.+

����������������������8���������������������C!������������-��.������-��.�����������������������8���������������������!C������������-���+�����-��������������������������8���������������������4%%�����������-���������-���.

���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K

�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-�������������-�...��������+-��������������������� ����J����!� GK��������������-1������������-�.�����������-+�������������������� ����J����!� GK��������������-��,.���������-1�+����������-��,+

����������������������������������������4�%3���4�D��>��1�

21 / 87

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

�������������������������������46""$�����!"486�4

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���1-+��E���1-�.�E���,-,�����������������������������������������E����-�1�E��.,-���E����������������������������������������E���+-���E����-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����������������������������������������������E���.-�+�E���,-�+�E��,�-�1����������������������������������������E����-���E��11-1��E����������������������������������������E��+�-+��E��,,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-+�����1+-��������-��

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-���,�����-���.����������������������6�G��� ����!����� �<4����������������1-.��������-�����������������������������������/�H-� �<4�����������������1-���������-��++����������������������������<2��� D��� �<4�����������������1-�1�������-���.����������������������$ ������������������������������������-��������������������������������������������������������������-��.�������������������������%��I �������������������������������-����

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>������������-����

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-���.

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-+��1�����-���+����������������������M������I ����<�������������������������-���������-��+�����������������������4�����I ����<��������������������������-���������-���,

����������������������4�%�� I�)�C!��������������������������-���.�����-�+������������������������4�%�� I�)�!C��������������������������-���������-�.�+

����������������������$��� ���������������������������������-���������-��+�����������������������43���%��������������������������������-���������-��+�

����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-��1������-��������������������������6�%����4%%����������������������������-��.������-����

����������������������8���������������������C!������������-��1+�����-��������������������������8���������������������!C������������-��1.�����-���1����������������������8���������������������4%%�����������-���������-����

���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K

�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-+������������-�+�+��������+-��.������������������ ����J����!� GK��������������-�.,����������-�.1����������-�.�1����������������� ����J����!� GK��������������-1,�+���������-..�����������-�,��

����������������������������������������4�%3���4�D��>����

22 / 87

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

�����������������������������4�%%���4���� ��� �����46""$���!"486�4�����������������������������������������������������'"()"!

��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K

�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D������������������������������-+..������-���+������������������������������!�7������4���� �)������������������-+..������-���+������������������������������'�������/ ������������������������-+..������-���+

������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K

�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-��1���������-+�1���������-���+��������������J9�� �!����K����6�����������������������-���1��������-+�����������-��,+

������������� ���������������������<2��� D�����������-�..���������-�+.+��������-������������������J����!� GK�����6�����������������������-�1����������-���1��������-��1.

������������� ���������������������<2��� D�����������-11����������-1�1���������-��++��������������J����!� GK�����6�����������������������-1��,��������-1��+��������-��1�

���������������������������������������=�� ��7<)���� ���������������������������������������2�%������������ ��9�� �!���� ����������������������������������******************************���������������������������������� �<4��������������������-��������������������������������������)���������������������������������������������������������������$��B� �4����������������-,�1�

�������������������������������������������4�%3���4�D��>�,+�

23 / 87

T-tests and NonparametricComparisons

24 / 87

Comparing Two Groups

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

25 / 87

WUQ
Callout
PROC SGPLOT DATA=RESPONSE; VBOX TIME / CATEGORY=GROUP; RUN;

Side-by-Side Boxplots

26 / 87

Boxplots from Sgplot

27 / 87

T-tests

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

28 / 87

T-tests

������������������������������������9��< �%3����<�� ��"@�%3�������������������������������������

���������������������������������������� ����"4��$��������

�����������������������������������������������������5�"

�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

���������������������������-����������1-��.��������-,��+�����1�-�������������+-�

�����������������������������������?�6�������������4���)�&��������?�6�4���)�&

���������������������-���������1�-��.��������-�������1-��.��������-1�1�����-�+��

��������������������������������������)����������������$��B�C�C

����������������������������������������������<�-1��������-����

�������������������������������������7�< �%3����<�� ��"@�%3������������������������������������,

���������������������������������������� ����"4��$��������

�����������������������������������������������������5�"

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�������������������������������11-,���������.-���.�������-�,�������1�-����������1-����

�������������������������������������-,�������-�.�,�������-��.+�������-�������������+-�

�����������)����J�<�K����������<��-�����������-�,,,�������-��+�

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

���������������������������������11-,��������.�-�������.-,,��������.-���.������+-�.+�����-�.1�

���������������������������������������-,�������-����������+-��������-�.�,�������-�+�+����-��1.

��)����J�<�K����$����������������<��-��������<��-1�,1��<�-�.���������-�,,,�������-,�+�����-�1��

��)����J�<�K����4������ 7��������<��-��������<��-���.��<+-�,1�

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-1��������-����

�������������������4������ 7��������8������������+-,+��������<�-1��������-��+�

��������������������������������������"������������������

��������������������������� ��������(�%�)�����)���)����������������$��B��

�����������������������������������������+���������+��������-+������-���1

29 / 87

Wilcoxon Rank Sum Tests

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

30 / 87

Wilcoxon Rank Sum Tests

����������������������������(��3���%�������� ������%3������%����� � ���������������������������.

������������������������������������������������������������������������������������������������

��������������������������������������� ��($/!�0/:�$��������

��������������������������0����@���4���� �J!��G�4�% K���������������/44

������������������������������������ �����������������'!98$

�����������������������������������4�%���������"@3������������4���)�&��������������

��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����

��������������*********************************************************************

��������������/������������������������-�������������-�������+-�,�+�.����������,-,�

��������������=�����������+������������-�������������-�������+-�,�+�.�����������-��

�������������������������������/&������ ���� �7����� ���������� -

������������������������������������0����@����7�<4�%3����� �

�������������������������������4���� ����J4K�����������������-����

�������������������������������(��%���/33��@�%�����

�������������������������������A���������������������������<�-1++1

�������������������������������9��<4�����$��L��A�������������-����

��������������������������������7�<4�����$��B�CAC������������-�,��

���������������������������������/33��@�%�����

�������������������������������9��<4�����$��L��A�������������-����

��������������������������������7�<4�����$��B�CAC������������-����

�������������������������������"@������ �

�������������������������������9��<4�����$��L>��4������������-���.

��������������������������������7�<4�����$��B>�C4�<�����C����-�,��

����������������������������A�������� ����������������������������-�-

���������������������������������������M�� G��<0���� ��� �

������������������������������������ �<4���������������-1.��

������������������������������������)������������������������

������������������������������������$��B� �<4����������-�+��

31 / 87

Paired T-tests

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

32 / 87

Paired T-tests

����������������������������������)�%�� ����������$�������<�� ���������������������������������1

���������������������������������������� ����"4��$��������

������������������������������������)�������������5�"�<���5�"

�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�������������������,�����<.-����������+-�����������-,1,�����<��-���������<+-����

�����������������������������������?�6�������������4���)�&��������?�6�4���)�&

�������������������<.-��������<��-,,1.��<�-��.�������+-�����������-�.1.����-����

��������������������������������������)����������������$��B�C�C

����������������������������������������������<+-���������-��.+

33 / 87

Analysis of Variance

34 / 87

Comparing More Groups

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

35 / 87

WUQ
Callout
PROC SGPLOT DATA=READING; VBOX WORDS / CATEGORY=GROUP; RUN;

Side-by-Side Boxplots

36 / 87

Boxplots from Sgplot

37 / 87

One-way ANOVA

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

38 / 87

One-Way ANOVA

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������"�����������������������������������..�1�-�����������,+��-����

�����������������������������������+��������,��-����

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����

�������4���������������������������)���������/��&��44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

39 / 87

Multiple Comparisons

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

����������������������������G�I �4�������D���!�����J24)K��� ������09!)4

(9�"��� � ��� ��������� �� ���3��5��@3���%���7� ������������������������������ � ��� �� ����3�

������������������������������������55������������� ���!"'0#-

���������������������������/�3 �������������������������������������-��

���������������������������"�����)����� ����������%��������������������

���������������������������"����������4������������������������,+��-���

��������������������������������������������4�������D���!�������-..���

�������������������������������%�%�4�����������)��������������������-��

����������������������� �7�� �� �� �%����������������� ���������������������-

����������������������G��'���3�����������������������(����'!98$

���������������������������������/��������.1,-�������������N

���������������������������������=���������+1-�������������A

���������������������������������=

���������������������������������=����������1-�������������:

40 / 87

Kruskal-Wallis Tests

�������������������������������������� ��M�� G��<0���� ��� �������������������������������������

��������������������������������������� ��($/!�0/:�$��������

�������������������������0����@���4���� �J!��G�4�% K��������������09!)4

������������������������������������ �����������������'!98$

�����������������������������������4�%���������"@3������������4���)�&��������������

��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����

��������������*********************************************************************

��������������N����������������������,�-�����������+�-�������1-����.������������-��

��������������:������������������������-�����������+�-�������1-����.�����������+-,�

��������������A������������������������-�����������+�-�������1-����.�����������,-+�

�������������������������������/&������ ���� �7����� ���������� -

���������������������������������������M�� G��<0���� ��� �

������������������������������ �<4���������������������������-1���

������������������������������)������������������������������������

������������������������������/ %3������$��B�� �<4����������-��.+

������������������������������"@���������$��B>� �<4����������-����

41 / 87

GLM and Contrasts

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

42 / 87

GLM

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������+

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

��������������������������/��� � ����!�������)����<�$��������%3��� �� ��������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������"�����������������������������������..�1�-�����������,+��-����

�����������������������������������+��������,��-����

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����

�������4���������������������������)���������3��5�44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

43 / 87

Contrasts

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������,

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

�����������������������������������������������������������64�"/(

��������������������������������'!98$����09!)4�64�"/(������(�%���

��������������������������������N����������.1,-������������������

��������������������������������:������������1-������������������

��������������������������������A�����������+1-������������������

�������������������������������6�� ��4����� ����� ������������'!98$

�������������������������������$��B�C�C�����2���64����J�K>64����JHK

������������������������������������)�3�����������������09!)4

���������������������������OH�������������������������������������������

�����������������������������������������������������-�������������-���+

���������������������������������������-���������������������������-1�.�

���������������������������������������-���+���������-1�.�

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������.

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

������������ ���������������������)����������� ��44����������4��������������������$��B��

�������N��4-�:�/()�A��������������������������,�-�������������,�-������������-������L-����

��������"�29)�:��4-�A���������������������������-���������������-������������-�������-�,+�

44 / 87

Contrasts vs. a Control

�����������������������/��� � ����!�������)����<��%3��� �� �� -��������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

���������������������������/�H� �%�������������3����%3��� �� ��)������

��������������������������������������������������������2��64����>

����������������������������������������������������������������

�������������������������������'!98$����09!)4�64�"/(������$��B�C�C

�������������������������������N����������.1,-������

�������������������������������:������������1-���������������-���+

�������������������������������A�����������+1-���������������-����

45 / 87

Two-way ANOVA

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

46 / 87

GLM

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

����������������������������������'"()"!���������������������

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����

�������"����������������������������+�������.+��-�����������1,++-����

�����������������������������������������,1�,��-�,,.

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���

�������4���������������������������)���������3��5�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

47 / 87

LSmeans

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

�����������������������������������������������������������64�"/(

��������������������������������'!98$����09!)4�64�"/(������(�%���

��������������������������������N����������1�1-1�����������������

��������������������������������:�����������+�-������������������

��������������������������������A����������,��-������������������

�������������������������������6�� ��4����� ����� ������������'!98$

�������������������������������$��B�C�C�����2���64����J�K>64����JHK

������������������������������������)�3�����������������09!)4

���������������������������OH�������������������������������������������

����������������������������������������������������L-������������L-����

��������������������������������������L-���������������������������-��1,

��������������������������������������L-�������������-��1,

�������������������������������������/��� � ����!�������)�������������������������������������+

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

��������������������������������������������������������2��64�����>

����������������������������������������������������������64�����

������������������������������'"()"!����09!)4�64�"/(�������$��B�C�C

������������������������������������������,.�-����������������-�1��

������������������������������������������,+�-������

48 / 87

The “Slice” Option

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

���������������������������������'!98$����'"()"!����09!)4�64�"/(

���������������������������������N��������������������1.�-,�����

���������������������������������N��������������������.1,-������

���������������������������������:���������������������,�-������

���������������������������������:����������������������1-������

���������������������������������A�����������������������-������

���������������������������������A��������������������,��-������

�������������������������������������/��� � ����!�������)�������������������������������������,

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

�������������������������'!98$P'"()"!�"������4��������'"()"!�����09!)4

����������������������������������������4�%���

��������������'"()"!��������)����������4����� ����������4��������������������$��B��

�������������������������������������������+�������������+�����������,-1�����L-����

�����������������������������������������1�1���������������++.��������-+,�����-����

49 / 87

Interaction Plot

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

50 / 87

WUQ
Callout
PROC SGPLOT DATA=MEANS; SERIES X=GROUP Y=M_WORDS / GROUP=GENDER; RUN;

Interaction Plot

51 / 87

Interaction Plot from Sgplot

52 / 87

Contrasts

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

53 / 87

Contrasts

���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������.

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

����������������������������������'"()"!���������������������

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������1

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����

�������"����������������������������+�������.+��-�����������1,++-����

�����������������������������������������,1�,��-�,,.

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

������������ ���������������������)����������� ��44����������4��������������������$��B��

�������N��4-�:��"�/6"�9(6:������������������1�1+-�����������1�1+-�����������.-�+����L-����

�������N��4-�:��/6"�9(6:�������������������.��,�-����������.��,�-������������-..�����-����

54 / 87

ANCOVA Data

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

55 / 87

ANCOVA Data

�����������������������������������������&�������"@�%3�����������������������������������������

����������������������������������������� ��9!!�$��������

�������������������������������������������� ������/�2�����5#

�����������������������������$��� ������������������������ ��(�>���

������������������������������������$����B�C�C�������2���! �>�

������������������������������������������������/�2������������5#

����������������������������������/�2��������-�������������-��+�,

������������������������������������������������������������-����

���������������������������������5#����������-��+�,��������-�����

����������������������������������������������-����

�����������������������������������������&�������"@�%3���������������������������������������+�

���������������������������������������� ����"4��$��������

�����������������������������������������������������5#

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�����������/�������������������������-��������-��.��������-+,1�����������-����������1-�

�����������=�����������������������+�-,�������-+1���������-�1�����������,-���������,�-�

�����������)����J�<�K����������<��-,����������-����������.-1�+�

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

��/������������������������������������-�����������-1������,-��������-��.�������.-���,����-����

��=����������������������������������+�-,����������-�������,-��������-+1��������.-+.1+����-1,..

��)����J�<�K����$����������������<��-,�������<�.-,�����<�-�1�.�������-����������1-�+�+����-,,�.

��)����J�<�K����4������ 7��������<��-,�������<�.-,��.��<�-�.��

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-���������-��,�

�������������������4������ 7��������8������������.-��,,������<�-���������-��,�

��������������������������������������"������������������

��������������������������� ��������(�%�)�����)���)����������������$��B��

�����������������������������������������+���������+��������-�+�����-�,��

�����������������������������������������������������/�2

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�����������/�������������������������-��������-�1��������,-,+�1��������,�-��������+��-�

�����������=����������������������+�1-�����������-������+�-��������������-��������,��-�

�����������)����J�<�K������������<���-������1�-�111�������-����

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

��/������������������������������������-���������,�-�����+��-��������-�1���������-,�.������.�-�

��=���������������������������������+�1-�����������-������1�-1����������-������,�-,.�1�������-�

��)����J�<�K����$������������������<���-�������<�++-���<�-1��������1�-�111������,-�����������-�

��)����J�<�K����4������ 7����������<���-�������<�+�-�����-�+��

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-�+�������-�+.+

�������������������4������ 7��������8������������,-+.�,������<�-�+�������-��+.

56 / 87

ANCOVA

PROC GPLOT DATA=COVAR;

PLOT MATH*IQ=GROUP;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

57 / 87

WUQ
Callout
PROC SGPLOT DATA=COVAR; SCATTER X=IQ Y=MATH / GROUP=GROUP; RUN;

Scatter Plots

58 / 87

Scatter Plots from Sgplot

59 / 87

ANCOVA

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������/�=

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

)�3������������������/�2

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������1�+��-�+���������.1�1-�1����������.-�������-����

�������"����������������������������,���������.-����.����������-��1�+

����������������������������������������������-�����

������������������������!<4������������������������!�����4"������/�2�����

�������������������������-1�,1,���������-�1,11��������-��++1��������,-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������5#���������������������������������+��.1-��+�������+��.1-��+����������-1������-����

�������'!98$��������������������������������,�+-+��+��������,�+-+��+���������-�.�����-�1�+

�������5#P'!98$�����������������������������1�,-�,�.��������1�,-�,�.���������-�������-�.�+

60 / 87

ANCOVA

�����������������������������������������&�������"@�%3���������������������������������������++

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������/�=

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

)�3������������������/�2

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������.�,�1-�1,���������1��-�������������-.1�����-����

�������"����������������������������.�������+�+-���.����������,-����+

����������������������������������������������-�����

������������������������!<4������������������������!�����4"������/�2�����

�������������������������-1��1+���������-�+��1������+�-..�����������,-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������5#���������������������������������+�1��-,1,�������+�1��-,1,����������-1������-����

�������'!98$����������������������������������,-��.�����������,-��.����������-�������-1�11

61 / 87

Correlation and SimpleRegression

62 / 87

Correlations

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

DATA CORR_EG;

INPUT GENDER $ HEIGHT WEIGHT AGE;

DATALINES;

M 68 155 23

F 61 99 20

F 63 115 21

M 70 205 45

M 69 170 .

F 65 125 30

M 72 220 48

;

RUN;

GOPTIONS RESET=ALL;

PROC GPLOT DATA=CORR_EG;

PLOT (HEIGHT WEIGHT)*AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

TITLE "Example of a Correlation Matrix";

VAR HEIGHT WEIGHT AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

VAR AGE;

WITH HEIGHT WEIGHT;

RUN;

PROC CORR DATA=CORR_EG NOSIMPLE;

TITLE "Example of Partial Correlation";

VAR HEIGHT WEIGHT;

PARTIAL AGE;

RUN;

63 / 87

WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=AGE Y=HEIGHT; RUN; PROC SGPLOT DATA=CORR_EG; SCATTER X=AGE Y=WEIGHT; RUN;

Scatter Plots

64 / 87

Scatter Plots from Sgplot

65 / 87

Correlation Matrices

���������������������������������"@�%3������������������������@������������������������������+.

����������������������������������������� ��9!!�$��������

��������������������������������������� �����2"5'2����0"5'2����/'"

����������������������������������������4�%3���4���� ���

�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%

����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����

����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����

����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����

��������������������������������$��� ������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

���������������������������������������2"5'2���������0"5'2������������/'"

�������������������������2"5'2���������-�������������-�.�,���������-1,,�+

������������������������������������������������������-�������������-���.

��������������������������������������������.�������������.�������������,

�������������������������0"5'2���������-�.�,���������-�������������-��+�,

����������������������������������������-���������������������������-��1�

��������������������������������������������.�������������.�������������,

�������������������������/'"�����������-1,,�+��������-��+�,��������-�����

����������������������������������������-���.���������-��1�

��������������������������������������������,�������������,�������������,

��������������������������������43���%������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

���������������������������������������2"5'2���������0"5'2������������/'"

�������������������������2"5'2���������-�������������-�������������-�+�1,

�����������������������������������������������������L-�������������-��+1

��������������������������������������������.�������������.�������������,

�������������������������0"5'2���������-�������������-�������������-�+�1,

���������������������������������������L-���������������������������-��+1

��������������������������������������������.�������������.�������������,

�������������������������/'"�����������-�+�1,��������-�+�1,��������-�����

����������������������������������������-��+1���������-��+1

��������������������������������������������,�������������,�������������,

66 / 87

Partial Correlations

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

DATA CORR_EG;

INPUT GENDER $ HEIGHT WEIGHT AGE;

DATALINES;

M 68 155 23

F 61 99 20

F 63 115 21

M 70 205 45

M 69 170 .

F 65 125 30

M 72 220 48

;

RUN;

GOPTIONS RESET=ALL;

PROC GPLOT DATA=CORR_EG;

PLOT (HEIGHT WEIGHT)*AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

TITLE "Example of a Correlation Matrix";

VAR HEIGHT WEIGHT AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

VAR AGE;

WITH HEIGHT WEIGHT;

RUN;

PROC CORR DATA=CORR_EG NOSIMPLE;

TITLE "Example of Partial Correlation";

VAR HEIGHT WEIGHT;

PARTIAL AGE;

RUN;

67 / 87

Partial Correlations

���������������������������������"@�%3������������������������@������������������������������+1

����������������������������������������� ��9!!�$��������

���������������������������������0�� ��������� �����2"5'2����0"5'2�

���������������������������������������������� �����/'"

����������������������������������������4�%3���4���� ���

�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%

����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����

����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����

����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����

���������������������������������$��� ������������������������

������������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

��������������������������������������������������������/'"

���������������������������������������2"5'2���������-1,,�+

������������������������������������������������������-���.

����������������������������������������������������������,

���������������������������������������0"5'2���������-��+�,

������������������������������������������������������-��1�

����������������������������������������������������������,

��������������������������������43���%������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

��������������������������������������������������������/'"

���������������������������������������2"5'2���������-�+�1,

������������������������������������������������������-��+1

����������������������������������������������������������,

���������������������������������������0"5'2���������-�+�1,

������������������������������������������������������-��+1

����������������������������������������������������������,

����������������������������������"@�%3������$�����������������������������������������������+�

����������������������������������������� ��9!!�$��������

�������������������������������$��������������� �����/'"

����������������������������������������������� �����2"5'2����0"5'2�

�������������������������$��� ���$���������������������������� ��(�>�,

��������������������������������$����B�C�C�������2���$�������! �>�

����������������������������������������������2"5'2���������0"5'2�

��������������������������������2"5'2���������-�������������-����+

�������������������������������������������������������������-��.�

��������������������������������0"5'2���������-����+��������-�����

�����������������������������������������������-��.�

68 / 87

Regressions

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

69 / 87

WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=HEIGHT Y=WEIGHT; REG X=HEIGHT Y=WEIGHT / CLM CLI; RUN;
WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=HEIGHT Y=WEIGHT; REG X=HEIGHT Y=WEIGHT; RUN;

Scatter Plot and Regression Line

70 / 87

Regression Plots from Sgplot

71 / 87

Linear Regression

������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�����������������������������������)�3�����������������0"5'2�

�����������������������������(�%�������9� ��&����� �!��������������.

�����������������������������(�%�������9� ��&����� �8 �������������.

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

�������������������������������������������������11�������������11�������1+-+������-����

����������"��������������������������������.��-�1.���������+�-,..+�

�����������������������������������,�������������1+

�����������������������!�����4"���������������-1,�.�����!<4�����������-�++�

�����������������������)�3��������������������-�.�+�����/�H�!<4�������-����

��������������������������������������������.-,����

���������������������������������������$���%�����" ��%���

������������������������������������$���%�����������4�������

����������������������������)��������" ��%�������������"�������������������$��B�C�C

���������������5������3������������<���-,++�1�������1�-�+��.������<.-�.�������-���1

���������������2"5'2�������������������-����.���������-��.1���������-���������-����

72 / 87

Residual Plot

73 / 87

Confidence Region

74 / 87

Confidence Bands from Sgplot

75 / 87

Adding a Quadratic Term

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

76 / 87

Quadratic Regression

������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�����������������������������������)�3�����������������0"5'2�

�����������������������������(�%�������9� ��&����� �!��������������.

�����������������������������(�%�������9� ��&����� �8 �������������.

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

��������������������������������������������������,������,���-+�,��������.�-�.�����-���.

����������"�������������������������+���������-1��+,�������1�-.����

�����������������������������������,�������������1+

�����������������������!�����4"��������������1-�1�������!<4�����������-�.+�

�����������������������)�3��������������������-�.�+�����/�H�!<4�������-�,��

���������������������������������������������-..++�

���������������������������������������$���%�����" ��%���

������������������������������������$���%�����������4�������

����������������������������)��������" ��%�������������"�������������������$��B�C�C

���������������5������3����������������-������������+�-�������������-.��������-����

���������������2"5'2����������������<.,-1++,1�������+�-�+��+������<�-���������-����

���������������2"5'2�������������������-,,������������-�������������-�.�������-���,

77 / 87

Residual Plot

78 / 87

Data Transformation

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

79 / 87

WUQ
Callout
PROC SGPLOT DATA=HEART; SCATTER X=DOSE Y=HR; PBSPLINE X=DOSE Y=HR; RUN;

Scatter Plot

80 / 87

Smooth fitting from Sgplot

81 / 87

Regression on Transformed Data

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

82 / 87

WUQ
Callout
PROC SGPLOT DATA=HEART; SCATTER X=LDOSE Y=HR; REG X=LDOSE Y=HR; RUN;

Plot of Transformed Data

83 / 87

Regression fitting from Sgplot

84 / 87

Regression on Transformed Data

������������������������������5�&� ���������� ��)� �O2!�!������� �3������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�������������������������������������)�3�����������������2!

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

��������������������������������������������,,-+�����������,,-+���������+��-������L-����

����������"�������������������������1���������-��������������-,+�.�

�������������������������������������������.�-,����

�����������������������!�����4"���������������-1���+����!<4�����������-�1��

�����������������������)�3������������������,,-���������/�H�!<4�������-�.1.

���������������������������������������������-�����

���������������������������������������$���%�����" ��%���

�������������������������������������������$���%�����������4�������

��������������������6��������������)��������" ��%�������������"�������������������$��B�C�C

�������5������3�����5������3������������������-��������������-�������������-1�������L-����

�������6)94"��������6������)� ����������������-�,�1+���������-��11���������-�+������L-����

85 / 87

Residual Plot

86 / 87

Reference Text

87 / 87

top related