statistical inference using sas - east carolina university

87
Statistical Inference Using SAS SAS Code Workshop Series Qiang Wu Department of Biostatistics, East Carolina University February 10, 2012 1 / 87

Upload: others

Post on 09-Feb-2022

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Statistical Inference Using SAS - East Carolina University

Statistical Inference Using SASSAS Code Workshop Series

Qiang Wu

Department of Biostatistics, East Carolina University

February 10, 2012

1 / 87

Page 2: Statistical Inference Using SAS - East Carolina University

Analyzing Categorical Data

2 / 87

Page 3: Statistical Inference Using SAS - East Carolina University

Survey Data

3 / 87

Page 4: Statistical Inference Using SAS - East Carolina University

Variable Description

Col. Description Var. Name Type1-3 Subject ID ID4-5 Age in years AGE Quantitative

6 Gender GENDER Categorical7 Race RACE Categorical8 Marital status MARITAL Categorical9 Education level EDUCATION Categorical

10 President doing good job PRESIDENT Likert Scale11 Arms budget increased ARMS Likert Scale12 Federal aid to cities CITIES Likert Scale

4 / 87

Page 5: Statistical Inference Using SAS - East Carolina University

Data Format

PROC FORMAT;

VALUE $SEXFMT '1' = 'Male'

'2' = 'Female'

OTHER = 'Miscoded';

VALUE $RACE '1' = 'White'

'2' = 'African Am.'

'3' = 'Hispanic'

'4' = 'Other';

VALUE $OSCAR '1' = 'Single'

'2' = 'Married'

'3' = 'Widowed'

'4' = 'Divorced';

VALUE $EDUC '1' = 'High Sch or Less'

'2' = 'Two Yr. College'

'3' = 'Four Yr. College'

'4' = 'Graduate Degree';

VALUE LIKERT 1 = 'Str Disagree'

2 = 'Disagree'

3 = 'No Opinion'

4 = 'Agree'

5 = 'Str Agree';

RUN;

DATA QUEST;

INPUT ID $ 1-3

AGE 4-5

GENDER $ 6

RACE $ 7

MARITAL $ 8

EDUCATION $ 9

PRESIDENT 10

ARMS 11

CITIES 12;

LABEL MARITAL = "Marital Status"

EDUCATION = "Education Level"

PRESIDENT = "President Doing a Good Job"

ARMS = "Arms budget Increase"

CITIES = "Federal Aid to Cities";

FORMAT GENDER $SEXFMT.

RACE $RACE.

MARITAL $OSCAR.

EDUCATION $EDUC.

PRESIDENT ARMS CITIES LIKERT.;

DATALINES;

001091111232

002452222422

003351324442

004271111121

005682132333

006651243425

;

RUN;

5 / 87

Page 6: Statistical Inference Using SAS - East Carolina University

Data Input

PROC FORMAT;

VALUE $SEXFMT '1' = 'Male'

'2' = 'Female'

OTHER = 'Miscoded';

VALUE $RACE '1' = 'White'

'2' = 'African Am.'

'3' = 'Hispanic'

'4' = 'Other';

VALUE $OSCAR '1' = 'Single'

'2' = 'Married'

'3' = 'Widowed'

'4' = 'Divorced';

VALUE $EDUC '1' = 'High Sch or Less'

'2' = 'Two Yr. College'

'3' = 'Four Yr. College'

'4' = 'Graduate Degree';

VALUE LIKERT 1 = 'Str Disagree'

2 = 'Disagree'

3 = 'No Opinion'

4 = 'Agree'

5 = 'Str Agree';

RUN;

DATA QUEST;

INPUT ID $ 1-3

AGE 4-5

GENDER $ 6

RACE $ 7

MARITAL $ 8

EDUCATION $ 9

PRESIDENT 10

ARMS 11

CITIES 12;

LABEL MARITAL = "Marital Status"

EDUCATION = "Education Level"

PRESIDENT = "President Doing a Good Job"

ARMS = "Arms budget Increase"

CITIES = "Federal Aid to Cities";

FORMAT GENDER $SEXFMT.

RACE $RACE.

MARITAL $OSCAR.

EDUCATION $EDUC.

PRESIDENT ARMS CITIES LIKERT.;

DATALINES;

001091111232

002452222422

003351324442

004271111121

005682132333

006651243425

;

RUN;

6 / 87

Page 7: Statistical Inference Using SAS - East Carolina University

Charts and Frequency Tables

PROC GCHART DATA=QUEST;

VBAR GENDER RACE EDUCATION;

PIE GENDER RACE EDUCATION;

RUN;

PROC FREQ DATA=QUEST;

TITLE "Frequency Counts for Categorical Variables";

TABLES GENDER RACE MARITAL EDUCATION

PRESIDENT ARMS CITIES;

RUN;

PROC FREQ DATA=QUEST;

TITLE "One-sample test for binomial proportions";

TABLES GENDER / BINOMIAL;

RUN;

DATA ELECT;

INPUT GENDER $ CANDID $ COUNT;

DATALINES;

M DEWEY 40

F DEWEY 70

M TRUMAN 40

F TRUMAN 30

;

RUN;

PROC GCHART DATA=ELECT;

VBAR GENDER CANDID / SUMVAR=COUNT;

PIE GENDER CANDID / SUMVAR=COUNT;

RUN;

PATTERN1 COLOR=RED;

PATTERN2 COLOR=BLUE;

PATTERN3 COLOR=GREEN;

PROC GCHART DATA=ELECT;

VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;

run;

PROC FREQ DATA=ELECT;

TITLE "Two-way Tables and the Chi-square Test";

TABLES GENDER CANDID;

TABLES CANDID*GENDER / CHISQ;

WEIGHT COUNT;

RUN;

7 / 87

WUQ
Callout
PROC SGPLOT DATA=QUEST; VBAR GENDER; RUN;
Page 8: Statistical Inference Using SAS - East Carolina University

Bar Charts and Pie Charts

8 / 87

Page 9: Statistical Inference Using SAS - East Carolina University

Bar Charts from Sgplot

9 / 87

Page 10: Statistical Inference Using SAS - East Carolina University

Frequency Tables

����������������������������������������� ������������������������ ����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

��������������������������������������������������������%�����&������%�����&�

������������������'"()"!�������������������$�������������������������$������

������������������*************************************************************

�������������������������������������+�������,,-,.�������������+��������,,-,.

��������������������%��������������������������-���������������,����������-��

����������������������������������������������������������%�����&������%�����&�

�����������������!/"������������������������$�������������������������$������

�����������������****************************************************************

�����������������0 ������������������������������-��������������������������-��

�����������������/�������/%-���������������������-������������������������1�-��

�����������������2� 3���������������������������,-,.�������������,����������-��

�������������������������������������������������4����

��������������������������������������������������������%�����&������%�����&�

�������������������/!5�/6������������������$�������������������������$������

������������������*************************************************************

������������������4����������������������������-��������������������������-��

�����������������������������������������������-���������������+��������,,-,.

������������������0���7�����������������������,-,.����������������������1�-��

������������������)�&�������������������������,-,.�������������,����������-��

�����������������������������������������"���������6�&��

������������������������������������������������������������%�����&������%�����&�

��������������")8/�59(������������������������$�������������������������$������

��������������*********************************************************************

��������������2�� �4� ����6� ���������������������-��������������������������-��

���������������7��:�-�����������������������������-���������������+��������,,-,.

�������������������:�-���������������������������,-,.����������������������1�-��

��������������'��������)��������������������������,-,.�������������,����������-��

������������������������������������$�� ������)�������'����;��

����������������������������������������������������������%�����&������%�����&�

�������������������$!"45)"(������������������$�������������������������$������

����������������*****************************************************************

����������������4���)� �������������������������,-,.�����������������������,-,.

����������������)� �����������������������������,-,.������������������������-��

����������������(��93���������������������������,-,.������������������������-��

����������������/��������������������������������-���������������,����������-��

����������������������������������������� ������������������������ ����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

���������������������������������������/�% ��������5����� �

����������������������������������������������������������%�����&������%�����&�

������������������������/!�4�����������������$�������������������������$������

����������������*****************************************************************

����������������)� ������������������������������-��������������������������-��

����������������(��93����������������������������-������������������������1�-��

����������������/�������������������������������,-,.�������������,����������-��

����������������������������������������������/����������

����������������������������������������������������������%�����&������%�����&�

����������������������5�5"4�����������������$�������������������������$������

����������������*****************************************************************

����������������4���)� �������������������������,-,.�����������������������,-,.

����������������)� ������������������������������-���������������+��������,,-,.

����������������(��93���������������������������,-,.����������������������1�-��

����������������4���/���������������������������,-,.�������������,����������-��

10 / 87

Page 11: Statistical Inference Using SAS - East Carolina University

Z-tests for Proportions

�����������������������������9��< �%3����� ����������%����3��3������ �����������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

��������������������������������������������������������%�����&������%�����&�

������������������'"()"!�������������������$�������������������������$������

������������������*************************************************************

�������������������������������������+�������,,-,.�������������+��������,,-,.

��������������������%��������������������������-���������������,����������-��

���������������������������������������=���%����$��3������

��������������������������������������������'"()"!�>�����

���������������������������������********************************

���������������������������������$��3�����������������������-,,,.

���������������������������������/4"������������������������-����

�����������������������������������?�6�7�������6�%���������-�1��

�����������������������������������?�833�������6�%���������-����

���������������������������������"@��������6�%��

�����������������������������������?�6�7�������6�%���������-���1

�����������������������������������?�833�������6�%���������-��,.

������������������������������������� �����2���$��3�������>��-�

���������������������������������/4"�������2����������������-��+�

���������������������������������A��������������������������-1�,�

���������������������������������9��< �����$��B��A����������-��.�

����������������������������������7�< �����$��B�CAC���������-+�+�

�����������������������������������������4�%3���4�D��>�,

11 / 87

Page 12: Statistical Inference Using SAS - East Carolina University

Two-Way Tables

PROC GCHART DATA=QUEST;

VBAR GENDER RACE EDUCATION;

PIE GENDER RACE EDUCATION;

RUN;

PROC FREQ DATA=QUEST;

TITLE "Frequency Counts for Categorical Variables";

TABLES GENDER RACE MARITAL EDUCATION

PRESIDENT ARMS CITIES;

RUN;

PROC FREQ DATA=QUEST;

TITLE "One-sample test for binomial proportions";

TABLES GENDER / BINOMIAL;

RUN;

DATA ELECT;

INPUT GENDER $ CANDID $ COUNT;

DATALINES;

M DEWEY 40

F DEWEY 70

M TRUMAN 40

F TRUMAN 30

;

RUN;

PROC GCHART DATA=ELECT;

VBAR GENDER CANDID / SUMVAR=COUNT;

PIE GENDER CANDID / SUMVAR=COUNT;

RUN;

PATTERN1 COLOR=RED;

PATTERN2 COLOR=BLUE;

PATTERN3 COLOR=GREEN;

PROC GCHART DATA=ELECT;

VBAR CANDID / SUMVAR=COUNT GROUP=GENDER PATTERNID=MIDPOINT;

run;

PROC FREQ DATA=ELECT;

TITLE "Two-way Tables and the Chi-square Test";

TABLES GENDER CANDID;

TABLES CANDID*GENDER / CHISQ;

WEIGHT COUNT;

RUN;

12 / 87

WUQ
Callout
PROC SGPLOT DATA=ELECT; VBAR GENDER / RESPONSE=COUNT; RUN;
WUQ
Callout
PROC SGPLOT DATA=ELECT; VBAR CANDID / RESPONSE=COUNT GROUP=GENDER; RUN;
Page 13: Statistical Inference Using SAS - East Carolina University

Side-by-Side Bar Charts

13 / 87

Page 14: Statistical Inference Using SAS - East Carolina University

Bar Charts from Sgplot

14 / 87

Page 15: Statistical Inference Using SAS - East Carolina University

Two-Way Tables and Chi-square Tests

�������������������������������7�<7������� ������ �� �< �������� ������������������������������+������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

�������������������������������������������������������%�����&������%�����&��������������������'"()"!�����������������$�������������������������$�������������������������***********************************************************����������������������������������������������-�,������������������������-�,�����������������������������������1��������++-++������������1�����������-��

�������������������������������������������������������%�����&������%�����&��������������������/()5)�����������������$�������������������������$�������������������������***********************************************************�������������������)"0":��������������������,�-������������������������,�-����������������������!8�/(����������.���������1-1�������������1�����������-��

���������������������������������������������/()5)���'"()"!

�������������������������������/()5)�����'"()"!

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E��������E��������E��������������������������������������*********F********F********F�������������������������������)"0":����E�����.��E�����+��E�����������������������������������������������E���1-1��E����-���E��,�-������������������������������������������E��,�-,+�E���,-�,�E����������������������������������������E��.�-���E����-���E�������������������������������*********F********F********F��������������������������������!8�/(���E��������E�����+��E�����.�����������������������������������������E���,-,.�E����-���E���1-1�����������������������������������������E��+�-1,�E���.-�+�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F�������������������������������������������������������1��������1����������������������������������������������-�,����++-++������-��

�������������������������������7�<7������� ������ �� �< �������� �������������������������������������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

�����������������������������4���� ��� ��������������/()5)���'"()"!

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������.-+1�������-��,�����������������������6�G��� ����!����� �<4����������������.-+��������-��,��������������������������������/�H-� �<4�����������������,-,,�,�����-���1����������������������������<2��� D��� �<4�����������������.-+��������-��,+����������������������$ ������������������������������������-��������������������������������������������������������������-���1������������������������%��I �������������������������������-����

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K��������.���������������������������������6���< �����$��L>�������������-��1���������������������������������!�� �< �����$��B>������������-��+�

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-��1.

����������������������������������������4�%3���4�D��>��1�

15 / 87

Page 16: Statistical Inference Using SAS - East Carolina University

Paired Comparisons

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

16 / 87

Page 17: Statistical Inference Using SAS - East Carolina University

McNemar’s Tests

����������������������������������(�%��I ��� ������$������4�%3�� ��������������������������������,������������������������������������������������������������������������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������="�9!"���/��"!

�������������������������������="�9!"�����/��"!

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E(�����&�E$� ���&�E��������������������������������������*********F********F********F�������������������������������(�����&��E��������E��������E�����+.����������������������������������������E����-���E����-���E��+.-������������������������������������������E��,1-���E����-���E����������������������������������������E����-,��E����-+.�E�������������������������������*********F********F********F�������������������������������$� ���&��E��������E��������E�����������������������������������������������E����-���E����-���E����-������������������������������������������E���,-,��E��+�-+��E����������������������������������������E��+1-���E��,�-���E�������������������������������*********F********F********F����������������������������������������������,���������1����������������������������������������������������,�-�������1-��������-��

�����������������������������4���� ��� ��������������="�9!"���/��"!

�������������������������������������������(�%��I ��� ��������������������������������������***********************�������������������������������������4���� ����J4K�����-�����������������������������������������)�����������������������������������������������������������$��B�4������������-����

�������������������������������������4�%3���M�33���������������������������������������������********************************���������������������������������M�33�����������������������-���1���������������������������������/4"������������������������-��+,�����������������������������������?�6�7�������6�%�������<�-�.�.�����������������������������������?�833�������6�%���������-��1�

����������������������������������������4�%3���4�D��>����

17 / 87

Page 18: Statistical Inference Using SAS - East Carolina University

Odds Ratio

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

18 / 87

Page 19: Statistical Inference Using SAS - East Carolina University

Odds Ratio

���������������������������������$�����%�����%3�������9�� �!����������������������������������.

����������������������������������������� ���!"#�$��������

��������������������������������������������"N$948!"���98�9�"

�������������������������������"N$948!"�����98�9�"

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E/4"����E9(�!96�E��������������������������������������*********F********F********F��������������������������������<:"4����E��������E��������E�����.�����������������������������������������E���,-,.�E���,-,.�E����-������������������������������������������E��.�-+��E���1-�.�E����������������������������������������E����-���E����-���E�������������������������������*********F********F********F��������������������������������<(9�����E��������E��������E�����������������������������������������������E����-���E��+�-���E��.,-,.����������������������������������������E��+�-+1�E���,-���E����������������������������������������E��,,-,.�E��1,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-��������-��������-��

���������������������������4���� ��� ��������������"N$948!"���98�9�"

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4���������������������������������,-..������L-��������������������������6�G��� ����!����� �<4����������������.-��.�����L-�����������������������������������/�H-� �<4������������������-,.�1����L-��������������������������������<2��� D��� �<4�����������������,-.�+�����L-��������������������������$ ������������������������������������-��,+����������������������������������������������������������-����������������������������%��I �������������������������������-��,+

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>���������-���"<��

��������������������������������������$����������J$K�����-���"<�����������������������������������7�< �����$��L>�$��������,-�+�"<��

����������������������������������������4�%3���4�D��>����

���������������������������������$�����%�����%3�������9�� �!����������������������������������1

����������������������������������������� ���!"#�$��������

����������������������������4�%%���4���� ��� �����"N$948!"���98�9�"

��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K

�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D�����������������������������,-.�+�����L-����������������������������������!�7������4���� �)�����������������,-.�+�����L-����������������������������������'�������/ �����������������������,-.�+�����L-����

������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K

�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-������������-1�1���������-1�.���������������J9�� �!����K����6�����������������������-������������-1�1���������-1�.�

������������� ���������������������<2��� D�����������-,+����������-������������-��+,��������������J����!� GK�����6�����������������������-,+����������-������������-��+,

������������� ���������������������<2��� D�����������-������������-�+����������-.++,��������������J����!� GK�����6�����������������������-������������-�+����������-.++,

�������������������������������������������4�%3���4�D��>����

19 / 87

Page 20: Statistical Inference Using SAS - East Carolina University

Stratified Tables

PROC FORMAT;

VALUE $OPINION 'P' = 'Positive'

'N' = 'Negative';

RUN;

DATA MCNEMAR;

LENGTH BEFORE AFTER $ 1;

INPUT BEFORE $ AFTER $ COUNT;

FORMAT BEFORE AFTER $OPINION.;

DATALINES;

P P 23

P N 30

N P 15

N N 32

;

RUN;

PROC FREQ DATA=MCNEMAR;

TITLE "McNemar's Test for Paired Samples";

TABLES BEFORE*AFTER / AGREE;

WEIGHT COUNT;

RUN;

DATA ODDS;

INPUT OUTCOME $ EXPOSURE $ COUNT;

DATALINES;

CASE 1-YES 50

CASE 2-NO 100

CONTROL 1-YES 20

CONTROL 2-NO 130

;

RUN;

PROC FREQ DATA=ODDS;

TITLE "Program to Compute an Odds Ratio";

TABLES EXPOSURE*OUTCOME / CHISQ CMH;

WEIGHT COUNT;

RUN;

DATA ABILITY;

INPUT GENDER $ RESULTS $ SLEEP $ COUNT;

DATALINES;

BOYS FAIL 1-LOW 20

BOYS FAIL 2-HIGH 15

BOYS PASS 1-LOW 100

BOYS PASS 2-HIGH 150

GIRLS FAIL 1-LOW 30

GIRLS FAIL 2-HIGH 25

GIRLS PASS 1-LOW 100

GIRLS PASS 2-HIGH 200

;

RUN;

PROC FREQ DATA=ABILITY;

TITLE "Mantel-Haenszel Chi-square Test";

TABLES GENDER*SLEEP*RESULTS / ALL;

WEIGHT COUNT;

RUN;

20 / 87

Page 21: Statistical Inference Using SAS - East Carolina University

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

�������������������������������46""$�����!"486�4

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���.-���E����-���E��+�-������������������������������������������E���,-,.�E��1�-���E����������������������������������������E���.-�+�E��+�-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����,�����������������������������������������E����-�,�E����-,��E���.-1�����������������������������������������E����-���E����-���E����������������������������������������E��+�-1,�E��,�-���E�������������������������������*********F********F********F����������������������������������������������������������������1����������������������������������������������-�1����1.-.�������-��

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-.��������-��++����������������������6�G��� ����!����� �<4�����������������-,+�+�����-��,��������������������������������/�H-� �<4������������������-���������-�1�.����������������������������<2��� D��� �<4������������������-,11������-��+1����������������������$ ������������������������������������-��+�����������������������������������������������������������-����������������������������%��I �������������������������������-��+�

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-�1����������������������������������!�� �< �����$��B>������������-�+��

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-�,.+

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>=9:4

����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-���������-�,������������������������M������I ����<�������������������������-��+������-���1����������������������4�����I ����<��������������������������-�.�������-���.

����������������������4�%�� I�)�C!��������������������������-�.�1�����-�+�.����������������������4�%�� I�)�!C��������������������������-�.�+�����-�1��

����������������������$��� ���������������������������������-��+������-���1����������������������43���%��������������������������������-��+������-���1

����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-�+�.�����-�+1�����������������������6�%����4%%����������������������������-���������-��.+

����������������������8���������������������C!������������-��.������-��.�����������������������8���������������������!C������������-���+�����-��������������������������8���������������������4%%�����������-���������-���.

���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K

�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-�������������-�...��������+-��������������������� ����J����!� GK��������������-1������������-�.�����������-+�������������������� ����J����!� GK��������������-��,.���������-1�+����������-��,+

����������������������������������������4�%3���4�D��>��1�

21 / 87

Page 22: Statistical Inference Using SAS - East Carolina University

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������������������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

�������������������������������46""$�����!"486�4

���������������������������������������E�������������������������������$��������E�������������������������������!�7�$����E����������������������������������$����E�/56����E$/44����E��������������������������������������*********F********F********F��������������������������������<690����E��������E��������E�����������������������������������������������E���1-+��E���1-�.�E���,-,�����������������������������������������E����-�1�E��.,-���E����������������������������������������E���+-���E����-���E�������������������������������*********F********F********F��������������������������������<25'2���E��������E��������E�����������������������������������������������E���.-�+�E���,-�+�E��,�-�1����������������������������������������E����-���E��11-1��E����������������������������������������E��+�-+��E��,,-,.�E�������������������������������*********F********F********F���������������������������������������������������������������������������������������������������������������-+�����1+-��������-��

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

����������������������4���� ������������������������)�������������������$�������������������������******************************************************���������������������� �<4����������������������������������-���,�����-���.����������������������6�G��� ����!����� �<4����������������1-.��������-�����������������������������������/�H-� �<4�����������������1-���������-��++����������������������������<2��� D��� �<4�����������������1-�1�������-���.����������������������$ ������������������������������������-��������������������������������������������������������������-��.�������������������������%��I �������������������������������-����

����������������������������������������� ��I �"@������ ���������������������������������**********************************������������������������������������J���K����������J�K������������������������������������������6���< �����$��L>�������������-������������������������������������!�� �< �����$��B>������������-����

��������������������������������������$����������J$K��������-�������������������������������������7�< �����$��L>�$������������-���.

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

����������������������������4���� ��� ����������������46""$���!"486�4��������������������������������������������������'"()"!>'5!64

����������������������4���� ���������������������������������������������/4"����������������������******************************************************����������������������'�%%�����������������������������������-+��1�����-���+����������������������M������I ����<�������������������������-���������-��+�����������������������4�����I ����<��������������������������-���������-���,

����������������������4�%�� I�)�C!��������������������������-���.�����-�+������������������������4�%�� I�)�!C��������������������������-���������-�.�+

����������������������$��� ���������������������������������-���������-��+�����������������������43���%��������������������������������-���������-��+�

����������������������6�%����/ %%������C!������������������-���������-��������������������������6�%����/ %%������!C������������������-��1������-��������������������������6�%����4%%����������������������������-��.������-����

����������������������8���������������������C!������������-��1+�����-��������������������������8���������������������!C������������-��1.�����-���1����������������������8���������������������4%%�����������-���������-����

���������������������������" ��%��� ����� ��!�����&��!� G�J!�7�O!�7�K

�����������������3�����4������������������������������������?�����������6�%�� ����������������*****************************************************************����������������� �<�������J9�� �!����K�������-+������������-�+�+��������+-��.������������������ ����J����!� GK��������������-�.,����������-�.1����������-�.�1����������������� ����J����!� GK��������������-1,�+���������-..�����������-�,��

����������������������������������������4�%3���4�D��>����

22 / 87

Page 23: Statistical Inference Using SAS - East Carolina University

Mantel-Haenszel Chi-square Tests

���������������������������������������<2��� D��� �< �������� ���������������������������������

����������������������������������������� ���!"#�$��������

�����������������������������4�%%���4���� ��� �����46""$���!"486�4�����������������������������������������������������'"()"!

��������������������� ���<������<2��� D���4���� ��� �J=� ������������4���� K

�����������������4���� �������/��������&��23�� � � ����)�������������������$��������������������***************************************************************������������������������������(��D������������������������������-+..������-���+������������������������������!�7������4���� �)������������������-+..������-���+������������������������������'�������/ ������������������������-+..������-���+

������������������������" ��%��� ����� ���%%���!�����&��!� G�J!�7�O!�7�K

�������������3�����4����������� ��������������������������������?�����������6�%�� ������������*************************************************************************������������� �<������������������<2��� D�����������-��1���������-+�1���������-���+��������������J9�� �!����K����6�����������������������-���1��������-+�����������-��,+

������������� ���������������������<2��� D�����������-�..���������-�+.+��������-������������������J����!� GK�����6�����������������������-�1����������-���1��������-��1.

������������� ���������������������<2��� D�����������-11����������-1�1���������-��++��������������J����!� GK�����6�����������������������-1��,��������-1��+��������-��1�

���������������������������������������=�� ��7<)���� ���������������������������������������2�%������������ ��9�� �!���� ����������������������������������******************************���������������������������������� �<4��������������������-��������������������������������������)���������������������������������������������������������������$��B� �4����������������-,�1�

�������������������������������������������4�%3���4�D��>�,+�

23 / 87

Page 24: Statistical Inference Using SAS - East Carolina University

T-tests and NonparametricComparisons

24 / 87

Page 25: Statistical Inference Using SAS - East Carolina University

Comparing Two Groups

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

25 / 87

WUQ
Callout
PROC SGPLOT DATA=RESPONSE; VBOX TIME / CATEGORY=GROUP; RUN;
Page 26: Statistical Inference Using SAS - East Carolina University

Side-by-Side Boxplots

26 / 87

Page 27: Statistical Inference Using SAS - East Carolina University

Boxplots from Sgplot

27 / 87

Page 28: Statistical Inference Using SAS - East Carolina University

T-tests

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

28 / 87

Page 29: Statistical Inference Using SAS - East Carolina University

T-tests

������������������������������������9��< �%3����<�� ��"@�%3�������������������������������������

���������������������������������������� ����"4��$��������

�����������������������������������������������������5�"

�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

���������������������������-����������1-��.��������-,��+�����1�-�������������+-�

�����������������������������������?�6�������������4���)�&��������?�6�4���)�&

���������������������-���������1�-��.��������-�������1-��.��������-1�1�����-�+��

��������������������������������������)����������������$��B�C�C

����������������������������������������������<�-1��������-����

�������������������������������������7�< �%3����<�� ��"@�%3������������������������������������,

���������������������������������������� ����"4��$��������

�����������������������������������������������������5�"

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�������������������������������11-,���������.-���.�������-�,�������1�-����������1-����

�������������������������������������-,�������-�.�,�������-��.+�������-�������������+-�

�����������)����J�<�K����������<��-�����������-�,,,�������-��+�

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

���������������������������������11-,��������.�-�������.-,,��������.-���.������+-�.+�����-�.1�

���������������������������������������-,�������-����������+-��������-�.�,�������-�+�+����-��1.

��)����J�<�K����$����������������<��-��������<��-1�,1��<�-�.���������-�,,,�������-,�+�����-�1��

��)����J�<�K����4������ 7��������<��-��������<��-���.��<+-�,1�

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-1��������-����

�������������������4������ 7��������8������������+-,+��������<�-1��������-��+�

��������������������������������������"������������������

��������������������������� ��������(�%�)�����)���)����������������$��B��

�����������������������������������������+���������+��������-+������-���1

29 / 87

Page 30: Statistical Inference Using SAS - East Carolina University

Wilcoxon Rank Sum Tests

DATA RESPONSE;

INPUT GROUP $ TIME;

DATALINES;

C 80

C 93

C 83

C 89

C 98

T 100

T 103

T 104

T 99

T 102

;

RUN;

PROC SORT DATA=RESPONSE;

BY GROUP;

RUN;

PROC BOXPLOT DATA=RESPONSE;

PLOT TIME*GROUP;

RUN;

PROC MEANS DATA=RESPONSE;

CLASS GROUP;

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE h0=100;

TITLE "One-sample T-test Example";

VAR TIME;

RUN;

PROC TTEST DATA=RESPONSE;

TITLE "Two-sample T-test Example";

CLASS GROUP;

VAR TIME;

RUN;

DATA TUMOR;

INPUT GROUP $ MASS @@;

DATALINES;

A 3.1 A 2.2 A 1.7 A 2.7 A 2.5

B 0.0 B 0.0 B 1.0 B 2.3

;

RUN;

PROC NPAR1WAY DATA=TUMOR WILCOXON;

TITLE "Nonparametric Test to Compare Tumor Masses";

CLASS GROUP;

VAR MASS;

EXACT WILCOXON;

RUN;

30 / 87

Page 31: Statistical Inference Using SAS - East Carolina University

Wilcoxon Rank Sum Tests

����������������������������(��3���%�������� ������%3������%����� � ���������������������������.

������������������������������������������������������������������������������������������������

��������������������������������������� ��($/!�0/:�$��������

��������������������������0����@���4���� �J!��G�4�% K���������������/44

������������������������������������ �����������������'!98$

�����������������������������������4�%���������"@3������������4���)�&��������������

��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����

��������������*********************************************************************

��������������/������������������������-�������������-�������+-�,�+�.����������,-,�

��������������=�����������+������������-�������������-�������+-�,�+�.�����������-��

�������������������������������/&������ ���� �7����� ���������� -

������������������������������������0����@����7�<4�%3����� �

�������������������������������4���� ����J4K�����������������-����

�������������������������������(��%���/33��@�%�����

�������������������������������A���������������������������<�-1++1

�������������������������������9��<4�����$��L��A�������������-����

��������������������������������7�<4�����$��B�CAC������������-�,��

���������������������������������/33��@�%�����

�������������������������������9��<4�����$��L��A�������������-����

��������������������������������7�<4�����$��B�CAC������������-����

�������������������������������"@������ �

�������������������������������9��<4�����$��L>��4������������-���.

��������������������������������7�<4�����$��B>�C4�<�����C����-�,��

����������������������������A�������� ����������������������������-�-

���������������������������������������M�� G��<0���� ��� �

������������������������������������ �<4���������������-1.��

������������������������������������)������������������������

������������������������������������$��B� �<4����������-�+��

31 / 87

Page 32: Statistical Inference Using SAS - East Carolina University

Paired T-tests

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

32 / 87

Page 33: Statistical Inference Using SAS - East Carolina University

Paired T-tests

����������������������������������)�%�� ����������$�������<�� ���������������������������������1

���������������������������������������� ����"4��$��������

������������������������������������)�������������5�"�<���5�"

�������������������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�������������������,�����<.-����������+-�����������-,1,�����<��-���������<+-����

�����������������������������������?�6�������������4���)�&��������?�6�4���)�&

�������������������<.-��������<��-,,1.��<�-��.�������+-�����������-�.1.����-����

��������������������������������������)����������������$��B�C�C

����������������������������������������������<+-���������-��.+

33 / 87

Page 34: Statistical Inference Using SAS - East Carolina University

Analysis of Variance

34 / 87

Page 35: Statistical Inference Using SAS - East Carolina University

Comparing More Groups

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

35 / 87

WUQ
Callout
PROC SGPLOT DATA=READING; VBOX WORDS / CATEGORY=GROUP; RUN;
Page 36: Statistical Inference Using SAS - East Carolina University

Side-by-Side Boxplots

36 / 87

Page 37: Statistical Inference Using SAS - East Carolina University

Boxplots from Sgplot

37 / 87

Page 38: Statistical Inference Using SAS - East Carolina University

One-way ANOVA

DATA PAIRED;

INPUT CTIME TTIME;

DATALINES;

90 95

87 92

100 104

80 89

95 101

90 105

;

RUN;

PROC TTEST DATA=PAIRED;

TITLE "Demonstrating a Paired T-test";

PAIRED CTIME*TTIME;

RUN;

DATA READING;

INPUT GROUP $ WORDS @@;

DATALINES;

X 700 X 850 X 820 X 640 X 920

Y 480 Y 460 Y 500 Y 570 Y 580

Z 500 Z 550 Z 480 Z 600 Z 610

;

RUN;

PROC SORT DATA=READING;

BY GROUP;

RUN;

PROC BOXPLOT DATA=READING;

PLOT WORDS*GROUP;

RUN;

PROC MEANS DATA=READING;

CLASS GROUP;

VAR WORDS;

RUN;

PROC ANOVA DATA=READING;

TITLE "Analysis of Reading Data";

CLASS GROUP;

MODEL WORDS = GROUP;

MEANS GROUP / TUKEY;

RUN;

PROC NPAR1WAY DATA=READING WILCOXON;

TITLE "The Kruskal-Wallis Test";

CLASS GROUP;

VAR WORDS;

EXACT WILCOXON;

RUN;

38 / 87

Page 39: Statistical Inference Using SAS - East Carolina University

One-Way ANOVA

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������"�����������������������������������..�1�-�����������,+��-����

�����������������������������������+��������,��-����

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����

�������4���������������������������)���������/��&��44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

39 / 87

Page 40: Statistical Inference Using SAS - East Carolina University

Multiple Comparisons

�������������������������������������/��� � ����!�������)��������������������������������������

���������������������������������������� ��/(9�/�$��������

����������������������������G�I �4�������D���!�����J24)K��� ������09!)4

(9�"��� � ��� ��������� �� ���3��5��@3���%���7� ������������������������������ � ��� �� ����3�

������������������������������������55������������� ���!"'0#-

���������������������������/�3 �������������������������������������-��

���������������������������"�����)����� ����������%��������������������

���������������������������"����������4������������������������,+��-���

��������������������������������������������4�������D���!�������-..���

�������������������������������%�%�4�����������)��������������������-��

����������������������� �7�� �� �� �%����������������� ���������������������-

����������������������G��'���3�����������������������(����'!98$

���������������������������������/��������.1,-�������������N

���������������������������������=���������+1-�������������A

���������������������������������=

���������������������������������=����������1-�������������:

40 / 87

Page 41: Statistical Inference Using SAS - East Carolina University

Kruskal-Wallis Tests

�������������������������������������� ��M�� G��<0���� ��� �������������������������������������

��������������������������������������� ��($/!�0/:�$��������

�������������������������0����@���4���� �J!��G�4�% K��������������09!)4

������������������������������������ �����������������'!98$

�����������������������������������4�%���������"@3������������4���)�&��������������

��������������'!98$�������(��������4���� ������8�����2�������8�����2����������4����

��������������*********************************************************************

��������������N����������������������,�-�����������+�-�������1-����.������������-��

��������������:������������������������-�����������+�-�������1-����.�����������+-,�

��������������A������������������������-�����������+�-�������1-����.�����������,-+�

�������������������������������/&������ ���� �7����� ���������� -

���������������������������������������M�� G��<0���� ��� �

������������������������������ �<4���������������������������-1���

������������������������������)������������������������������������

������������������������������/ %3������$��B�� �<4����������-��.+

������������������������������"@���������$��B>� �<4����������-����

41 / 87

Page 42: Statistical Inference Using SAS - East Carolina University

GLM and Contrasts

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

42 / 87

Page 43: Statistical Inference Using SAS - East Carolina University

GLM

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������+

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

��������������������������/��� � ����!�������)����<�$��������%3��� �� ��������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

���������������������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������"�����������������������������������..�1�-�����������,+��-����

�����������������������������������+��������,��-����

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-.�,,����������-�1��,������1�-�+�.�������,�.-����

�������4���������������������������)���������3��5�44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$���������������������������������,��-�����������.1�,-,,,.�������,-.1�����-����

43 / 87

Page 44: Statistical Inference Using SAS - East Carolina University

Contrasts

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������,

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

�����������������������������������������������������������64�"/(

��������������������������������'!98$����09!)4�64�"/(������(�%���

��������������������������������N����������.1,-������������������

��������������������������������:������������1-������������������

��������������������������������A�����������+1-������������������

�������������������������������6�� ��4����� ����� ������������'!98$

�������������������������������$��B�C�C�����2���64����J�K>64����JHK

������������������������������������)�3�����������������09!)4

���������������������������OH�������������������������������������������

�����������������������������������������������������-�������������-���+

���������������������������������������-���������������������������-1�.�

���������������������������������������-���+���������-1�.�

��������������������������/��� � ����!�������)����<�$��������%3��� �� �������������������������.

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

������������ ���������������������)����������� ��44����������4��������������������$��B��

�������N��4-�:�/()�A��������������������������,�-�������������,�-������������-������L-����

��������"�29)�:��4-�A���������������������������-���������������-������������-�������-�,+�

44 / 87

Page 45: Statistical Inference Using SAS - East Carolina University

Contrasts vs. a Control

�����������������������/��� � ����!�������)����<��%3��� �� �� -��������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

���������������������������/�H� �%�������������3����%3��� �� ��)������

��������������������������������������������������������2��64����>

����������������������������������������������������������������

�������������������������������'!98$����09!)4�64�"/(������$��B�C�C

�������������������������������N����������.1,-������

�������������������������������:������������1-���������������-���+

�������������������������������A�����������+1-���������������-����

45 / 87

Page 46: Statistical Inference Using SAS - East Carolina University

Two-way ANOVA

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

46 / 87

Page 47: Statistical Inference Using SAS - East Carolina University

GLM

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

����������������������������������'"()"!���������������������

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����

�������"����������������������������+�������.+��-�����������1,++-����

�����������������������������������������,1�,��-�,,.

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���

�������4���������������������������)���������3��5�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

47 / 87

Page 48: Statistical Inference Using SAS - East Carolina University

LSmeans

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

�����������������������������������������������������������64�"/(

��������������������������������'!98$����09!)4�64�"/(������(�%���

��������������������������������N����������1�1-1�����������������

��������������������������������:�����������+�-������������������

��������������������������������A����������,��-������������������

�������������������������������6�� ��4����� ����� ������������'!98$

�������������������������������$��B�C�C�����2���64����J�K>64����JHK

������������������������������������)�3�����������������09!)4

���������������������������OH�������������������������������������������

����������������������������������������������������L-������������L-����

��������������������������������������L-���������������������������-��1,

��������������������������������������L-�������������-��1,

�������������������������������������/��� � ����!�������)�������������������������������������+

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

����������������������������/�H� �%�������������3����%3��� �� ����G�

��������������������������������������������������������2��64�����>

����������������������������������������������������������64�����

������������������������������'"()"!����09!)4�64�"/(�������$��B�C�C

������������������������������������������,.�-����������������-�1��

������������������������������������������,+�-������

48 / 87

Page 49: Statistical Inference Using SAS - East Carolina University

The “Slice” Option

�������������������������������������/��� � ����!�������)��������������������������������������

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

���������������������������������'!98$����'"()"!����09!)4�64�"/(

���������������������������������N��������������������1.�-,�����

���������������������������������N��������������������.1,-������

���������������������������������:���������������������,�-������

���������������������������������:����������������������1-������

���������������������������������A�����������������������-������

���������������������������������A��������������������,��-������

�������������������������������������/��� � ����!�������)�������������������������������������,

����������������������������������������� ��'6��$��������

���������������������������������������6�� ��4����� �����

�������������������������'!98$P'"()"!�"������4��������'"()"!�����09!)4

����������������������������������������4�%���

��������������'"()"!��������)����������4����� ����������4��������������������$��B��

�������������������������������������������+�������������+�����������,-1�����L-����

�����������������������������������������1�1���������������++.��������-+,�����-����

49 / 87

Page 50: Statistical Inference Using SAS - East Carolina University

Interaction Plot

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

50 / 87

WUQ
Callout
PROC SGPLOT DATA=MEANS; SERIES X=GROUP Y=M_WORDS / GROUP=GENDER; RUN;
Page 51: Statistical Inference Using SAS - East Carolina University

Interaction Plot

51 / 87

Page 52: Statistical Inference Using SAS - East Carolina University

Interaction Plot from Sgplot

52 / 87

Page 53: Statistical Inference Using SAS - East Carolina University

Contrasts

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Planned Comparisons";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF ADJUST=TUKEY;

CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;

CONTRAST 'METHOD Y VS. Z' GROUP 0 1 -1;

RUN;

PROC GLM DATA=READING;

TITLE "Analysis of Reading Data - Comparisons Vs. a Control";

CLASS GROUP;

MODEL WORDS = GROUP;

LSMEANS GROUP / PDIFF=CONTROL("X") ADJUST=DUNNETT;

RUN;

DATA TWOWAY;

INPUT GROUP $ GENDER $ WORDS @@;

DATALINES;

X M 700 X M 850 X M 820 X M 640 X M 920

Y M 480 Y M 460 Y M 500 Y M 570 Y M 580

Z M 920 Z M 550 Z M 480 Z M 600 Z M 610

X F 900 X F 880 X F 899 X F 780 X F 899

Y F 590 Y F 540 Y F 560 Y F 570 Y F 555

Z F 520 Z F 660 Z F 525 Z F 610 Z F 645

;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Analysis of Reading Data";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER;

LSMEANS GROUP GENDER / PDIFF ADJUST=TUKEY;

LSMEANS GROUP*GENDER / SLICE=GENDER;

RUN;

PROC MEANS DATA=TWOWAY NWAY NOPRINT;

CLASS GROUP GENDER;

VAR WORDS;

OUTPUT OUT=MEANS MEAN=M_WORDS;

RUN;

SYMBOL1 V=SQUARE COLOR=BLACK I=JOIN;

SYMBOL2 V=CIRCLE COLOR=BLACK I=JOIN;

PROC GPLOT DATA=MEANS;

TITLE "Interaction Plot";

PLOT M_WORDS*GROUP=GENDER;

RUN;

PROC GLM DATA=TWOWAY;

TITLE "Demonstrating the CONSTRAST Statement of GLM";

CLASS GROUP GENDER;

MODEL WORDS = GROUP GENDER GROUP*GENDER / SS3;

CONTRAST 'X VS. Y FEMALE ONLY' GROUP 1 -1 0 GROUP*GENDER 1 0 -1 0 0 0;

CONTRAST 'X VS. Y MALE ONLY' GROUP 1 -1 0 GROUP*GENDER 0 1 0 -1 0 0;

RUN;

53 / 87

Page 54: Statistical Inference Using SAS - East Carolina University

Contrasts

���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������.

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������N�:�A

����������������������������������'"()"!���������������������

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

���������������������������)�%�� ��������� ��9(4�!/4��4����%�������'6���������������������������1

������������������������������������������������������������������������������������������������

����������������������������������������� ��'6��$��������

)�3�����������������09!)4

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������+.1���-�,,.��������,��-+�����������-�,����L-����

�������"����������������������������+�������.+��-�����������1,++-����

�����������������������������������������,1�,��-�,,.

������������������������!<4������������������������!�����4"����09!)4�����

�������������������������-,�.+���������+-�...���������-�.�1�������,,�-+���

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������'!98$������������������������������+��..�-�,,.���������1�-,����������,-�.����L-����

�������'"()"!�������������������������������,1+�-�����������,1+�-������������-.������-�1��

�������'!98$P'"()"!���������������������������+�-,������������.�-������������-�������-����

������������ ���������������������)����������� ��44����������4��������������������$��B��

�������N��4-�:��"�/6"�9(6:������������������1�1+-�����������1�1+-�����������.-�+����L-����

�������N��4-�:��/6"�9(6:�������������������.��,�-����������.��,�-������������-..�����-����

54 / 87

Page 55: Statistical Inference Using SAS - East Carolina University

ANCOVA Data

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

55 / 87

Page 56: Statistical Inference Using SAS - East Carolina University

ANCOVA Data

�����������������������������������������&�������"@�%3�����������������������������������������

����������������������������������������� ��9!!�$��������

�������������������������������������������� ������/�2�����5#

�����������������������������$��� ������������������������ ��(�>���

������������������������������������$����B�C�C�������2���! �>�

������������������������������������������������/�2������������5#

����������������������������������/�2��������-�������������-��+�,

������������������������������������������������������������-����

���������������������������������5#����������-��+�,��������-�����

����������������������������������������������-����

�����������������������������������������&�������"@�%3���������������������������������������+�

���������������������������������������� ����"4��$��������

�����������������������������������������������������5#

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�����������/�������������������������-��������-��.��������-+,1�����������-����������1-�

�����������=�����������������������+�-,�������-+1���������-�1�����������,-���������,�-�

�����������)����J�<�K����������<��-,����������-����������.-1�+�

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

��/������������������������������������-�����������-1������,-��������-��.�������.-���,����-����

��=����������������������������������+�-,����������-�������,-��������-+1��������.-+.1+����-1,..

��)����J�<�K����$����������������<��-,�������<�.-,�����<�-�1�.�������-����������1-�+�+����-,,�.

��)����J�<�K����4������ 7��������<��-,�������<�.-,��.��<�-�.��

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-���������-��,�

�������������������4������ 7��������8������������.-��,,������<�-���������-��,�

��������������������������������������"������������������

��������������������������� ��������(�%�)�����)���)����������������$��B��

�����������������������������������������+���������+��������-�+�����-�,��

�����������������������������������������������������/�2

�����������'!98$����������(�����������������4���)�&�����4���"�����������%�%�������@�%�%

�����������/�������������������������-��������-�1��������,-,+�1��������,�-��������+��-�

�����������=����������������������+�1-�����������-������+�-��������������-��������,��-�

�����������)����J�<�K������������<���-������1�-�111�������-����

��'!98$������������ ������������������������������?�6�������������4���)�&��������?�6�4���)�&

��/������������������������������������-���������,�-�����+��-��������-�1���������-,�.������.�-�

��=���������������������������������+�1-�����������-������1�-1����������-������,�-,.�1�������-�

��)����J�<�K����$������������������<���-�������<�++-���<�-1��������1�-�111������,-�����������-�

��)����J�<�K����4������ 7����������<���-�������<�+�-�����-�+��

���������������������� ��������������������� ��������)����������������$��B�C�C

�������������������$����������������"�����������������1������<�-�+�������-�+.+

�������������������4������ 7��������8������������,-+.�,������<�-�+�������-��+.

56 / 87

Page 57: Statistical Inference Using SAS - East Carolina University

ANCOVA

PROC GPLOT DATA=COVAR;

PLOT MATH*IQ=GROUP;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

57 / 87

WUQ
Callout
PROC SGPLOT DATA=COVAR; SCATTER X=IQ Y=MATH / GROUP=GROUP; RUN;
Page 58: Statistical Inference Using SAS - East Carolina University

Scatter Plots

58 / 87

Page 59: Statistical Inference Using SAS - East Carolina University

Scatter Plots from Sgplot

59 / 87

Page 60: Statistical Inference Using SAS - East Carolina University

ANCOVA

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������/�=

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

)�3������������������/�2

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������1�+��-�+���������.1�1-�1����������.-�������-����

�������"����������������������������,���������.-����.����������-��1�+

����������������������������������������������-�����

������������������������!<4������������������������!�����4"������/�2�����

�������������������������-1�,1,���������-�1,11��������-��++1��������,-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������5#���������������������������������+��.1-��+�������+��.1-��+����������-1������-����

�������'!98$��������������������������������,�+-+��+��������,�+-+��+���������-�.�����-�1�+

�������5#P'!98$�����������������������������1�,-�,�.��������1�,-�,�.���������-�������-�.�+

60 / 87

Page 61: Statistical Inference Using SAS - East Carolina University

ANCOVA

�����������������������������������������&�������"@�%3���������������������������������������++

����������������������������������������� ��'6��$��������

��������������������������������������� �6�&���5����%�����

������������������������������������ ���������6�&�� ���������

����������������������������������'!98$�������������������/�=

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

�����������������������������������������&�������"@�%3���������������������������������������+�

����������������������������������������� ��'6��$��������

)�3������������������/�2

�����������������������������������������������4�%���

�������4���������������������������)����������4����� ����������4��������������������$��B��

������������������������������������������.�,�1-�1,���������1��-�������������-.1�����-����

�������"����������������������������.�������+�+-���.����������,-����+

����������������������������������������������-�����

������������������������!<4������������������������!�����4"������/�2�����

�������������������������-1��1+���������-�+��1������+�-..�����������,-����

�������4���������������������������)�������3��555�44����������4��������������������$��B��

�������5#���������������������������������+�1��-,1,�������+�1��-,1,����������-1������-����

�������'!98$����������������������������������,-��.�����������,-��.����������-�������-1�11

61 / 87

Page 62: Statistical Inference Using SAS - East Carolina University

Correlation and SimpleRegression

62 / 87

Page 63: Statistical Inference Using SAS - East Carolina University

Correlations

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

DATA CORR_EG;

INPUT GENDER $ HEIGHT WEIGHT AGE;

DATALINES;

M 68 155 23

F 61 99 20

F 63 115 21

M 70 205 45

M 69 170 .

F 65 125 30

M 72 220 48

;

RUN;

GOPTIONS RESET=ALL;

PROC GPLOT DATA=CORR_EG;

PLOT (HEIGHT WEIGHT)*AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

TITLE "Example of a Correlation Matrix";

VAR HEIGHT WEIGHT AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

VAR AGE;

WITH HEIGHT WEIGHT;

RUN;

PROC CORR DATA=CORR_EG NOSIMPLE;

TITLE "Example of Partial Correlation";

VAR HEIGHT WEIGHT;

PARTIAL AGE;

RUN;

63 / 87

WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=AGE Y=HEIGHT; RUN; PROC SGPLOT DATA=CORR_EG; SCATTER X=AGE Y=WEIGHT; RUN;
Page 64: Statistical Inference Using SAS - East Carolina University

Scatter Plots

64 / 87

Page 65: Statistical Inference Using SAS - East Carolina University

Scatter Plots from Sgplot

65 / 87

Page 66: Statistical Inference Using SAS - East Carolina University

Correlation Matrices

���������������������������������"@�%3������������������������@������������������������������+.

����������������������������������������� ��9!!�$��������

��������������������������������������� �����2"5'2����0"5'2����/'"

����������������������������������������4�%3���4���� ���

�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%

����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����

����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����

����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����

��������������������������������$��� ������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

���������������������������������������2"5'2���������0"5'2������������/'"

�������������������������2"5'2���������-�������������-�.�,���������-1,,�+

������������������������������������������������������-�������������-���.

��������������������������������������������.�������������.�������������,

�������������������������0"5'2���������-�.�,���������-�������������-��+�,

����������������������������������������-���������������������������-��1�

��������������������������������������������.�������������.�������������,

�������������������������/'"�����������-1,,�+��������-��+�,��������-�����

����������������������������������������-���.���������-��1�

��������������������������������������������,�������������,�������������,

��������������������������������43���%������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

���������������������������������������2"5'2���������0"5'2������������/'"

�������������������������2"5'2���������-�������������-�������������-�+�1,

�����������������������������������������������������L-�������������-��+1

��������������������������������������������.�������������.�������������,

�������������������������0"5'2���������-�������������-�������������-�+�1,

���������������������������������������L-���������������������������-��+1

��������������������������������������������.�������������.�������������,

�������������������������/'"�����������-�+�1,��������-�+�1,��������-�����

����������������������������������������-��+1���������-��+1

��������������������������������������������,�������������,�������������,

66 / 87

Page 67: Statistical Inference Using SAS - East Carolina University

Partial Correlations

DATA COVAR;

LENGTH GROUP $ 1;

INPUT GROUP MATH IQ @@;

DATALINES;

A 260 105 A 325 115 A 300 122 A 400 125 A 390 138

B 325 126 B 440 135 B 425 142 B 500 140 B 600 160

;

RUN;

PROC CORR DATA=COVAR NOSIMPLE;

TITLE "Covariate Example";

VAR MATH IQ;

RUN;

PROC TTEST DATA=COVAR;

CLASS GROUP;

VAR IQ MATH;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP IQ*GROUP / SS3;

RUN;

PROC GLM DATA=COVAR;

CLASS GROUP;

MODEL MATH = IQ GROUP / SS3;

LSMEANS GROUP / PDIFF;

RUN;

DATA CORR_EG;

INPUT GENDER $ HEIGHT WEIGHT AGE;

DATALINES;

M 68 155 23

F 61 99 20

F 63 115 21

M 70 205 45

M 69 170 .

F 65 125 30

M 72 220 48

;

RUN;

GOPTIONS RESET=ALL;

PROC GPLOT DATA=CORR_EG;

PLOT (HEIGHT WEIGHT)*AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

TITLE "Example of a Correlation Matrix";

VAR HEIGHT WEIGHT AGE;

RUN;

PROC CORR DATA=CORR_EG PEARSON SPEARMAN;

VAR AGE;

WITH HEIGHT WEIGHT;

RUN;

PROC CORR DATA=CORR_EG NOSIMPLE;

TITLE "Example of Partial Correlation";

VAR HEIGHT WEIGHT;

PARTIAL AGE;

RUN;

67 / 87

Page 68: Statistical Inference Using SAS - East Carolina University

Partial Correlations

���������������������������������"@�%3������������������������@������������������������������+1

����������������������������������������� ��9!!�$��������

���������������������������������0�� ��������� �����2"5'2����0"5'2�

���������������������������������������������� �����/'"

����������������������������������������4�%3���4���� ���

�����������������������(���������������������4���)�&�������������������������%�%���������@�%�%

����2"5'2��������������.������,,-1�.�+��������-�.,��������,1-�����������,�-�����������.�-�����

����0"5'2��������������.��������-�.�+�������+�-.�,����������-�������������-�������������-�����

����/'"����������������,��������-�,,,.��������-+�,���������,-�������������-�����������+1-�����

���������������������������������$��� ������������������������

������������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

��������������������������������������������������������/'"

���������������������������������������2"5'2���������-1,,�+

������������������������������������������������������-���.

����������������������������������������������������������,

���������������������������������������0"5'2���������-��+�,

������������������������������������������������������-��1�

����������������������������������������������������������,

��������������������������������43���%������������������������

�����������������������������������$����B�C�C�������2���! �>�

��������������������������������������(�%�������9� ��&�����

��������������������������������������������������������/'"

���������������������������������������2"5'2���������-�+�1,

������������������������������������������������������-��+1

����������������������������������������������������������,

���������������������������������������0"5'2���������-�+�1,

������������������������������������������������������-��+1

����������������������������������������������������������,

����������������������������������"@�%3������$�����������������������������������������������+�

����������������������������������������� ��9!!�$��������

�������������������������������$��������������� �����/'"

����������������������������������������������� �����2"5'2����0"5'2�

�������������������������$��� ���$���������������������������� ��(�>�,

��������������������������������$����B�C�C�������2���$�������! �>�

����������������������������������������������2"5'2���������0"5'2�

��������������������������������2"5'2���������-�������������-����+

�������������������������������������������������������������-��.�

��������������������������������0"5'2���������-����+��������-�����

�����������������������������������������������-��.�

68 / 87

Page 69: Statistical Inference Using SAS - East Carolina University

Regressions

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

69 / 87

WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=HEIGHT Y=WEIGHT; REG X=HEIGHT Y=WEIGHT / CLM CLI; RUN;
WUQ
Callout
PROC SGPLOT DATA=CORR_EG; SCATTER X=HEIGHT Y=WEIGHT; REG X=HEIGHT Y=WEIGHT; RUN;
Page 70: Statistical Inference Using SAS - East Carolina University

Scatter Plot and Regression Line

70 / 87

Page 71: Statistical Inference Using SAS - East Carolina University

Regression Plots from Sgplot

71 / 87

Page 72: Statistical Inference Using SAS - East Carolina University

Linear Regression

������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�����������������������������������)�3�����������������0"5'2�

�����������������������������(�%�������9� ��&����� �!��������������.

�����������������������������(�%�������9� ��&����� �8 �������������.

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

�������������������������������������������������11�������������11�������1+-+������-����

����������"��������������������������������.��-�1.���������+�-,..+�

�����������������������������������,�������������1+

�����������������������!�����4"���������������-1,�.�����!<4�����������-�++�

�����������������������)�3��������������������-�.�+�����/�H�!<4�������-����

��������������������������������������������.-,����

���������������������������������������$���%�����" ��%���

������������������������������������$���%�����������4�������

����������������������������)��������" ��%�������������"�������������������$��B�C�C

���������������5������3������������<���-,++�1�������1�-�+��.������<.-�.�������-���1

���������������2"5'2�������������������-����.���������-��.1���������-���������-����

72 / 87

Page 73: Statistical Inference Using SAS - East Carolina University

Residual Plot

73 / 87

Page 74: Statistical Inference Using SAS - East Carolina University

Confidence Region

74 / 87

Page 75: Statistical Inference Using SAS - East Carolina University

Confidence Bands from Sgplot

75 / 87

Page 76: Statistical Inference Using SAS - East Carolina University

Adding a Quadratic Term

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

76 / 87

Page 77: Statistical Inference Using SAS - East Carolina University

Quadratic Regression

������������������������������!���� ����6��������2��� �<0��� ��)���������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�����������������������������������)�3�����������������0"5'2�

�����������������������������(�%�������9� ��&����� �!��������������.

�����������������������������(�%�������9� ��&����� �8 �������������.

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

��������������������������������������������������,������,���-+�,��������.�-�.�����-���.

����������"�������������������������+���������-1��+,�������1�-.����

�����������������������������������,�������������1+

�����������������������!�����4"��������������1-�1�������!<4�����������-�.+�

�����������������������)�3��������������������-�.�+�����/�H�!<4�������-�,��

���������������������������������������������-..++�

���������������������������������������$���%�����" ��%���

������������������������������������$���%�����������4�������

����������������������������)��������" ��%�������������"�������������������$��B�C�C

���������������5������3����������������-������������+�-�������������-.��������-����

���������������2"5'2����������������<.,-1++,1�������+�-�+��+������<�-���������-����

���������������2"5'2�������������������-,,������������-�������������-�.�������-���,

77 / 87

Page 78: Statistical Inference Using SAS - East Carolina University

Residual Plot

78 / 87

Page 79: Statistical Inference Using SAS - East Carolina University

Data Transformation

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

79 / 87

WUQ
Callout
PROC SGPLOT DATA=HEART; SCATTER X=DOSE Y=HR; PBSPLINE X=DOSE Y=HR; RUN;
Page 80: Statistical Inference Using SAS - East Carolina University

Scatter Plot

80 / 87

Page 81: Statistical Inference Using SAS - East Carolina University

Smooth fitting from Sgplot

81 / 87

Page 82: Statistical Inference Using SAS - East Carolina University

Regression on Transformed Data

SYMBOL1 V=DOT I=R;

PROC GPLOT DATA=CORR_EG;

PLOT WEIGHT*HEIGHT;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT;

PLOT RESIDUAL.*HEIGHT;

RUN;

GOPTIONS CSYMBOL=BLUE;

SYMBOL1 VALUE=DOT;

SYMBOL2 VALUE=NONE I=RLCLM95;

SYMBOL3 VALUE=NONE I=RLCLI95 LINE=3;

PROC GPLOT DATA=CORR_EG;

TITLE "Regression Lines and 95% CI's";

PLOT WEIGHT*HEIGHT=1

WEIGHT*HEIGHT=2

WEIGHT*HEIGHT=3 / OVERLAY;

RUN;

DATA CORR_EG;

SET CORR_EG;

HEIGHT2 = HEIGHT**2;

RUN;

PROC REG DATA=CORR_EG;

TITLE "Regression Line for Height-Weight Data";

MODEL WEIGHT = HEIGHT HEIGHT2;

PLOT RESIDUAL.*HEIGHT;

RUN;

DATA HEART;

INPUT DOSE HR @@;

DATALINES;

2 60 2 58 4 63 4 62 8 67 8 65 16 70 16 70 32 74 32 73

;

RUN;

SYMBOL VALUE=DOT I=SM;

PROC GPLOT DATA=HEART;

PLOT HR*DOSE;

RUN;

DATA HEART;

SET HEART;

LDOSE = LOG(DOSE);

LABEL LDOSE = "Log of Dose";

RUN;

PROC GPLOT DATA=HEART;

PLOT HR*LDOSE;

RUN;

PROC REG DATA=HEART;

TITLE "Investigating the Dose/HR Relationship";

MODEL HR = LDOSE;

PLOT R.*LDOSE;

RUN;

82 / 87

WUQ
Callout
PROC SGPLOT DATA=HEART; SCATTER X=LDOSE Y=HR; REG X=LDOSE Y=HR; RUN;
Page 83: Statistical Inference Using SAS - East Carolina University

Plot of Transformed Data

83 / 87

Page 84: Statistical Inference Using SAS - East Carolina University

Regression fitting from Sgplot

84 / 87

Page 85: Statistical Inference Using SAS - East Carolina University

Regression on Transformed Data

������������������������������5�&� ���������� ��)� �O2!�!������� �3������������������������������

������������������������������������������������������������������������������������������������

����������������������������������������� ��!"'�$��������

��������������������������������������������������9)"6�

�������������������������������������)�3�����������������2!

�����������������������������(�%�������9� ��&����� �!���������������

�����������������������������(�%�������9� ��&����� �8 ��������������

���������������������������������������/��� � ������������

����������������������������������������������4�%������������������

����������4������������������������)���������4����� ���������4��������������������$��B��

��������������������������������������������,,-+�����������,,-+���������+��-������L-����

����������"�������������������������1���������-��������������-,+�.�

�������������������������������������������.�-,����

�����������������������!�����4"���������������-1���+����!<4�����������-�1��

�����������������������)�3������������������,,-���������/�H�!<4�������-�.1.

���������������������������������������������-�����

���������������������������������������$���%�����" ��%���

�������������������������������������������$���%�����������4�������

��������������������6��������������)��������" ��%�������������"�������������������$��B�C�C

�������5������3�����5������3������������������-��������������-�������������-1�������L-����

�������6)94"��������6������)� ����������������-�,�1+���������-��11���������-�+������L-����

85 / 87

Page 86: Statistical Inference Using SAS - East Carolina University

Residual Plot

86 / 87

Page 87: Statistical Inference Using SAS - East Carolina University

Reference Text

87 / 87