1종오류(一種誤謬: type i error)cfs4.tistory.com/upload_control/download.blog?fhandle=... ·...

61
1 종종종( : Type I error) 통통통 통통통통통 통통통 통 통통 통 통통(통통, 통통) 통통통 통통 통통 통통통, 통통통통 통통통 통통통통 통통통 통통통통 통통 통통통 통통. 통통 통통 통통통통통 통통통통 통통통 통통통통 통통통 통통통통통 통통통 통통통 통통통통 통통통통통 통통통통 통통통통 통통통 통통통 통통통통 통통통 통통통. 통통통통통 통통통 통통 α 통 통통 통통통 통통통통통 α-통통통통통 통통. 2 종종종종(종종종종종: two-factor design) 통통통통 통통통통통통 통통통 통통통 통통통통 통통통통통(factorial design) 통통통 통통 통통통 통통통 통통통통통. 통 통통 통통통통통통 통통통 통통통 통통통 통 통통. 통통 통통통 통통통통통통 통통통 통통통 통통통 통통통통 통통통통통통통 통통통 통 통통 통통통 통통. 통통 통통 통통통 통통통통 통 통통통통통 통통통통 통통통 통통통 통통통 통통통통. 통통 통통, 통통통통통 3 통통 통통통통통 통통 통통 통통통 통통 2×3 통통통통통통 통통통. 2 종종종(종종종종: Type II error) 통통통 통통통통통 통통통통 통 통통(통통, 통통) 통통통 통통 통통 통통통, 통통통통 통통통 통통통통 통통통통 통통 통통통통 통통 통통통통 통통통 통통. 통통 통통, 통통통통통 통통통통 통통통 통통통통 통통통 통통통통통 통통통통 통통통통 통통통 통통통통, 통통통통통 통통 통통 통통통통 통통통 통통통 통통통통 통통통 통통통. 통통통통통 통통통통통 α-통통통 통통통통 β-통통통통통 통통통. 9 종종종(종종종종: stanine scores) 통통통 통통통통통통, 통통통 5 통통 통통통통통 2 통 통통통통통 통통통통 ½ 통통통통통 통통통 1 통통통통통 통통통통 9 통통 통통통통 통통통통 통통. 통통통통통 1 통통 9 통통통 통통통통통 통통통 5 통 통통통 통통통통 통통통통. 종종종종(종종종종: additive model) 통통통 통통통통 통통 통통 통통통통통 통통 통통통, 통 통통통통통통 통통 통통통 통통 통통통 통 통통통통통 통 통통 통통통 통통 통 통통통통 통통 통통 통통. 통통 통통, 통통통통통 통통 통통 통통통 통통통 통통통 통통 통통통 통 통통통 통통 통통통 통통통 통통통 통 통통통통통 통통 통 통통통통통 통통 통통 통통통 통통통. 통통통통통통, 통통통통통통 통통통통통통 통통통통통 통통통통통 통통통. 종종종(종종종: dummy variable) 통통통 통통통통 통통 통 통통통통 통통통통 통통 통통통통 통통통 통 통통통 통통통통 통통통통 통통 0 통통 1 통 통통 통통 통통. 통통통통 통통통 통통통 통 통통통 통통 통통통통 통통통 통통통통통 통통통 통(k)통통 통통통 통 통통 통통(k-1)통 통통통통 통통통통 통 통통. 종종(종종: hypothesis) 통통 통통통 통통, 통통 통통통통 통통통 통통 통통통통 통통통. 통통통 통통통 통통통통 통통 통통통통 통통통 통통통 통통 통통통통 통통통통 통통통 통통통통통 통통통통 통통. 통 통통통 통통통 통통 통통통 통통 통통통 통통통 통통통통 통통 통통통통 통통통통통 통 통 통통.

Upload: others

Post on 02-Jan-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

1종오류(一種誤謬: Type I error)

1종오류(一種誤謬: Type I error)  통계적 가설검정시 발생할 수 있는 두 가지(일종, 이종) 가능한 오류 중의 하나로, 연구자가 상정한 영가설이 실제로 참임에도 이를 기각할 확률. 예를 들어 모집단에서 집단간의 평균을 비교하는 경우에 모평균에는 실제로 차이가 없음에도 표본자료의 분석결과 모집단간 차이가 있다고 판단하는 오류를 말한다.  일종오류는 유의도 수준 α에 따라 크기가 결정되므로 α-오류라고도 한다.

2요인설계(二要因設計: two-factor design)  여러개의 독립변수들의 효과를 동시에 검정하는 요인설계법(factorial design) 중에서 가장 단순한 형태의 실험설계법. 두 개의 독립변수들의 효과를 동시에 검정할 수 있다. 또한 두가지 독립변수들을 동시에 다루기 때문에 이들간의 상호작용효과도 검정할 수 있는 장점이 있다. 이와 같은 형태의 설계법은 각 독립변수가 포함하는 수준의 개수를 가지고 제시한다. 예를 들어, 성별효과와 3가지 처치효과의 차에 대한 실험의 경우 2×3 요인설계라고 부른다. 

2종오류(二種誤謬: Type II error)  통계적 가설검정시 발생하는 두 가지(일종, 이종) 가능한 오류 중의 하나로, 연구자가 상정한 영가설이 실제로는 참이 아님에도 이를 참이라고 수용할 확률. 예를 들어, 모집단에서 집단간의 평균을 비교하는 경우에 모집단에서 모평균은 집단간에 차이가 있음에도, 표본자료의 분석 결과 집단간에 차이가 없다고 판단하는 오류를 말한다.  이종오류는 일종오류인 α-오류와 대비시켜 β-오류라고도 부른다. 

9분점수(구분점수: stanine scores)  일종의 표준점수로서, 평균이 5이고 표준편차가 2인 정상분포를 참조하여 ½ 표준편차의 구간을 1점구간으로 표현하여 9개의 구간으로 척도화한 점수.  구분점수는 1에서 9까지의 구간점수를 가지며 5점 구간에 평균치가 포함된다.

가법모형(加法模型: additive model)  하나의 측정치가 여러 개의 구성요인을 갖는 경우에, 각 구성요인들이 서로 상관을 갖지 않아서 각 구성요인의 값 또는 효과의 합이 곧 측정치의 값이 되는 모형.  예를 들어, 준거변수의 값이 복수 요인에 의하여 영향을 받는 경우에 각 요인의 효과 사이에 상관이 없어서 각 요인효과의 합이 곧 준거변수의 값이 되는 경우를 말한다. 분산분석모형, 심리측정학의 진점수이론의 수학모형은 가법모형의 예이다.  

가변수(假變數: dummy variable)  변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수.  한 연구에서 변수의 범주가 몇 개냐에 따라 가변수의 개수가 결정되는데 범주의 수(k)에서 하나를 뺀 개수 만큼(k-1)의 가변수가 만들어질 수 있다.

가설(假說: hypothesis)   연구 대상인 현상, 또는 모집단의 특성에 대한 잠정적인 진술문. 가설은 아직은 검정되지 않은 상태로서 경험적 증거에 의해 타당하게 지지되면 원리나 이론이라고 불리우게 된다. 한 연구의 가설은 연구 문제에 대해 제안된 아직은 검정되지 않은 잠정적인 해답이라고 할 수 있다.

가설검정(假說檢定: hypothesis testing)  연구자가 수립한 가설의 진위를 경험적 자료에 기초하여 결정하는 추론과정. 과학적 연구에서 가설검정은 주로 통계적 추론절차를 사용하는데 이론이나 선행연구 결과에 근거하여 형성된 개념적 연구가설은 통계적 가설로 전환되어 수식으로 표현된다. 통계적 가설검정에서는 아무런 효과가 없다 혹은 차이가 없다는 모집단의 특성을 나타내는 영가설을 기준으로 제시하고 그것을 기각하거나 수용하기 위해 표본자료를 수집한다. 표본 통계치를 가지고 모집단 가설의 타당성을 확률적으로 추리하여 평가한다.

강제선택형 문항(强制選擇型 問項: forced-choice item) 문항에 대한 반응 선택지들이 피검자에게 모두 해당되거나 모두 해당되지 않더라도 가장 근접하는 하나를 꼭 선택하게 하는 문항 유형.  강제선택형 문항은 피검자의 편파적인 반응경향성을 줄이기 위해 개발되었다.

개방형 분포(開放型 分布: open-ended distribution) 원자료로 빈도분포를 그렸을 때 급간의 상한계나 하한계의 끝이 정해지지 않은 무한대의 값을 가져서 한계를 지울 수 없는 분포.  예를 들어, 학습실험에서 어떤 피험자가 정답에 대한 반응을 하지 않아 시간을 결정할 수 없게 되어 반응시간의 상한계가 정해질 수 없는 경우가 있다. 이때 반응시간별 피험자들의 빈도를 가지고 분포도를 그릴 때 나타날 수 있는 분포가 개방형 분포이다.

개방형 질문(開放型 質問: open-ended question)  반응을 위한 선택지가 미리 준비되지 않고 반응자가 자유롭게 자신의 의견을 나타낼 수 있도록 만든 문항 형태. 비구조화된 질문지에서 반응자로부터 다양한 반응을 얻어내기 위한 목적에서 사용한다. 또한 교수현장이나 면접시에 적극적인 참여를 유도하는 방법으로 사용할 수 있다. 그러나 반응자에게 검사자가 원하는 반응 체계에 관한 정보를 제공할 수 없기 때문에 연구와 전혀 관련이 없는 반응들이 나오는 것을 통제하기가 어렵다.    

개별기술적 접근(個別記述的 接近: idiographic approach)  양적 연구에서와 같이 개인을 어떤 평균치에 의해 나타낼 수 없다는 신념에 기초하여 개인의 특유한 행동들과 일반적 행동들을 알아내기 위한 연구방법. 대표적인 것으로 사례연구법이 있다.

개별지능검사(個別知能檢査: individual intelligence test)  개인 단위로 지능을 측정하기 위해 만든 검사로서 집단지능검사와 대비되는 형태의 지능검사. 한 사람의 피검자를 대상으로 훈련된 심리학자가 실시하여 보다 개인의 지적 능력을 정확하게 측정할 수 있고 지적인 능력 이외에 성격이나 행동 패턴등을 관찰할 수 있어 개인을 다각적으로 이해하는데 효과적이기 때문에 임상 장면에서도 유용하게 사용된다. 개별지능검사는 지필문항보다는 구두문항이 많이 포함되어 있기때문에 개인의 읽기나 쓰기 능력 때문에 발생되는 오염 효과를 줄일 수 있다.

개인내-개인간 요인(個人內-個人間 要因: within subject - between subjects factor)  개인내 요인이란 검사조건이나 상황에 따라 달라지는 개인의 특성을 의미하고 개인간 요인이란 서로 다른 개인들 간의 차이를 나타내는 특성을 의미함. Intra-subject와 inter-subjects 요인과 같은 말이다. 실험설계시 개인내 요인은 반복측정설계를 사용하는 경우에 생긴다. 같은 피험자들을 반복적으로 사용하는 경우 피험자가 달라서 생겨나는 오차변산의 양이 줄어들기 때문에 효율적인 설계방법일 수 있다.

객관식 검사(客觀式 檢査: objective tests)  검사의 문항들이 진위형, 선다형, 배합형, 단답형, 짧은 완결형, 빈칸 채우기 등의 유형으로 구성되어 있어서 채점시 채점자의 주관적 판단이 개입되지 않아 검사점수가 객관적인 검사.

검사(檢査: test)  개인의 행동이나 속성을 관찰하는 과정, 모든 피검자들에게 비슷한 조건에서 정해진 시간동안 일련의 문제들을 실시하여 수치를 부여하거나 분류함으로써 그 행동이나 속성을 나타내기 위한 과정 및 이러한 목적에서 만들어진 도구를 통칭하는 용어. 

검사불안(檢査不安: test anxiety)  검사 상황에서 피검자가 느끼는 불안.  지나치게 높은 불안은 피검자를 긴장시키고 정서적으로 불안정하게 하여 제대로 능력을 발휘하지 못하는 결과를 가져온다. 검사 불안은 인지적 요소인 걱정과 정서적 요소인 불안감의 두가지 구성요소로 이루어졌다고 본다. 인지적 요소는 부정적 자기지향적 사고, 즉 결과에 대한 걱정을 나타내며 정서적 요소는 부정적인 감정과 생리적 반응을 포함하고 있다고 본다. 검사불안은 대처 기술을 습득함으로 해소시킬 수 있다.

검사명세화(檢査明細化: test specification)    검사의 목적이 결정된 다음, 그 목적에 부합하는 검사를 개발하기 위하여 검사 문항의 형태, 검사의 길이, 검사 내용의 구체화 등 검사 개발 계획을 구체화하는 과정. 이 중에서 검사 내용의 구체화는 흔히 평가목표의 진술에 이르는 과정으로서, 검사 대상 영역의 내용과 행동차원의 이원목표분류표를 작성하는데, 학업성취도 검사의 경우에 학습목표의 상세화 과정과 같이 이해될 수 있다.

검사요령(檢査要領: test wiseness)  검사 수행 경험의 축적으로 검사 문항에 대한 친숙도가 높고 질문의 의도나 목적등을 파악하여 내용을 모르고도 정답을 찾아내는 기술. 객관식 문항들은 높은 검사요령을 지닌 피검자에게 유리하게 편파적일 수 있다.

검사의 표준화(檢査의 標準化: standardization of a test)  검사의 실시 및 채점에서의 일관성. 같은 검사를 여러사람에게 실시할 때 응답자나 수검자는 달라도 검사의 실시․채점의 조건이 같아야 산출된 점수들을 서로 비교할 수 있다는 데서 연유하는 개념이다. 검사가 표준화되기 위해서 개발자가 우선 그 검사의 실시 및 채점에 대한 상세한 지시사항을 교본에 기재해야 한다. 다음은 검사사용자 및 실시자가 교본의 안내를 충실하게 따라야 한다. 끝으로 개인의 검사점수를 비교해서 해석하기 위한 규준(norm)이나 분할점수(cut-off score)가 설정되어야 한다.

검사정보함수(檢査情報函數: test information function)  검사가 측정대상인 피검자의 잠재적 특질을 얼마나 정확하게 추정할 수 있는가를 나타내는 함수. 검사정보함수는 문항반응으로부터 구할 수 있는 최대 정보량을 나타내며, 주어진 능력수준에서의 검사정보는 그 능력수준에서의 문항정보들의 총합이다. 검사정보함수의 수학적 공식은 다음과 같다.                                I(θ) : 능력수준 θ에서의 검사정보의 양                                Ii(θ): 능력수준 θ에서의 문항 i가 가지는 정보의 양                                N : 검사를 구성하는 문항수

검사특성곡선(檢査特性曲線: test characteristic curve)  능력 척도와 진점수 사이의 함수관계를 나타내는 곡선. 같은 능력을 지닌 피험자가 검사를 구성하는 각 문항에 정답할 확률을 합하여 그린 곡선으로, 일반적으로 단조증가함수의 형태를 띤다. 검사특성곡선의 형태는 능력척도 위의 피험자 능력 점수들의 빈도분포에 의존하지 않는다는 특성을 지닌다. 

검정력(檢證力: power of test)  가설검정에서 영가설이 사실이 아닐 때 이를 기각하여 올바른 결정을 할 수 있는 확률.  검정력은 1-β(이종오류 확률)로 계산된다. 한 실험의 검정력은 유의도 수준 α가 높아짐에 따라, 효과의 크기가 커짐에 따라, 표본의 크기가 커짐에 따라, 측정도구의 오차가 작아짐에 따라 증가한다. 검정력이란 같은 연구를 반복적으로 시행할 때 똑 같은 결과를 얻을 확률을 나타내는 것으로 연구의 타당성 정도를 알려준다.

결정계수(決定係數: coefficient of determination)  한 변수의 전체 변산 중 다른 변수가 설명하는 변산의 비율. 단순상관의 경우에는 상관계수의 자승으로 계산되고, 중다상관의 경우에는 회귀식에 의하여 설명된 변산의 비율을 계산하면 얻어진다. 따라서 X와 Y 두변수간의 상관 r = .5라면 결정계수는 .25가 되고 X변수가 Y변수의 전체 분산의 25%를 설명한다고 해석하면 된다.

경로계수(經路計數: path coefficient) 전통적 경로분석이나 이론변수를 포함하는 발전된 형태의 경로분석(즉, 구조방정식모형)에서 이론적 개념을 나타내는 변수들간의 관계를 나타내는 계수. 하나의 변수가 다른 변수에 대해서 가지는 효과를 나타내는 계수이며 수학적으로는 회귀계수이다.

경로도(經路圖: path diagram) 전통적인 경로분석이나 발전적 형태의 경로분석(즉, 구조방정식모형)에서 연구가설들을 표시하기 위해서 사용하는 그림. 경로도형이라고도 함. 이 도형속에는 변수간의 직접적, 간접적인 함수관계 및 설명되지 않는 관계까지 화살표나 쌍두곡선으로 표시할 수가 있다.

경로분석(經路分析: path analysis) 변수들간에 직접 또는 간접으로 함수적 관계를 가지는 경로의 모형을 방정식으로 또는 그림으로 표시하여 가설화하고, 그 모형을 수집된 자료에 합치 시키므로서 경로들이 나타내는 연구가설들을 검증하는 통계방법. 전통적인 경로분석에서는 표준화된 변수 및 상관행렬을 분석자료로 사용하고 경로의 방향도 일방향이지만 발전적 형태인 구조방정식모형(공분산구조모형)에서는 원래 변수 및 공분산행렬을 분석자료로서 더 선호하며 경로의 방향에 쌍방향도 허용한다.

경험적 연구방법(經驗的 硏究: empirical research method)  과학적 연구방법의 하나로 직접관찰이나 실험실시를 통하여 연구대상 또는 현상에 대한 경험적 자료를 수집하고 분석한 결과를 토대로 연구문제에 대한 해답을 찾는 방법. 경험적 연구에서는 감각적 경험이 포함된 기술과 절차를 사용하여 구체적인 자료를 수집하여 분석하고 그 결과에 기초하여 가설에 대한 검증과 반증을 한다. 경험적 연구는 반복수행이 가능하며 내적, 외적 타당도에 의해 결과의 유용성이 결정된다

고부담검사(高負擔檢査: high-stakes tests) 검사 결과가 학교 행정가, 교육정책 결정자, 자격증 발급청, 인사선발 주체 등에 의해서 중요한 결정을 내리는 데 사용되어 피검자에게 강력한 영향력을 행사는 경우에 사용되는 표준화 검사.

고유값(固有값: eigenvalue/characteristic root)  자료행렬을 요약하는 낱개의 수치. 특성치라고도 함. 각 고유값에는 그에 대응하는 고유벡터가 있고 하나의 행렬은 고유치와 고유벡터에 의해 분해될 수 있다. 고유값의 부호는 +, -, 또는 0이 되는데 사회과학에서는 +의 고유값을 자료내 정보의 양으로 해석하는 경우가 있다(예: 요인분석에서).

고전검사이론(古典檢査理論: classical test theory)  Charles Spearman이 시작한 교육 및 심리 측정의 개념적 모형으로서 검사점수인 관찰 점수는 진점수와 오차점수의 합으로 이루어졌다는 것을 기본모형으로 삼는 검사이론. 개인의 능력은 불변하기 때문에 반복적으로 측정한 검사점수의 평균치가 개인의 진점수라고 가정할 수 있고 따라서 관찰점수는 진점수분산과 오차점수분산으로 분리될 수 있다. 이 오차점수분산의 크기로 한 검사의 신뢰도를 추정할 수 있다. 그러나 고전검사이론에서는 개인의 능력이나 특성에 대한 측정이 검사에 따라 달라지고 문항모수치들이 피검자 집단에 따라 달리 추정된다는 제한점이 있다. 이러한 제한점을 극복하기 위한 검사이론으로 문항반응이론이 제기되었다.

고정효과모형(固定效果模型: fixed effect model)   통계적 모형에서 모형에 명세화된 각 독립변수의 효과가 반복연구를 하여도 그 독립변수의 동일한 특성의 효과임을 나타내는 통계모형.  분산분석의 경우에 독립변수의 처치수준이 연구를 반복하여도 동일 처치수준을 반영하는 경우에 그 모형은 고정효과 분산분석모형이 된다 (예, 남녀간의 비교). 그러나 독립변수의 많은 처치수준 중에서 일부만을 무선표집하여 모형에 명세화한 경우에는 이후의 반복연구에서 다른 처치수준이 독립변수에 반영되므로 독립변수는 무선효과를 가지며, 그 결과는 독립변수의 모든 수준에 일반화되며, 이 경우에는 무선효과모형이 된다.  통계학적으로 모형에 명세화된 모수가 고정된 값을 가지면 고정효과모형이며, 분산을 가지면 무선효과 모형이다.

곡선적 관계(曲線的 關係: curvilinear relationship)  서로 상관을 갖는 변수들 사이의 관계가 비직선적이어서, 한 변수(X) 값의 변화에 따른 다른 변수(Y)의 값의 변화가 동일 비율이 아닌 관계.  예를 들어,  X 변수와 Y 변수의 관계가 2차함수로 요약되면 2차함수적(quadratic), 3차함수로 요약되면 3차함수적(cubic), 4차함수로 요약되면 4차함수적(quartic) 관계라고 하며, 모든 비직선적 관계는 곡선적 관계라고  한다. 

공분산분석(共分散分析: analysis of Covariance: ANCOVA)  일반선형모형에 기초한 통계적 기술로서 회귀분석과 분산분석 방법이 결합된 통계적 방법. 실험연구와 비실험연구 모두에서 유용하다. 실험연구에서 공분산분석은 매개변수에 대한 직접적인 실험적 통제가 불가능하거나 비현실적인 경우 실험실시 후에 매개변수의 효과를 통계적으로 통제하는 방법이다. 관찰연구에서는 가외변수들에서의 차이 때문에 자연적으로 발생하는 종속변수에서의 집단간 차이를 제거할 수 있다. 두 개 이상의 양적 변수들과 범주변수가 함께 포함된 연구의 경우, 양적 변수들 간의 관계를 알아보기 위해 범주 변수를 통제하는 회귀분석의 일종으로도 수행할 수 있다.

공준타당도(共準妥當度: concurrent validity)  검사의 준거관련 타당도의 한가지로서 한 검사 점수와 같은 구성요인을 측정한다고 타당성을 인정받고 있는 기존의 검사 점수와의 일치정도. 일치정도는 두 검사 점수간의 상관계수로 판단한다. 준거로 삼는 검사의 점수가 같은 시점에서 얻어진다는 의미에서 공준타당도라 부르고 예언타당도와 구분된다.

공통요인(공통요인: common factor)  여러 가지 측정변수들에 공통으로 잠재해 있는 이론적인 변수. 공통인자라고도 함. 측정변수의 값은 공통요인을 나타내는 부분과 그 측정변수 고유의 요인을 나타내는 값으로 나누어진다. 여러 측정변수에 들어있는 공통요인을 추출하는 수학적 방법을 공통요인분석이라고 한다.

과정-산출접근(過程-産出接近: process-product approach)  교육의 성과를 평가하거나 교육기관의 교육기능을 평가하는 경우에 교육의 성과에 영향을 미치는 요인을 투입요인에서 규명하려는 기존의 투입-산출접근(input-output approach)을 비판하고 교육행위 또는 교육의 과정에서 교육성과에 영향을 미치는 요인을 규명하려는 접근방법.  교사의 교수행위, 학급 또는 학교의 문화 등은 과정요인의 예이다.

교과서 삽입검사(敎科書 揷入檢査: textbook-embedded tests)  교과서에 포함된 검사로서 각 단원이나 장의 내용제시가 끝난 후에 단원의 목표 달성 여부를 검사하기 위해 작성해 삽입해 놓은 검사를 지칭한다.

교류평가(交流評價: transactional evaluation)  구성원들이나 관련 집단의 견해 차이 및 가치체계의 차이점을 해결하는 집단상호작용이나 피드백작용을 장려함으로써 체제나 프로그램을 향상시키는데 초점을 두는 평가. 어떤 체제의 활동적 결과보다는 그 체제가 변화하는 과정이나 향상되는 과정에 더 관심이 있다. 따라서 변화하는 과정에 있는 체제나 조직의 내부에서 일어나는 역기능을 관리하는데 도움이 되는 평가이다.

교육 및 심리검사 기준(敎育 및 心理檢査 基準: standards for educational and psychological testing)  검사 및 관련분야에서의 기술적인 진보, 검사의 새로운 용도에 대한 사회적 관심의 증가에 따라 전문학회에서 제시하는 검사의 개발 및 사용에 대한 지침. 미국 교육학회(American Educational Research Association), 미국 심리학회 (American Psychological Association), 그리고 미국 교육측정학회(National Council on Measurement in Education)에서 발간한 교육․심리검사의 기준서(Standards for Educational and Psychological Testing, 1985)에서는 교육 및 심리검사의 기준을 검사개발 및 평가를 위한 기술적 기준(예, 신뢰도, 타당도, 규준), 각종 검사의 사용목적의 적합성을 위한 사용기준, 그리고 특정집단에 대한 검사의 적용기준, 검사시행절차의 기준 등으로 제시하고 있다.

교육목표분류학(敎育目標分類學: taxonomy of educational objectives)  교육을 통하여 성취하는 지식은 위계적 구조를 갖고 있다는 입장에서 교육목표를 위계적으로 분류한 체계. Bloom(1956) 등이 교육과정 및 교육평가 연구를 통하여 교육목표를 인지적 영역, 정의적 영역, 심동적 영역으로 분류하였으며, 인지적 영역은 지식의 획득과정의 난이도와 복잡성 수준에 따라 지식, 이해, 적용, 분석, 종합, 평가의 여섯 단계로 분류하였고 각 단계에서 다시 세부항목으로 지식의 유형을 분류하였다. 교육목표의 분류학은 교육에 관련된 사람들 사이의 의사소통을 원활하고 명확하게 하는데 기여하였으며, 교육목표를 학습자의 행위동사로 표현하여 관찰 가능한 목표행동을 제시함으로써 교육평가에서 교육목표의 성취여부를 판단하는데 기여하였다. 교육목표분류학을 확장하여, Krathwhol 등(1964)은 정의적 영역을 감수, 반응, 가치화, 조직화, 인격화의 5단계의 수준으로 분류하였고, Harrow(1972)는 심동적 영역의 교육목표를 반사운동, 기초운동, 운동지각능력, 신체기능, 숙련기능, 동작적 의사소통의 6단계로 분류하였다.

교차타당화(交差妥當化: cross validation)  검사문항의 선정, 채점지침의 작성, 문항점수 또는 검사점수의 해석에서 검사 개발시 사용한 표본집단 이외의 표본집단에 검사를 실시하여 검사의 통계학적, 측정학적 속성을 재검토하는 작업. 교차타당화는 검사의 측정학적 속성이 피험자 집단의 변화에도 불구하고 어느 정도 원래 측정치의 성질을 유지하는가에 관한 정보를 제공한다.

구술시험(口述試驗: oral examination)  피험자의 지적, 정의적, 심동적 특성에 대하여 면접을 통하여 평가하는 시험양식. 구술시험은 면접자가 피험자를 직접 대면하여 평가한다는 의미에서 면접자의 질문과 피험자의 반응내용에 대한 해석의 오류를 방지하는 장점이 있으며, 지필검사에서 관찰 불가능한 학생의 태도, 협동성, 의사소통능력 등의 특성을 관찰하는 장점이 있다.  구술시험은 피험자에 대한 질문이 정형화 되고 채점지침이나 절차가 표준화된 구조화된 시험과 그러한 표준적 절차가 없는 비구조적 시험으로 구분할 수 있다. 또한 면접자의 수와 피험자의 수에 따라서 일 대 일, 일 대 다수, 다수 대 일, 다수 대 다수의 구조로 진행할 수 있으며, 면접자의 질문과 피험자의 응답 양식이 일방적인가 쌍방적인가에 따라 다르게 분류할 수 있다.

구인(構因: construct)  물리적으로 직접적인 관찰은 불가능하지만, 이론적으로 존재를 가정하는 심리학적 개인의 특질로서 개인의 행동에 영향을 미치는 잠재요인. 구인은 개인의 행동에 근원적인 영향을 미치는 것으로 이해되며, 매우 다양한 구인들의 특성이 교육학 및 심리학에서 정의되고, 측정되며, 활용되고 있다. 지적행동에 대한 구인으로는 지능, 적성, 학업능력, 독해력 등을 예로 들 수 있으며, 정의적 행동에는 사회성, 직업흥미도 등을, 심동적 행동에 대한 구인으로는 근기(endurance), 눈과 손의 협응 등을 예로 들 수 있다.

구인타당도(構因妥當度: construct validity)  검사가 본래 의도한 측정대상인 이론적 구인이나 특질을 어느 정도 적절히 측정하는가에 대한 정보를 나타내는 타당도. 구인타당도의 증거를 제시하는 것은 지속적인 과정이며, 구인타당도는 측정대상인 특질에 대한 이론적 배경에서 비롯된 다양한 예측에 따라 검사점수가 어느정도 검사개발자의 예측을 만족하는가로 제시된다. 구인타당도를 성취하는 과정은 다양한 조건에서 측정대상인 특질의 이론적 배경을 만족하는 경험적 증거들을 축적하는 과정이다. 일반적으로 검사개발자들이 구인타당도를 제시하는 방법은 상이한 피험자 집단간의 차이, 검사점수의 변화에 대한 증거, 외적 준거와의 상관에 대한 증거, 검사문제 해결과정에 대한 증거 등이 이론적 예측과 일치하는가로 제시한다.

구조방정식 모형(構造方程式 模型: structural equation model)  복수의 관찰변수와 잠재변수(latent trait)들 간의 구조적 관계를 파악하는 통계모형으로서 사회과학 분야에서 활용되는 일반선형모형. 구조방정식 모형은 관찰변수들간의 공분산과 잠재변수들 간의 공분산을 모형의 명세화 과정에서 허용하며, 관찰변수들의 측정오차도 모형(즉, 측정모형)의 명세화에서 허용하여 측정오차 분산을 관찰분산에서 분해함으로써, 모형 (즉, 구조방정식 모형)에 명세화된 잠재변수들간의 구조적 관계를 보다 정확히 추정하는 장점이 있다. 또한 구조방정식 모형은 요인분석, 분산분석, 회귀분석, 경로분석 등을 모형의 특수한 형태로 포괄하는 일반선형모형이다. 구조방정식 모형은 공분산구조모형, 공분산구조분석 모형으로도 불리우며, 교육학, 심리학, 사회학 등에서 제시된 복잡한 이론을 경험적으로 검정하는데 활용된다. 구조방정식 모형을 활용하는 통계 프로그램은 LISREL, EQS, AMOS, LISCOMP 등 다양하게 있으며, 현재는 SPSS와 SAS에도 프로그램으로 포함되어 있다.

국제교육성취평가협회(國際敎育成就評價協會: International Evaluation Association)  여러 국가간의 교육제도를 비교하기 위하여 1959년에 설립된 평가기구. 이 기구는 여러 국가의 다양한 전공학자들로 구성된 최상위 의사결정 기구(assembly)를 설치하고, 연구프로젝트의 집행위원회(steering committee)를 전체 연구와 각 국가별 연구로 설치하여 운영한다. 이 기구의 활동 중에서 대표적인 것은 국가간의 수학 및 과학 성취도를 비교하는 연구를 수행하고, 그러한 국가간의 학업성취도 차이를 다양한 예측변수로 설명하려는 연구를 수행하는 것이다.  설립이래로 초․중등학생들의 수학과 과학교과에 대하여 제 1차 국가간 학력평가를 1964년에 시작한 후에, 제2차 수학 및 과학의 국제비교연구(Second International Mathematics and Science Study: SIMMS)를 1980년에서 1990년까지 수행하고, 제3차 수학 및 과학의 국제 비교연구(Third International Mathematics and Science Study: TIMMS)를 1991년부터 1999년까지 수행하고 있다.

군집분석(群集分析: cluster analysis)  관찰대상인 개체들을 유사성에 근거하여 보다 유사한 동류집단으로 분류하는 다변량 분석기법. 군집분석을 통하여 동일집단으로 분류된 개체들은 공유하는 특성이 유사한 것으로 해석되며, 통계학적 방법은 집단내 개체들간의 유사성을 개체내 변수들간의 상관계수, 개체간의 거리, 확률적 유사성 측정치 등을 활용하여 측정하고, 이에 기초하여 개체들을 유사한 동류집단으로 분류하는 것이다. 통상적으로 군집분석은 많은 개체들을 소수의 군집으로 분류하는 Q-분석에 속하며, 개체들의 소속집단이 알려진 다음에 소속집단을 결정하는 변수를 탐색하는 판별분석과는 달리, 개체들의 다양한 특성(즉, 변수)들 사이의 관계를 분석하여 동류의 집단들로 분류하는 기능을 한다. 또한 요인분석이 다양한 변수들을 소수의 변수묶음으로 단순화하는 반면에, 군집분석은 변수가 아니라 개체를 소수의 집단으로 분류한다. 군집분석은 개체들의 분류체계를 수립하는 경우, 개체를 유사집단으로 분류하는 유용한 개념적 틀 또는 기준을 탐색하는 경우, 기존의 분류기준의 적절성에 대한 가설검정을 하는 경우에 유용하게 활용된다.

군집표집(群集標集: cluster sampling)  모집단에서 표본을 무선적으로 추출하는 확률표집방법 중의 하나로서, 모집단이 위계적 구조를 갖거나, 모집단의 개체들이 상위조직에 속하는 경우에 확률표집단위를 각 개체 (또는 개인)로 하지 않고 개체가 속한 집단 또는 조직체로 하며, 표집된 조직체의 구성원은 모두 표본에 포함하는 무선표집방법.

규준집단(規準集團: norm group)  피험자의 검사점수에 대한 해석을 위하여 참조하는 대상 모집단을 대표하는 피험자 표본. 검사점수의 해석에서 규준집단을 참조하는 목적은 피험자가 규준집단의 점수분포상에서의 상대적 위치 정보(예, 백분위)를 구하기 위한 것이다.

규준참조평가(規準參照評價: norm referenced evaluation)  피험자의 검사점수에 대한 평가를 모집단을 대표하는 피험자 표본집단(즉, 규준집단)의 점수분포상에서 피험자의 상대적 위치 정보로 판단하는 평가방법. 규준참조평가는 통상적으로 상대평가에 해당하며 목표지향평가, 절대평가 또는 준거참조평가와 대비된다.

규준화(規準化: norming)  피험자의 검사점수를 모집단 점수분포에서의 상대적 위치정보로 제시하기 위하여 사용되는 규준 설정과정. 규준(norm)은 모집단을 대표하는 피험자 표본이며, 규준을 설정하는 방법은 검사점수에 의미부여를 적절히 하기 위하여 필요에 따라, 백분위 점수, 표준점수 등을 사용하여, 학년규준, 성별규준, 지역규준, 국가규준 등으로 제시한다.

균형설계(均衡設計: balanced design)  통계학에서 분석자료의 사례수 또는 처치의 횟수나 비율이 집단간에 동일한 실험설계법. 균형설계에 의한 자료는 전통적인 통계모형의 가정인 처치간의 독립성을 보장하고, 비교집단들의 집단내 분산의 동질성을 확보하는데 유용하여 확률에 의한 통계적 가설검정을 정확히 하는 장점이 있다.

극단치(極端値: outlier)  통계적 자료분석의 결과를 왜곡시키거나, 자료분석의 적절성을 위협하는 변수 값 또는 사례. 기술통계학적 기법에서는 분포의 집중경향치의 값을 왜곡시키거나, 상관계수 추정치의 값을 왜곡시키는 개체 또는 변수의 값을 의미한다. 추리통계에서는 모수 추정치의 값을 왜곡시키는 개체 또는 변수의 값이며, 통상적으로 표준화된 잔차의 분석에서 개체의 변수값이 0(평균)으로부터

기술통계학(記述統計學: descriptive statistics)  실제 현상을 요약하고 설명하기 위하여, 수집된 자료를 요약하거나 조직화하고 기술하는 통계적 방법을 총괄하는 것으로 수집된 자료의 특성 및 변수들간의 관계에 대한 정보. 기술통계학에서는 평균, 표준편차, 상관계수 등의 통계량으로 자료분포의 특성을 기술하는 방법과 돗수분포, 히스토그램, box-plot, stem-and-leaf, 산포도 등의 그림으로 자료의 특성을 요약하는 방법이 있다.

기초연구(基礎硏究: basic research)연구의 목적이 실제문제의 해결에 관련된 정보제공에 있지 아니하고, 학술적이고 과학적 이론의 기초정보를 제공하기 위한 연구. 기초연구는 이론적 연구를 지칭하는 경우와 단순히 전문적인 연구를 위한 사전단계로 광범위한 자료수집을 수행하는 연구를 의미한다.

내성법(內省法/내관법: introspection)  자신의 정신적, 심리적 상태나 기능을 스스로 관찰하여 보고한 자료를 분석하는 방법. 자신을 관찰하여 보고한다는 의미에서 내관법 또는 자기 성찰법 이라고도 한다. 심리학 발전 초기에 Wundt와 Tichener의 구조주의에서 인간의 의식을 연구하기 위하여 체계적으로 사용되기 시작했으나 반응의 신뢰성과 타당성의 문제로 객관적인 과학적 방법이 되지 못한다는 비판을 받아왔다.

내용분석(內容分析: content analysis)  관심의 대상이 되는 속성을 포함하는 모든 자료의 내용을 체계적으로 분류하는 분석행위. 내용분석은 원래 의사소통의 과정에서 발생하는 누가, 무엇을, 누구에게, 어떻게 전달하며 그 효과는 무엇인가의 문제를 확인하고 분석하기 위해 개발된 방법이었으나 현재는 사회과학 전 분야에 도입되어 사용되고 있다. 분석절차는 먼저 내용의 분석대상 모집단(예를 들어, 사회과 교재 내용, 공격적 행동)을 정의하고 유목화한다. 유목화할 때는 분석 단위를 단어, 주제, 속성 등으로 결정할 수 있다. 그리고 나서 수량화화는 과정이 필요한 경우 빈도표를 작성하거나 서열화, 평정 등의 방법을 사용한다. 내용분석은 질적 연구에서 방법론으로 많이 사용되고 있다.

  교수-학습활동, 검사개발에서 내용분석은 검사, 교과, 교재, 업무의 내용을 체계적으로 분류하는 분석행위를 의미하며, 교재의 내용이 교육목표를 반영하는 정도를 파악하는데 유용하며, 검사개발에서는 검사를 구성하는 문항들이 학습영역 또는 교재내용을 적절히 반영하는지를 판단하는데 유용하다.

내용타당도(內容妥當度: content validity)  검사가 측정대상인 심리적 특성의 내용이나, 교과내용 또는 학습내용의 전집을 얼마나 적절히 반영하는가를 나타내는 검사의 양호도 정보. 내용타당도는 특히 성취도 검사에서 강조된다. 성취도 검사가 내용타당도를 확보하는 방법은 교육목표 명세화표를 검사문항의 작성과정과 검사문항편집과정에서 활용하는 것이며, 검사문항이 측정대상인 내용을 측정하는가에 대한 교과내용 전문가들의 논리적 판단이 일치하는 정도로 내용타당도를 표현한다. 심리검사에서 내용타당도는 이론적 배경에 근거를 두고 문항을 작성하여 관련전문가들의 검토결과가 일치하는 정도로 확보할 수 있다.

내재설계(內在設計: nested design)  실험설계에서 처치의 효과가 특정집단에만 나타나도록 설계하는 방법. 또는 처치간의 상호작용이 발생하지 않는 설계방법. 내재설계는 위계적 설계(hierarchical design)로도 표현되며, 자료의 구조가 위계적이어서 하위단계의 처치나 개체는 상위단계의 집단에 귀속되어 처치집단간의 상호작용이 발생하지 않는다.

내적타당도(內的妥當度: internal validity)  연구결과에 대한 해석 또는 의미부여의 적절성을 반영하는 연구의 양호도 정보로서 연구결과의 해석이 연구전체의 절차나 내용전개에서 논리적으로 결함이 없는가를 판단하는 정보. 내적타당도는 실험연구에서 강조되며 독립변수 또는 처치변수의 종속변수에 대한 효과 또는 영향에 따른 잡음변수의 개입가능성을 적절히 통제하였는가로 판단한다. 내적타당도는 외적타당도와 대비된다.

내적합치도(內的合致度: internal consistency)  검사점수의 양호도 정보인 신뢰도 중에서 한 검사를 구성하는 문항들을 각각 독립된 검사로 간주하여 그 문항들이 동일 측정대상을 어느 정도 일관성 있게 측정하는지를 반영하는 신뢰도. 내적합치도 계수를 추정하는 방법은 반분신뢰도, KR-20, KR-21, Chronbach-α 등이 있으며, 단일 검사시행으로 신뢰도를 추정하는 장점이 있다.

논술검사(論述檢査: essay test)  피험자의 인지적 능력을 측정하기 위한 검사로서 특히 분석력, 종합력, 창의력 등의 고등정신능력을 측정하기 위한 검사. 논술검사는 답안의 기대내용에 대한 지침을 제공하는 제한형과 답안의 기대내용에 대한 지침이 없이 피험자가 답안을 작성하는 개방형이 있다. 논술검사를 학업성취도 검사로 사용하는 경우에는 검사문항의 수가 제한되어 내용 타당도에 결함이 있으며, 측정대상인 구인의 정의가 모호한 단점이 있다. 논술검사의 채점에는 분석적 방법과 총체적 방법이 있으며, 객관식 검사와는 달리 검사점수에 채점자의 주관이 개입될 가능성이 높다.

다각화(多角化: triangulation)  실험 연구에서 결과변수를 측정할 때 편파성 문제를 해결하기 위해 다양한 조작적 정의와 자료수집 방법을 적용하는 접근 방법.  하나의 조작적 정의에 의한 결과 변수에 대한 측정이나 한번의 자료 수집에서 나온 결과는 편파적이기 쉽기 때문에 연구의 타당도를 증진시키기 위한 전략으로 사용한다.

다변량분산분석(多變量分散分析: multivariate analysis of variance: MANOVA)  추리통계학에서 종속변수가 두 개 이상인 경우에 종속변수들의 평균벡터의 차이로 집단간의 차이를 검정하는 통계적 기법. 다변량 분산분석은 하나의 종속변수의 평균에 대하여 집단간의 차이를 검정하는 분산분석(Analysis of Variance: ANOVA)을 복수의 종속변수에 대한 집단간의 차이를 검정하는 것으로 일반화한 방법이라고 할 수 있다. 즉 복수의 집단평균을 동시에 비교하는 통계적 기법이다. 다변량 분산분석은 복수의 종속변수를 동시에 비교하는 효과뿐만 아니라, 복수의 종속변수가 상관이 있는 경우에는 종속변수간의 상관을 자료분석에 반영하며, 복수의 종속변수를 보다 적은 수의 요인으로 제시하려는 경우, 복수의 종속변수 중에서 집단간의 차이를 변별하는 종속변수를 선정하려는 경우에도 활용된다. 복수의 종속변수가 상호 독립인 경우에도 MANOVA는 제1종 오류의 수준을 연구자가 설정한 수준에서 통제하는 효과가 있다.

다요인적 적성검사(多要因的 適性檢査: Multifactor aptitude battery)  측정대상인 적성이 여러 요인의 복합체로 구성되어 있는 종합능력구인인 경우에 각 구인별로 검사점수를 산출하여 개인의 종합적 능력에 대한 프로파일 정보를 제공하는 적성검사. 다요인적 적성검사는 개인의 적성에 적합한 직업의 선택, 또는 진로개발을 위한 교육적 정보를 구하기 위하여 활용되므로, 검사점수의 정보가 보다 구체적이고 실제적이다. 대표적인 검사들은 고교생의 진로개발을 위한 차별적성검사(Differential Aptitude Tests: DAT), 군복무적성을 판별하기 위한 군복무직업적성검사(Armed Services Vocational Aptitude Battery:ASVAB), 광범위한 직업의 직무수행에서 요구되는 심리학적 특성을 분석하여 개인의 적성에 알맞는 직업관련 정보를 제공하는 일반적성검사(General Aptitude Test Battery:GATB) 등이 있다.

다차원 척도법(多次元 尺度法: multidimensonal scaling)  자료의 구성원인 개체들을 다차원공간상에서의 척도에 위치시키고, 개체들간의 유사성, 근접성등을 측정하여 개체들 간의 숨겨진 구조적 관계를 파악하여 소수의 차원으로 설명하거나, 구조적 관계에 대한 이론적 의미를 부여하는 방법. 개체들 간의 구조적 관계는 곧 다차원척도법에 의하여 밝혀진 소수의 차원으로 설명되며, 동일차원에 속하는 변수들은 척도를 개발하는데 활용된다.

다층모형(多層模型: multilevel model)  다층자료(multilevel data)의 분석을 위하여 1980년대에 교육통계학자들이 개발한 일반선형모형(general linear model). 다층자료는 전통적으로 위계적 자료(hierarchical data) 혹은 내재적 자료(nested data)로 지칭되는 자료이며, 위계적 구조의 자료에서 하위층 분석단위(예, 개인)와 상위층 분석단위(예, 집단)에서 모두 복수의 예측변수들이 존재하는 자료이다. 분석대상인 자료가 다층자료인 경우에는 종속변수의 값이 개인(1 층위 분석단위)의 특성과 집단(2 층위 분석단위)의 특성에 모두 영향을 받으며, 이에 대한 전통적 방법(예, 분산분석, 회귀분석)에 의한 자료분석은 분석단위의 선택, 측정치의 독립성 가정, 측정치의 표준오차, 혼재변수(confounding variables)의 통제, 층위간 상호작용 등에서 통계학적, 방법론적인 제한점이 발생한다. 다층모형은 위계적 자료의 분석에서 전통적인 통계적 방법의 제한점을 극복하기 위하여 개발된 것으로, 위계적 계층이 2단계인 자료분석을 위한 이층모형(2-level model), 3단계 자료분석을 위한 3층모형(3-level model), 구성원이 동시에 두 개 이상의 집단에 귀속되는 자료분석을 위한 교차적 다층모형(crossed multilevel model) 등이 개발되어 있다. 자료분석을 위한 통계 프로그램으로는 HLM(Hierarchical Linear Models), ML2(Multilevel-2), ML3(Multilevel-3), VARCL, GENMOD 등이 있다.

다층분석(多層分析: multilevel analysis)  위계적 자료 혹은 내재적 자료의 구조를 다층적으로 파악하여 하는 자료분석. 본질적으로 종속변수의 분산을 자료의 위계적 단계별로 분산성분을 분해하여 추정하고, 각 위계적 단계에서의 분산을 각 단계의 예측변수와 층위간 예측변수의 상호작용으로 설명하는 자료분석방법을 의미한다.  통상적으로 다층모형에 의한 자료분석을 지칭한다.

다특성-다방법(多特性-多方法: multitrait-multimethod)  구인타당도를 제시하는 방법의 하나로서 Campbell과 Fiske(1959)가 제시한 것으로서 두 개 이상의 구인에 대하여 각각 두가지 이상의 측정방법으로 측정하는 경우에, 각 검사점수들간의 상관계수들이 나타나는 양상이 구인에 대한 이론적 예측을 얼마나 반영하는지를 상관계수 행렬로 제시하는 방법. 동일한 특성에 대하여 상이한 측정방법으로 구한 검사점수간의 상관은 높을 것이며(수렴타당도), 상이한 특성(구인)을 측정한 검사점수간의 상관은 낮을 것이라는 예측(변별타당도)이 가능하다. 다특성-다방법에 의한 타당도에 대한 결과제시방법은 특성과 측정방법의 조합 수 만큼을 행렬의 차원으로 표시하여 제시한다. 즉 2개의 특성에 대하여 2가지 방법으로 측정한 경우에 다특성-다방법의 결과는 4 × 4의 상관행렬로 나타나며, 동일 특성에 대한 동일 측정방법의 상관은 1.0이므로, 행렬의 대각선에 해당하는 부분은 신뢰도로 제시한다.

단변량분석(單變量分析: univariate analysis)  통계학에서 자료를 분석하는 경우에 기술통계학에서는 기술대상인 변수가 하나이고, 추리통계학에서는 종속변수가 하나인 경우를 의미한다. 흔히 기술통계학에서 단변량분석은 한 가지 변수의 특성을 요약하고 설명하기 위하여 그 변수의 분포, 집중경향치 등을 구하는 것을 의미하며, 추리통계학에서는 하나의 종속변수를 설명하기 위한 다양한 통계적 방법에 의한 자료분석을 총괄한다. t-검정, 분산분석(ANOVA), 회귀분석(Regression) 등에 의한 자료분석은 단변량분석에 해당한다. 단변량분석의 상대적 개념을 나타내는 용어는 다변량분석이다.

단순주효과(單純主效果: simple main effect)  다원분산분석(multi-factor ANOVA)에서 독립변수간의 상호작용이 유의한 경우, 하나의 독립변수의 각 수준에서 나타나는 다른 독립변수의 주효과. 예를 들면, 이원분산분석에서 한 독립변수는 교수방법으로서 세 가지의 교수방법이 있고, 다른 독립변수는 교사의 성별이며, 이들 사이에 상호작용이 존재한다면, 남자교사의 수준에서 세가지의 교수방법의 효과를 비교하여 해석하고 또한 여자교사의 수준에서 세 가지 교수방법의 효과를 비교하여 해석하는 것은 단순주효과 개념을 이용하여 해석하는 것이다.

단일집단연구설계(單一集團硏究設計: single-subject research design)  통제집단 없이 단 하나의 실험 집단만을 두는 설계. 이 설계에는 한 피험자 집단에게 처치를 가하고 이에 따른 피험자의 행동을 관찰하여 실험처치의 효과를 평가하는 단일사례연구법(one-shot case study)과, 한 피험자 집단에게 처치를 가하기 전과 후에 피험자의 행동을 관찰하는 단일집단 사전 사후 연구법(The one-group pretest-posttest design)이 있으나, 대체로 인과관계를 밝히는 데 목적을 둔 과학적인 연구설계라고 보기 어렵다.

대안적 평가(代案的 評價 : alternative assessment)  한 시대의 주류를 이루는 평가체제와 성질을 달리하는 평가체제. 20세기초이래 주류를 이루었던 선택형문항으로 구성된 표준화검사를 이용한 평가에 대한 대안적평가로 피평가자의 수행, 산출물, 태도나 가치 등을 가능한 한 실제 생활과 관련지어 평가하는 참평가, 수행평가 등의 평가체제를 들 수 있다.

델파이 방법(델파이 方法: delphi technique)   전문가 집단의 의견과 판단을 추출하고 종합하기 위하여 동일한 전문가 집단에게 설문조사를 단계별로 실시하여 집단의 의견을 종합하고 정리하는 연구기법.  이 방법의 연구기법으로서의 타당성은 계량적 객관의 원리와 민주적 의사결정의 원리를 활용한다는 것에 논리적 근거를 두고 있다. 이 방법은 체계적으로 구성된 일련의 설문지를 동일한 사람에게 3~4회 반복실시하게 되는데 , 각 회의 설문지를 전회의 설문조사 결과에 대한 보고와 함께 제시함으로써, 설문조사 응답자에게 다른 사람들의 정보와 의견이 환류될 수 있도록 고안된 방법이다. 설문의 횟수가 거듭될수록 예측 혹은 응답결과가 서로 접근하게 되므로 참가자들이 시간과 공간의 제약을 받으며 직접 모여 논쟁을 하지 않고서도 집단성원의 합의를 유도해낼 수 있는 조사방법이다.

동간척도(同間尺度: interval scale)  척도의 한 유형으로서, 점수의 단위들이 척도상의 모든 위치에서 동일한 값을 지니는 척도. 예를 들어, 학업성취도에서 90점과 100점 사이의 10점의 크기는 50점과 60점의 10점의 차이와 같다. 동간척도에서는 가감의 연산이 가능하므로 다른 척도로의 변환이 용이한데다, 일반적으로 흔히 사용되는 통계들이 측정의 동간성을 가정하고 있기 때문에 심리학자나 교육학자들은 동간척도를 얻는데 관심이 많다.

동세대집단분석 (同世代集團分析: cohort analysis)  독일의 심리학자 발테스(Paul Baltes, 1983)가 제안한 인간발달에 관한 연구방법으로서 발달에 미치는 사회적․역사적 영향(예; 홍역예방접종의 발달)을 밝히기 위해 고안된 설계. 출생동시집단설계(cohort design)라고도 한다. 이 설계의 기본 가정은 출생연도가 서로 다른 사람들은 상이한 사회적․역사적 환경의 영향을 받기 때문에 서로 다른 시기에 태어난 출생동시집단들을 동일 연령이 되었을 때 측정한 결과를  비교해 봄으로써 출생연도에 따른 발달특성을 기술, 설명, 예측하는 데 목적이 있다.

동료평정방법(同僚評定方法: peer appraisal method)  집단 구성원의 특성 및 과업수행수준에 대하여 동일집단의 구성원들이 평가하는 방법.이 평가방법은 특히 한 개인의 인성적,사회적 발달을 평가하는 데 사용된다. 구체적인 방법으로는 행동특성을 기술한 진술문에 대해 가장 적합한 사람을 쓰게 하는 추인법(guess who technique)과 어떤 상황에서 무언가를 같이 하고 싶은 사람과 그렇지 않은 사람을 쓰게하는 사회성측정법 (sociometric technique)이 있다. 이 방법에서는 모든 구성원이 서로에 의해 평가되므로 특히 한 개인의 사회적 적응이나 구성원들에 의해 수용되어지는 정도를 파악하는 데 도움이 된다.

동형검사(同形檢査: alternate-form / equivalent form of testing)  검사의 성격이나 목표, 구성내용, 문항수, 검사실시과정, 문항의 난이도와 변별도 등 모든 면에서 동일한 또 하나의 검사. 고전검사이론에서 검사의 신뢰도를 계산하기 위해서, 같은 응답자들에게 처음에 하나의 양식(form)을 실시한 다음 일정한 시간이 지난후 실시되는 다른, 그러나 “동등한” 양식을 지칭한다. 처음 양식에서 얻은 점수와 두 번째 양식에서 얻은 점수간 상관계수가 동형검사 신뢰도이다. “동등한” 양식은 "parallel forms", “alternate-forms” 등으로 표기되고 있으나 기본정신은 신뢰도의 정의에 깔려있는 평행성(parallelism, parallel measurement)이다. 따라서 “동등한” 양식의 바람직한 형태는 처음 양식과 문항수, 문항표현방식, 문항 내용, 문항들의 난이도, 실시상의 지시문, 시간제한, 예제 등이 같아야 한다.  동형검사는 동일한 검사를 두번 실시해야 하는 경우 순수하게 측정하려는 변인외에 기억, 학습효과 등의 측정상의 오류를 방지하기 위해서 사용한다.

등분산성(等分散性: homoscedasticity)  어떤 통계모형에서 정의된 잔차(오차)항의 분산이 독립변수나 예측변수의 각 관찰값에서 동일한 값을 보이는 성질. 동분산성이라고도 한다. 일반적으로 사용되는 분산분석에서의 등분산성은 분석단위(실험요인이 1개일 경우 집단, 2개 이상 요인일 경우, 집단(cell)) 내의 분산이 모든 단위에 걸쳐 같을 것을 의미한다. 일반적으로 사용되는 회귀분석에서의 등분산성은 예측변수(보통은 X)의 값에 대응하는 종속변수(Y)의 분산이, 예측변수의 모든 값에 대해서 같을 것을 의미한다. 등분산성의 위반이 가져오는 결과, 즉 의사결정시 오류확률의 증감은 분산분석의 경우 요인의 수효, 특정집단이나 분산이 특별히 크거나 작은 정도, 실험설계가 불균형한 정도에 따라 다르다. 회귀분석의 경우에는 잔차(residual)가 종속변수 예측치()의 증가에 따라 함께 증가하는 경우PICC.gif" wi

등위상관(계수)(等位相關係數: rank correlation (coefficient))  두 변수간 상관을 구함에 있어서 각 변수의 자료가 자체내에서 서열이 매겨진 상태를 분석자료로 하여 계산되는 상관(계수). 서열상관(계수)라고도 함. 변수내 서열을 매김에 있어서 동일한 서열이 많지 않을 경우 아래와 같은 간편공식을 사용할 수 있다.                                      N : 표본크기,                                       d : 두 변수간에 대응되는 서열들간의 차이위 공식은 원래는 피어슨(적률)의 상관공식을 간편화한 것이다. 따라서 각 변수내에 동일한 서열이 많을 경우에는 위의 간편공식보다는 피어슨 공식을 사용하는 것이 바람직한다.

라틴정방형 설계(라틴正方形 設計: latin square design)  실험설계에서 사전에 통제할 두 요인(two nuisance factors)을 하나는 종축, 다른 하나는 횡축으로 처치의 수 만큼 설정하고, 종축과 횡축 안에서 각 처치를 무선적으로 배정하여, 각 처치가 횡열과 종열에서 단 한번씩만 나타내게 설계하는 것이다. 무선구획설계(Randomized Block Design)가 횡열에서만 잡음변수의 효과를 통제한다면, 라틴정방형설계는 횡열과 종열에서 모두 잡음변수를 통제한다고 할 수 있다. 이 설계를 활용하는 실제적 주요 목적은 복수의 처치를 동일 대상에게 반복실시하는 경우에 처치의 이월효과(carryover effect) 또는 순서효과까지 통제하려는데 있다.

로르샤잉크반점검사(로르샤잉크半點檢査: rorschach inkblot test)스위스의 정신치료학자인 Hermann Rorschach(1884~1922)에 의해 개발된 투사적 기법의 성격검사. 이 방법의 기본 전제는 인간은 모호한 자극에 대해 반응할 때 자신의 내적인 상태나 특성을 투사하기 때문에 이러한 반응을 분석하면 그 개인의 성격이나 심리적 특성을 파악할 수 있다는 것이다. 검사방법은 대칭적인(반으로 접으면 거울상으로 됨) 잉크반점으로 구성된 10개의 카드를 한번에 하나씩 피험자에게 보여주면서 각각의 그림이 무엇처럼 보이는지, 왜 그렇게 생각했는지 등을 물어봄으로써, 피험자의 심리상태를 파악해 보려는 것이다. 이 과정에서, 카드제시 후 첫 피험자 반응이 나타나기까지의 시간, 기타 피험자들의 우연적인 반응들이 심리상태 파악에 중요한 정보원이 된다.

리커트척도(리커트尺度: Likert-type scale)  특정대상에 대한 개인의 태도 즉, 생각, 지각, 감정 등을 측정하는 데 사용되는 척도의 한 유형으로서 1930년대 초 Resis Likert에 의해 개발된 척도임. 피험자는 측정대상(예:체벌)에 대한 태도를 측정하는 것으로 간주되는 일련의 문항들에 대해 “강한 찬성, 찬성, 중간, 반대, 강한 반대” 등의 다섯 가지 눈금 중 하나에 자신의 견해를 표시하게 되고 이 결과 각 문항의 눈금치의 총점 혹은 그것을 문항수로 나누어 얻은 평균값을 특정 대상에 대한 개인의 태도 점수로 보는 것이다. 대체로 눈금은 4개에서 7개 사이가 많이 쓰이나 응답자의 지적 수준이나 문항에 대한 친숙도 수준이 낮을 경우는 눈금의 수가 적은 것이 더 신뢰있는 결과를 얻을 수 있다.

망조직 분석(網組織 分析: network analysis) 사회 및 행동과학분야에서 사용되는 연구방법들 중의 하나인 데, 사회현상이나 특정집단내의 인간의 행태를 이해하려면 각 구성원의 특성뿐 아니라 구성원 상호간의 관계를 같이 고려해야 한다는 입장에서, 구성원과 구성원간의 관계를 각각 점과 점들 사이의 선분으로 표시한 망조직을 사용하는 통계적 분석방법을 말함. 구성원간의 관계는 동일학급 학생들 사이의 친구관계, 국가나 기업체간의 거래관계 등을 예로 들 수 있으며, 점들 사이의 연결은 구성원간의 관계의 특성에 따라서 선분, 화살표, 또는 쌍방화살표로 표시된다.

 매개변수(媒介變數: intervening variable)  변수들간의 함수적 관계를 설명할 때, 두 변수간의 사이에서 앞의 변수와 뒤의 변수를 연계하는 변수. 실험연구에서는 연구 대상이 되는 독립변수와 종속변수 사이에서 작용하여 종속변수에 영향을 미치는 피험자의 심리적 특성과 같은 가설적인 개념이다. 예로서 A→B→C에서 B가 매개변수로서, A의 효과가 B를 거쳐서 C에 전달되고 있다. 물론 A가 C에 직접 연결될 수도 있다. 그러나 전체적으로 또는 부분적으로 A의 움직임은 일단 B에 효과를 미치고, 이어서 B가 C에 미치는 효과가 발생할 때 B는 A와 C사이에 매개변수이다. 만일에 A가 C에 미치는 효과, 즉 A→C가 B의 수준(예: 성차이, 나이차이 등)에 따라 달라지면 B를 조절변수(moderator)라고 하는데, 방법론에 비전문적인 영미문헌에서 이 글에서의 매개변수와 조절변수를 통털어서 "intervening variable"로 기술하는 경우가 있는데 정확한 기술은 아니다.

메타분석 (메타分析: meta analysis)  동일한 연구문제에 대한 누적된 연구결과들을 종합적으로 검토하는 계량적 연구방법으로서, 기존의 문헌연구에서 연구자의 주관적 견해에 따른 연구의 편파성을 극복하고 선행연구들의 결과를 객관적으로 요약하기 위한 통계적 방법. 메타분석에서는 분석의 대상이 선행된 개별연구들이며, 각 연구에서 연구변수들의 효과크기(: effect size)를 산출하여 효과규모가 연구들 사이에 통계적으로 유의미한 분산이 있는가를 검정하고, 유의미한 분산이 발견되는 경우에는 효과크기에 영향을 미치는 연구설계요인을 통계적 검정절차를 거쳐서 밝히는 분석을 시행한다. 학자에 따라서는 통계적 가설검정절차 없이 효과크기들의 기술통계량만으로 연검정절차를 거쳐서 밝히는 분석을 시행한다

면접(面接, interview)  연구에서 알아내려는 내용을 연구대상자들에게 직접 질문하여 얻은 자료를 분석하는 연구방법.  대상자들에게 직접 질문하여 자료를 수집하기 때문에 질문하는 방법에 따라 몇 가지 유형으로 구분된다. 면접시 질문내용을 미리 결정하여 제시하는 구조화된 면접방법과 면접 진행상황에 따라 질문의 내용을 신축적으로 조정하는 비구조화 면접이 있다. 또한 면접 인원과 관련하여 개인 대 개인, 개인 대 집단, 집단 대 개인, 집단 대 집단 면접 방법이 있을 수 있으며, 상황에 따라서는 전화면접도 가능하다.  면접법은 면접자의 주관적 판단이 개입될 여지가 많기 때문에 자료 수집과 결과 해석의 객관성을 유지하기 위한 특별한 노력이 필요하다.  어떤 형태의 면접이라도 그 면접이 가치가 있기 위해서는, ① 면접을 통해서 신뢰할만한 평정이 나올 수 있는가?  ② 면접으로부터 알아보려는 내용이 꼭 면접에 의해서만 얻을 수 있는 정보인가?  ③ 측정도구로서의 면접의 타당성은 어느 정도인가? 등이 사전에 ‘면접’ 사용에 대한 중요한 평가기준으로 고려되어야 한다.

명명척도(命名尺度: nominal scale)  측정대상의 속성을 질적인 특성으로 구분하는 척도. 명명척도는 질적 척도이기 때문에 척도의 수치가 측정대상의 크기나 순서를 나타내지 않고 단지 속성을 구분하기 위한 목적에서 사용한다. 예를 들어, 사람을 남자, 여자로 나누거나 종교를 기독교, 불교, 유교, 등으로 구분하여 명명하여 척도로 사용하는 경우를 말한다.

모수적 통계검정(母數的 統計檢定: parametric statistical tests)  추리통계에서 모집단의 특성인 모수(parameter)에 대한 추리를 할 때, 모집단의 분포에 대한 가정을 포함하는 통계적 방법. 교육 및 심리연구에서는 대부분의 모집단의 분포는 정규분포를 가정한다. 모수적 통계방법은 모집단의 분포에 대하여 가정을 하지 않는 비모수적 통계검정(non-parametric statistical tests)과 대비되는 검정방법이다. F 검증, t 검증, 정상분포에 의한 Z 검증 등의 통계적 방법이 모수적 통계검정에 해당된다.

모집단(母集團: population)  얻어진 통계치의 의미를 일반화하여 적용하고자 하는 전체 집단. 연구자의 관심이 그 범주를 결정한다.  예를 들어 특정 연도의 모 초등학교 6학년 1반 학생들을 대상으로 하는 특정 현장연구에서의 관심 대상은 그 학급에 제한되며, 이 학급이 유한전집이다. 그러나 국제비교 연구에서 6학년 학업성취도 비교를 하고자 한다면 무한전집을 상정해야 할 것이다. 앞의 두 예는 실재하는 전집의 예이다. 그러나 모 초등학교에서 실시하는 컴퓨터 개별수업을 이수하는 6학년 학생이라면, 과거부터 미래까지 있을 수 있는 가상적 학생들을 포함하는 가상적 무한전집을 상정해야 할 것이다. 전집의 구성 요소를 모두 분석할 경우에는 기술통계로써 연구자의 관심을 충족시킬 수 있지만, 전집의 부분집합을 표집하여 분석한 경우에는 추리통계를 거쳐야 연구자의 관심을 충족할 수 있다.

목표정보함수(目標情報函數: target information function)   검사 제작에 있어서 각 능력수준에 대해서 도달하고자 하는 검사정보량을 나타낸 함수.문항반응이론하에서 피험자모수의 추정오차가 일정수준이하가 되도록 할 때, 이에 해당하는 검사정보량을 정할 수 있다. 추정오차한계가 넓은 능력수준에 걸쳐서 일정하면 목표정보함수의 그래프는 평평한 모양이 된다. 문항정보함수를 참고할 것.

목표중심평가(目標中心評價: goal-based evaluation)  프로그램의 목표를 프로그램 평가의 준거로 삼는 평가방법. 교육평가를 교육프로그램이나 수업에 의하여 교육목표가 어느 정도 성취되었는가를 결정하는 과정이라는 R. Tyler의 가치판단론적 정의에 입각한 평가방법이다. 목표중심평가모형에는 Tyler의 목표달성평가모형, Provus의 격차평가모형, Hammond의 삼차원구조모형 등이 있으며, 의사결정자에게 정보제공을 목적으로하는 의사결정모형과 대비된다.  개인수준에서의 목표중심평가는 개인에 대한 평가를 세분화된 행동준거에 터해서 하는 것을 의미하며 준거참조평가(criterion referenced evaluation)로도 부른다. 이 평가는 집단내에서의 개인의 상대적 위치를 파악하거나 개인의 능력을 변별하는 것은 중요하지 않고, 다만 특정 목표의 달성정도를 확인하고자 할 때 사용되는 것으로 목표의 설정이 중요한 과제가 된다.

목표참조검사(目標參照檢査: objective-referenced test)  검사점수의 해석을 사전에 명세화된 목표를 참조하여 해석하는 검사. 준거관련검사(criterion-referenced test) 혹은 목표지향검사(objective based test)라고도 부르며 규준관련검사(norm-referenced test)와 대비된다. 목표참조검사의 점수는 명세화된 학습목표를 기준으로 하여 피험자가 어느 정도 학습목표를 달성하였는가 또는 학생이 무엇을 할 수 있는가에 대한 정보를 제공한다. 목표참조검사는 교수과정에서 학생에게 피드백을 제공하고, 교수를 설계한 사람이나 교수-학습과정의 평가자에게 도움이 되는 정보를 제공하기 위해 고안된 검사이다.

무선오차(無選誤差: random error/random variance)  우연에 의해 생겨나는 측정치들의 변화. 무선변량이라고도 한다. 무선오차는 분산의 한 유형으로서 일반적으로 실험결과 자료분석에서 얻게되는 분산은 체계적인 분산과 무선적 분산으로 구분된다. 체계적인 분산은 처치를 가함(예; 학업성취도에 긍정적인 영향을 미치는 교사의 특정 수업기법의 적용)으로 인해 측정되는 분산이고, 무선분산(혹은 오류분산, error variance)은 우연에 의해 생기는 측정상의 변화이다. 분산분석의 경우 전체분산 = 집단간 분산 + 집단내 분산으로 표시되는데, 이 때 집단내 분산이 무선분산에 속한다.

무선요인(無選要因: random factor)   통계적 자료분석에 포함되는 변수 중에서 변수의 효과가 무선효과(random effects)를 갖는 변수. 무선효과를 갖는 변수는 표본에 따라 변수의 값이 변하므로 변수의 효과가 어느 정도 분산을 갖는가로 그 영향을 추정하여 변수의 특성을 해석한다. 무선요인은 고정효과요인과 대비되는 개념으로, 고정효과요인은 변수의 효과를 고정된 것으로 추정하여 변수의 특성을 해석한다. 흔히 고정효과 통계모형에서는 오차항 만이 무선효과로 분류되고, 무선효과모형과 혼합효과모형에서는 독립변수 또는 예측변수도 무선효과를 갖는 경우가 있다.

무선표집(無選標集, random sampling)  모집단의 모든 개체가 표본에 포함될 확률이 동일하고 또한 각 개체의 표집시행간에 상호독립이 보장되는 표본 선정 절차. 모집단을 잘 대표하는 표본을 얻는 데 효과적인 방법이다. 무선표집에 의하여 얻어진 무선표본 자료의 분석결과는 모집단 전체에 일반화가 가능하다. 무선표집에는 단순무선표집(simple random sampling), 층화무선표집(stratified random sampling), 그리고 군집표집(cluster sampling)이 있다.

무선화 구획설계(無選化 區劃設計: randomized block design)  실험설계기법 중의 하나로 피험자를 각 집단에 무선배치(random assignment)하여 비교집단간의 동등성을 확보하는 과정에서 추가적으로 구획을 설정하여 동일 구획내에서는 각 집단에 동질적인 피험자들이 배치되도록 하는 방법. 무선화 구획설계에서는 구획은 종속변수와 상관이 높은 변수를 기준으로 설정되므로 구획내의 피험자들은 반응(종속변수의 값)이 동질적이고 집단내 분산을 구획에 의한 분산과 오차분산으로 분리하는 효과가 있다. 따라서 가설검정을 위한 오차분산(집단내 평균자승합)이 축소되어 가설검정력을 높이는 효과가 있다.

무선화 집단설계(無選化 集團設計: randomized group design)  실험설계에서 처치를 실행하기 전에 비교집단간에 동등성을 확보하기 위하여 각 비교집단에 피험자를 무선배치(random assignment)하는 가장 단순한 형태의 실험설계기법. 실험설계의 목적은 인과관계에 대한 추론을 하기 위한 것이므로 실험이전에 각 비교집단에 체계적인 편파성의 존재 가능성을 배제하는 것이 중요하다. 무선화 집단설계는 실험후의 결과가 다른 요인의 영향에 의한 것이 아니고 실험의 효과 즉 처치효과에 의한 것이라는 논리적 근거를 제공하는 설계기법 중에서 가장 단순한 형태이다.

무선화 배정(無選化 配定: random assignment)  실험설계에서 처치를 실행하기 전에 비교집단간에 동등성을 확보하기 위하여 각 비교집단에 피험자를 배치하는 방법. 실험설계의 목적은 인과관계에 대한 추론을 하기 위한 것이다. 무선배치는 실험이전에 각 비교집단에 체계적인 편파성의 존재 가능성을 배제하기 위한 것이므로, 실험후의 결과가 다른 요인의 영향에 의한 것이 아니고 실험의 효과 즉 처치효과에 의한 것이라는 논리적 근거를 제공한다. 무선배치를 활용한 실험연구를 참실험연구(true experimental study)라고 한다.

문장완성형검사(文章完成檢査: sentence completion test)  검사문항의 양식이 문장의 일부분만을 제공한 후 나머지 부분을 피검자가 스스로 채우게 하는 검사. 인지능력 검사의 경우에 피검자는 자신이 가지고 있는 지식전체에서 답안을 선택하여 검사문항에 응답하게 된다. 정의적 특성의 검사는 언어적인 재료를 투사적 자극으로 사용하는 방법이다.  피검자가 완성하는 문장을 검토함으로써, 피검자의 현 심리상태를 파악하는 방법으로 예를 들면 다음과 같다. (1) 언젠가 나는   · · · · · · · · · · · · · · · · · ·   이 될 것이다.(2) 나는 내 부모가   · · · · · · · · · · · · · · · · · ·   해 주기를 바란다.일반적으로 이러한 유형의 검사는 개인의 관심, 교육적 열망, 미래의 목표, 두려움, 갈등, 욕구 등에 관한 다양한 정보를 얻는데 유용한 방법이다.

문제은행(問題銀行: item bank)  검사문항, 문항분석결과와 관련정보를 축적한 검사문항자료의 집합체. 문제은행에는 검사문항들과 각 문항의 곤란도, 변별도, 차별반응정보, 제작일시 등 검사제작 및 검사문항의 양호도 관리에 필요한 제반 정보가 축적되어 있어서 검사의 제작, 활용, 평가에 경제적으로 활용되는 가치가 있다.

문항반응이론(問項反應理論: item response theory)  피검자가 어떤 문항에 대하여 특정한 반응을 할 확률을 문항특성 및 능력의 함수로 나타낸 문항분석에 관한 검사이론. 문항반응이론은 간접적으로 측정할 수밖에 없는 잠재적 특성(latent traits)을 측정하기 위해 단일차원성(한 검사를 구성하는 모든 문항은 하나의 잠재적 특성만을 측정해야 한다는 것)과 지역독립성(어느 특정한 검사문항에 대한 반응은 다른 문항에 대한 반응에 영향을 미치지 않는다는 것)을 가정한다. 고전검사이론에 의한 문항분석에서는 결과가 표본에 따라 변동적인 것과 대조적으로 문항반응이론에 의한 분석 결과는 문항모수불변성(문항이 지니고 있는 고유한 특성 때문에 피검자 집단의 특성에 의해서 문항모수 추정치가 변화되지 않는다는 개념)과 능력모수불변성(피험자의 능력은 검사의 특성에 의해서 다르게 추정되지 않고 고유한 능력수준을 갖는다는 개념)이라는 장점 때문에 오늘날 검사개발 현장에서 널리 이용되고 있다.

문항분석(問項分析: item analysis)  검사문항의 제반 기능을 평가하는 작업. 문항분석은 검사문항의 기술적 특성(technical characteristics)을 밝히는 작업으로서 일반적으로 문항의 곤란도, 변별도, 문항의 차별기능, 정답 추측도, 오답에 대한 반응유형의 정보들을 밝히는 작업이다. 문항분석은 전통적 방법과 문항반응이론을 활용한 방법이 있다.

문항특성곡선(問項特性曲線: item characteristic curve)  항마다 답을 맞출 확률을 나타내는 곡선으로 S자 형태를 지닌다. 가로축은 능력을 나타내고 세로축은 답을 맞출 확률을 나타낸다. 가로축은 θ로 표기하는데, 능력이란 거의 없는 상태에서 무한히 높은 범위까지 있을 수 있으나 이를 표준화하여 평균이 0이고 표준편차가 1인 점수로 변환한 값을 나타낸다. 세로축은 능력수준에 따라 문항의 답을 맞출 확률을 P(θ)로 나타내며 범위는 0에서 1이다. 문항특성곡선은 어느 능력수준에 위치하는가를 나타내는 위치지수(문항난이도), 얼마나 가파른가(문항변별도), 아무 것도 모르는 피험자가 우연히 답을 맞출 확률(문항추측도)을 나타낸다.

문화기술적 연구(文化記述的 硏究: ethnographic study)  문화기술지에서 사용하는 참여관찰방식이나 정보제공자 면접방식을 동원하여 한 문화를 서술하는 연구방법. 문화기술적 연구는 현지인 혹은 관찰 대상의 관점에서 그들의 생활방식을 이해하는데 목표를 두는 연구이다.

문화기술지(文化記述誌: ethnography)    인류학자들이 특정 문화권내의 사람들의 행동을 이해하기 위해 있는 그대로를 집중적, 국지적, 장기적으로 기술하여 얻은 산물. 문화기술지는 문화인류학적 연구방법인 참여관찰, 해당문화에 대한 정보제공자 면접방법 등을 통해 이루어진다.

반복연구(反復硏究 : replication study)  연구의 일반화나 이론검증을 위해 선행연구에서 사용한 방법과 동일한 도구와 절차를 새로운 표본을 대상으로 되풀해 보는 연구. 반복연구는 처음 시도한 연구의 내적 타당도와 결과를 확인하는 것 뿐 아니라 이론의 정련과 수정을 할 수 있게 한다.  반복연구는 이전 실험의 결과를 재검증해 줄 수도 있고 반증하는 결과를 제공할 수도 있다.

반복측정설계(反復測定設計: repeated measures design)  동일한 피험자를 여러 가지 상이한 조건하에서 반복하여 측정하는 실험 설계법. 실험분류법 중에서 가장 중요한 구분이 「피험자내 설계」(the within-subject design)와 「피험자간 설계」(the between-subject design)인데, 같은 피험자가 2회 이상의 처치를 받아 측정된다는 의미에서 전자인「피험자내 설계」를 반복측정설계라고 부르기도 한다. 반복측정설계의 장점으로는 오차분산의 감소에 의한 F검정력의 향상과, 필요로 하는 피험자의 수를 줄일 수 있다는 점을 들 수 있다. 이 설계는 시간 경과에 따라 수행 경향이 어떻게 변하는지를 알아보고자 할 때도 사용된다.  그러나 동일한 종속측정치의 반복된 사용은 연습효과에 따른 문제를 야기시킬 수 있다.

반분신뢰도(半分信賴度: split-half reliability)  검사의 신뢰도를 구하는 방법의 하나로서 한 개의 검사를 한 피검자 집단에게 실시한 다음 그것을 적당한 방법에 의해 두 부분으로 나눈 후 이 두 부분을 독립된 검사로 생각하고, 두 부분의 점수들의 상관계수를 가지고 문항들간의 내적 합치도를 알아보는 신뢰도 추정법. 이때 나오는 신뢰도는 검사 전체의 신뢰도가 아닌 반분된 부분 검사 점수 사이의 신뢰도이기 때문에 과소추정되므로, Spearman-Brown 공식을 사용해 전체 검사의 신뢰도계수로 교정한다. (Spearman-Brown의 교정공식 참고.)

반응경향성(反應傾向性: response tendency)  실험이나 검사 내용에 대하여 자신이 생각한 것과는 관계없이 피험자가 어떤 특정한 방향으로 답하려고 하는 경향성. 이러한 경향성을 가진 사람은 여러 가지 문제에 대하여 비슷한 반응을 보이는데, 제시된 답지 중에서 어떤 것을 택해야 할지를 결정하기 어려울 때 이러한 반응을 보여주게 된다. 반응경향성의 결과로 나타나는 현상을 반응편파성(response bias)이라고 부른다. 반응경향성에는 생각 없이 다른 사람의 의견을 따르는 것과 같은 묵종(黙從), 사회적으로 바람직한 것, 추측 그리고 속도 때문에 정확성을 잃거나 반대로 정확성을 기하느라고 속도를 무시하는 것 등의 여러 가지가 있을 수 있다.

백분위(白分位: percentile rank)  주어진 어떤 점수 이하에 놓이는 사례들의 백분율. 예를 들면, 어떤 사람이 시험에서 81점을 받았는데, 그 학급의 50%가 그보다 낮은 점수를 받았다면, 81이라는 점수의 백분위는 50번째라는 것을 의미한다. 백분위는 한 집단에서의 개인의 상대적인 위치를 나타내는데 사용된다.

백분위수(白分位數: centile/percentile/percentile score)  분포에 있는 사례들에 대하여 제시된 백분율이 그 이하에 놓이게 되는 점수. 백분점수(白分點數)라고도 한다. 백분위가 0에서 100사이의 값만 취하는 백분율인 반면, 백분위수(백분점수)는 0에서 100사이의 값만 가질 수 있는 점수는 아니다. 어떤 사람이 중간고사에서 76점을 받았고, 그 학급의 28%가 그 점수 이하에 있다면, 이 사람의 백분위는 28이고, 28번째 백분위수(백분점수)는 76점이다. 다음의 기호 C는 ‘백분위수(백분점수)’를 나타내고, 기호 C옆의 첨자는 ‘백분율’ 또는 ‘백분위’를 가리킨다.                               C50 = 81,     C28 = 76

범문화검사(汎文化檢査: culture-fair/culture-free test)  피검자가 속해 있는 문화 배경의 영향에 따라 점수가 달라지지 않도록 문화 요인을 제거한 검사. 탈문화검사 또는 문화공평검사라고도 한다. 이러한 검사에서는 피험자가 속해 있는 문화배경과는 상관없이 그 문항의 정답을 맞힐 기회가 집단마다 같다는 것을 가정한다.

범위(範圍: range)  가장 간단하고 손쉽게 구할 수 있는 변산도(관찰된 자료가 흩어져 있는 정도) 측정치로서,  한 분포의 최고점과 최저점간의 차이로 계산됨. 범위는 양 극단의 점수에 의해 전적으로 결정되기때문에 신뢰롭지 못하여 자료의 대체적인 예비검토를 위해 사용된다. 사례수가 현저하게 다른 두 분포의 변산도를 비교할 때에는 범위를 사용해서는 안된다.

법칙정립적 접근(法則定立的 接近: nomothetic approach)  서로 다른 개인들을 소수의 대표적 차원으로 구성된 개념 체계 위에서 도상화하기 위하여 법칙과 같은 보편적으로 적용될 수 있는 진술로 엮어낼 수 있는 차원들을 찾아내려는 접근 방법.  1894년 W. Windelband가 제시하고 G. W. Allport의 성격에 관한 저서에 채택된 개념이다. 법칙정립적(nomothetic)이라는 용어의 앞 부분인 'nomos‘는 희랍어로 법(law)을 의미한다. 법칙정립적 접근은 인간의 독특함이 신체적, 생물학적, 그리고 심리학적 법칙들의 산물, 즉 이들 요소들의 혼합물임을 가정한다.  따라서 이 접근에서 각 개인의 행동은 다른 모든 개인들에게서도 같은 식으로 나타나는 일반적인 차원들로 기술될 수 있고, 또한 일반적인 법칙을 빌어 개인의 행동을 설명할 수 있다. 이러한 접근은 인간의 독특함이 각자의 독특한 생과 경험만으로 이해될 수 있다고 보는 개인차적 접근(idiographic approach)과는 대조되는 접근이다.

베이즈통계학(베이즈統計學: Bayesian statistics)  1763년 영국인 베이즈가 제시한 통계적 방법으로, 표본에서 얻은 정보 뿐 아니라 사전지식이나 정보를 포함시켜 사후 확률을 결정하는 통계학의 한 분류로서 전통적으로 상대도수 분포를 확률로 사용하는 통계학과 구분된다. 일종의 조건확률을 다루는 통계학이다. 베이즈 통계학의 장점은 사전 정보의 이용에 있으나, 사전정보를 객관적으로 확률분포화 하는 방법에는 다양한 견해가 있다.

변별도지수(辯別度指數: discrimination index)  검사의 문항들이 피검자들의 능력을 변별하는 정도를 나타내는 지수. 변별도지수는 대체로 문항이 상위 집단과 하위집단의 능력을 얼마나 잘 변별하고 있느냐를 보는 방법, 분석하려는 문항과 어떤 준거와의 상관을 내어보는 방법, 카이저승이나 변량분석을 이용한 차이검정에 의한 방법, 정답의 비율이 정상분포곡선에 접근하고 있는지 정밀성을 따져보는 방법 등으로 산출된다. 문항이 상위와 하위 집단의 능력을 변별하는 정도를 보는 경우 문항변별도지수는 D (또는 D.I 혹은 d)로 표시되며, 외적 준거와의 관계를 보려는 경우는 문항변별도의 지수로서 양분상관, 양류상관, 사분상관, 파이계수 등이 쓰인다.

변수(變數: variable)  속성에 따라 여러 수준으로 분류할 수 있거나 다양한 값을 취할 수 있는 사건, 사물, 현상을 나타내는 개념. 변인이라고도 한다. 변수는 지니는 속성을 수량화 할 수 있느냐의 여부에 따라 양적, 질적 변수로 구분하며, 주어진 범위 내에서 어떠한 값이라도 취할 수 있는지 아니면 단지 몇 개의 유목으로만 구분되는지에 따라 연속, 비연속변수로 구분한다. 그리고 한 연구에서 변수 상호간의 관계양상에 따라 독립, 종속변수로 구분한다.

부분상관(部分相關: partial correlation)  세 개이상의 변수들이 상호상관을 갖는 경우에, 그 중에서 두 변수만의 고유한 관계를 측정하기 위한 상관. 예를 들어, 변수 X1, X2, Y가 상호상관을 갖는 경우에, X2와 X1의 상관과 X2와 Y와의 상관을 배제한 후에 X1과 Y가 갖는 고유상관을 부분상관이라 하며 편상관이라고도 한다. 부분상관은 회귀분석에서 회귀계수의 추정에 사용되므로 중다회귀분석에서의 회귀계수는 부분회귀계수(partial regression coefficient) 또는 편회귀계수라고도 한다.

부호검정(符號檢定: sign test)표본들이 서로 관련되어 있는 경우, 짝지워진 두 개의 관찰치들의 크고 작음을 (+)와 (-)로 표시하여 그 개수를 가지고 두 개의 분포의 차이가 있는가에 대한 가설을 검증하는 비모수적 방법. 기호검증법, 사인검증법이라고도 한다. 이때 (+)나 (-)가 나올 확률이 동일하다는 가정하에 이항분포를 이용하여 가설을 검정한다. 만약 두 부호중 어느 한쪽이 지나치게 많이 나오면 영가설은 받아들일 수 없게 된다. 부호검정의 특별한 장점은 적용하기가 쉽고, 가정들이 그다지 제한적이 아니라는 점이다. 단점은 이 방법이 원점수들에 담겨있는 특정한 정보들을 무시하기 때문에, 약간의 민감성을 잃게 하는 것이다.

분산(分散: variance)  한 분포를 구성하는 모든 사례에서 그 분포의 평균을 빼서 나온 편차점수들을 제곱하고, 이를 모두 합한 후 그 분포의 사례수로 나눈 값. 표준편차의 제곱값 이며, 변량이라고도 한다. V 또는 Var로 표시하기도 한다. (V=Var)분산은 흔히 표준편차를 대신해서 한 분포의 변산도를 나타내는 수치로도 사용된다. 분산이 클수록 그 분포는 이질적이라고 할 수 있다. 

분산-공분산행렬의 동질성(分散-共分散行列의 同質性: homogeneity of the variance-covariance matrix)  각 변수의 분산과 변수들 간의 공분산이 같은 정도. 다변량분석(multivariate analysis)에서 집단간 평균 벡타의 차이검증에서 요구되는 한 조건으로서, 특히 사례 수가 적은 경우에 이 조건이 엄격하게 요구된다. 이 가정이 만족되는 경우, 각 집단의 사례들을 통합하여 통합된 분산-공분산 행렬(pooled variance-covariance matrix)를 추정한다.  그러므로 이 가정은 두 평균의 차이검정에서 요구되는 두 집단간의 동분산성 가정과 같은 역할을 한다.

분산분석(分散分析: analysis of variance/ ANOVA)  R. A. Fisher가 1923년에 보고한 분산의 근원을 밝히고 분할하고 통계적 유의도 검정을 하는 방법. 변량분석이라고도 한다. 분산을 분석하지만 실제적으로는 평균치들의 차의 유의도 검정에 사용된다. 분산분석의 검정통계량은, 집단간 분산과 집단내 분산의 비율인 F통계량(F = 집단간 분산/집단내 분산)이다. 집단내 분산보다 집단간 분산이 의미있게 클 때 처치효과가 나타난다. 집단간 분산이란 각 집단의 평균치가 전체 평균으로부터 얼마나 이탈해 있는가를 나타내는 것이고, 집단내 분산이란 각 사례의 점수가 자신이 속한 집단의 평균치로부터 얼마나 이탈해 있는가를 나타내는 것이다. 한 개의 독립변수와 한 개의 종속변수가 있을때는 일원분산분석, 두 개의 독립변수와 한 개의 종속변수가 있을때는 이원분산분석, 그리고 독립변수가 증가함에 따라 다원분산분석을 적용해 자료를 분석한다.

변산도(變散度: variability)  측정치들의 분포가 대표값(집중경향치)을 중심으로 하여 어느 정도 밀집 혹은 분산되어 있는가를 나타내는 통계치로 여러 점수들이 흩어져 있는 정도. 변산도가 클수록 분포의 구성원들은 그만큼 이질적이고, 변산도가 작을수록 동질적임을 나타낸다. 변산도의 측정치에는 범위(range), 사분편차(semi-interquartile range), 분산(variance), 그리고 표준편차(standard deviation)등이 있다.

부지통제(不知統制: blind-fold control)  연구에 참여한 피험자들이 연구결과에 대해 전혀 알지 못하게 하여 피험자들의 결과에 대한 지식이 피험자의 반응에 심리적 영향을 미치는 것을 방지하기 위한 통제 기법.  피험자들의 결과에 대한 지식은 특정한 결과에 대한 기대를 형성하여 처치효과에 오염을 초래할 수 있기 때문에 부지통제 기법이 사용된다.  실험 연구에서 실험자의 결과에 대한 지식이 피험자들의 반응에 영향을 주는 경우도 있을 수 있다. 이런 경우 실험자들도 실험 결과에 대해 알지 못하도록 통제하는 방법을 이중부지통제(double blind-fold control)라고 한다.  

분석단위(分析單位: unit of analysis)  자료수집 시 표본의 크기를 결정하는데 사용되는 기본단위. 분석의 단위는 표본자료의 분석을 어느 수준에서 하느냐와 밀접한 관련이 있다. 예를 들어, 10개 집단에 각각 20명의 학생이 포함된 표본의 경우에, 집단수준에서의 분석의 단위는 집단으로서 이 경우에 표본의 크기는 10이 된다. 그러나 개인수준에서의 분석의 단위는 개인으로서 표본의 크기는 200 이다. 분석의 단위는 흔히 실험단위(experimental unit)와 관찰단위(observational unit)의 개념으로 분리되�