第1章 単回帰分析 - mie universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... ·...

50
8-1-1 第1章 単回帰分析 1.1単回帰分析とは ■目的 回帰分析の目的は,yがxの変動に対してどの程度変化しているか,または信頼できるかを予 測し明らかにするためのものです. 単回帰分析とは,yを目的変数,xを説明変数(1つ)として y=β 0 +β 1 x+ε の式によって現象を説明しようとする手法です.この式を回帰式と呼びます. ここでは,β 0 を回帰定数,β 1 を回帰係数 1 次(以下,回帰係数),εを誤差と呼び,εはx では説明しきれない y の変動部分を示しています. また誤差は,平均0,分散σ 2 の正規分布に従うと仮定しています. ■活用場面 ・材料硬度から製品硬度への影響度の分析 ・車の走行距離とタイヤの磨耗量との関連の分析 ・標準機を用いた新検査機の測定能力の検討 など ■機能構成 機能 内容 変数の指定 説明変数と目的変数を指定する 散布図 回帰式を求めて,説明変数と目的変数の関係を視 覚的に確認する ・層別散布図 層ごとの目的変数との関係を視覚化する ・残差の検討 一覧表 求められた回帰式でモデルどおりの仮定が成り立 っているかどうかを残差で検討する ・予測判定グラフ ヒストグラム ・正規確率プロット 時系列 連関図 テコ比と t 値 分散分析表 求められた回帰式に意味があるかどうかを確認す 予測 回帰式を用いて,説明変数 x の値から目的変数 y の予測を行う 回帰の逆推定 回帰式を変換して,目的変数 y の値から説明変数 x を推定する 1.2 手法の選択 選択方法 [手法選択]-[多変量解析]-[単回帰分析] 1.3 データ形式と変数の指定 種類 変数の数 操作 目的変数 量的変数1 目的変数(y)とする変数を選択して,「目的変数」 リストの左側の[>]ボタンをクリック. 説明変数 量的変数1 説明変数(x)とする変数を選択して「説明変数」 1.1 単回帰分析とは 1.2 手法の選択 1.3 データ形式と変数の指定

Upload: others

Post on 06-Jun-2020

7 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-1

単回帰分析

PART

第1章

第1章 単回帰分析

1.1単回帰分析とは

■目的

回帰分析の目的は,yがxの変動に対してどの程度変化しているか,または信頼できるかを予

測し明らかにするためのものです.

単回帰分析とは,yを目的変数,xを説明変数(1つ)として

y=β0+β1x+ε

の式によって現象を説明しようとする手法です.この式を回帰式と呼びます.

ここでは,β0を回帰定数,β1を回帰係数 1次(以下,回帰係数),εを誤差と呼び,εはx

では説明しきれない yの変動部分を示しています.

また誤差は,平均0,分散σ2の正規分布に従うと仮定しています.

■活用場面

・材料硬度から製品硬度への影響度の分析

・車の走行距離とタイヤの磨耗量との関連の分析

・標準機を用いた新検査機の測定能力の検討 など

■機能構成

機能 内容

変数の指定 説明変数と目的変数を指定する

散布図 回帰式を求めて,説明変数と目的変数の関係を視

覚的に確認する

・層別散布図 層ごとの目的変数との関係を視覚化する

・残差の検討 一覧表

求められた回帰式でモデルどおりの仮定が成り立

っているかどうかを残差で検討する

・予測判定グラフ

ヒストグラム

・正規確率プロット

時系列

連関図

テコ比と t値

分散分析表 求められた回帰式に意味があるかどうかを確認す

予測 回帰式を用いて,説明変数 x の値から目的変数 y

の予測を行う

回帰の逆推定 回帰式を変換して,目的変数 yの値から説明変数 x

を推定する

1.2 手法の選択

選択方法 [手法選択]-[多変量解析]-[単回帰分析]

1.3 データ形式と変数の指定

種類 変数の数 操作

目的変数 量的変数1 目的変数(y)とする変数を選択して,「目的変数」

リストの左側の[>]ボタンをクリック.

説明変数 量的変数1 説明変数(x)とする変数を選択して「説明変数」

1.1 単回帰分析とは

1.2 手法の選択

1.3 データ形式と変数の指定

Page 2: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-2

リストの左側の[>]ボタンをクリック.

サンプル名 サンプル名1 サンプル名を指定して,「サンプル名」リストの

左側の[>]ボタンをクリック

■データ形式例変数名

サンプル

説明変数

(材料硬

度)

[量的変

数]

目的変数

(製品硬

度)

[量的変

数]

層別変数

(材料別)

[質的変

数]

1 66.09 77.83 従来材料

2 66.36 78.16 従来材料

: : : :

24 67.16 78.25 従来材料

25 66.46 78.10 従来材料

26 66.88 78.04 新規材料

27 67.14 78.16 新規材料

: : : :

49 66.81 78.08 新規材料

50 66.98 78.14 新規材料

*繰り返しのある(説明変数に同値データが

ある)場合の単回帰分析を行うためのデータ

形式も繰り返しのない場合と同様です

*層別解析を行う場合に単回帰分析で扱える

のは 2カテゴリの質的変数のみです.

1.4 「散布図」タブ

散布図タブでは,説明変数と目的変数の関係

を視覚的に確認し,プロットの回帰線へのあ

てはまり具合や外れ値をチェックします.

■評価・検討項目

チェック項目 使用する統計量

最小二乗法によっ

て求められた回帰

線と回帰式

回帰直線,回帰式,回

帰係数,回帰係数 1次

理論上,回帰直線が

通る可能性のある

範囲

回帰直線のα%信頼

区間

理論上,データが存

在する範囲

個々のデータのα%

予測区間

説明変数 x,目的変

数 yの各種統計量

データ数,最小値,最

大値,平均値,標準偏

求めれた回帰直線

の傾きや切片があ

る値に等しいとい

えるかどうか

t値(β1=β10),P値

(β1,両側),t値(β

0=β00),P 値(β0,

両側)

■解釈のポイント

◆回帰直線のα%信頼区間

理論上回帰直線が通る可能性のある範囲を,

視覚的に表したものです.つまり,「計算

に用いたデータからはグラフのような回帰

直線となったが,真の回帰直線はこの信頼

区間内で傾き等が変動する可能性もある」

といった意味を持ちます.区間幅は,xの

平均値の位置で最小となり,平均値から離

れるに従って大きくなります.

◆個々のデータのα%予測区間

回帰直線上のある値を平均とし,その y 方

向の上下に正規分布を考えたとき,理論上

α%のデータがこの区間内に存在すること

を視覚的に表しています.回帰式の信頼度

が低ければこの区間の幅が大きくなり,逆

に信頼性が高ければこの幅は狭くなります.

プロットのばらつきが大きかったりデータ

数が少ない場合に,回帰式の当てはめを行

うと信頼区間の幅が大きくなり,散布図上

に表示できなくなります.このような場合

は,「目盛の変更」で表示する範囲を広げ

ることができますが,一般的には回帰式を

得ることが適当ではないと理解されます.

◆t 値(β1=β10),P 値(β1,両側),t

値(β0=β00),P値(β0,両側)

「t値(β1=β10)」はβ1=β10と仮定した

場合の検定統計量です.つまり,回帰係数

(傾き)がβ10 と等しいといえるかどうか

の検定を行うための統計量です.

「t値(β0=β00)」は β0=β00 と仮定し

た場合の検定統計量です.つまり,回帰定

数(切片)がβ00 と等しいといえるかどう

かの検定を行うための統計量です.

t値が大きく P 値が有意水準より小さけれ

ば有意となり,「β1=β10」や「β0=β00」

の仮説を棄却します.即ち,傾きや切片は

ある値β10 やβ00 とは異なっているといえ

1.3 データ形式と変数の指定

1.4 「散布図」タブ

Page 3: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-3

単回帰分析

PART

第1章

ます.厳密には,t表から,自由度(デー

タ数-2(原点を通る場合はデータ数-1))

と危険率α(通常は5%を用いる)を用い

て得られたt値と,計算によって求められ

たt0値とを比較して検定を行います.デー

タ数によって異なりますが,目安としてt

値が2以上ならば有意であると考えます.

◆t値(β1=0.000)

「t値(β1=0.000)」はβ1=0と仮定した

場合の検定統計量です.つまり,回帰係数

が0といえるかどうか(0なら回帰の意味

がない)の検定を行うための統計量です.

t値が大きければ回帰係数が有意となり回

帰式に意味があるといえます.

■補助機能

解析操作 内容

残差の検討 求められた回帰式の妥当性

の検討. データ探索 散布図より任意のデータを

探索 層別 質的変数から,またはサンプ

ル番号順に,層ごとの単回帰

分析の散布図を新たに表示 オプション 目盛変更,2次回帰,信頼区

間,検定などの設定 回帰線切り

替え 現在のデータに 2 次回帰線

を当てはめます

信頼区間 信頼区間の表示/非表示

サンプル名

表示 データ探索により表示設定

されたデータの,サンプル番

号/名称の表示切り替えを

行います

マーキング

表示 データ探索により表示設定

されたデータの,マーキング

表示の表示切り替えを行い

ます

信頼区間切

り替え 回帰線の信頼区間を表示し

た場合に,信頼率(90%,95%,

任意値)を切り替えます

予測区間切

り替え 個々のデータの予測区間を

表示した場合に,信頼率

(90%,95%,任意値)を切り

替えます

1.4.1 単回帰式を求める

散布図の下に,求められた回帰式が表示され

ています.

Y=62.405049+0.235570X

1.4.2 外れ値を確認するには

確認したい外れ値のプロットを矩形で選択し,ツ

ールボタン[データ探索]をクリックします.

矩形で囲んだプロットの値が表示されます.さら

に,検索したプロットにサンプル名を表示させた

い場合は,

[番号表示/解除]ボタンを押して,[OK]ボタンをク

リックします.

1.4 「散布図」タブ

Page 4: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-4

散布図タブのツールボタン[サンプル名/サンプ

ル番号切り替え] を押すと,データ探索したプ

ロットにサンプル名が表示されます.

1.4.3 注目しているサンプルを確認する

には

ツールボタン[データ探索]をクリックしま

す.データ探索ダイアログの「サンプル番号

の追加」の欄に,確認したい任意のデータの

サンプル番号を入力して,[OK]ボタンをクリ

ックします.

指定したサンプル番号の値が表示されます.

さらに,検索したプロットにサンプル名を表

示したい場合は,[番号表示/解除]ボタンを押

して,[OK]ボタンをクリックします.散布図

タブのツールボタン[サンプル名/サンプル番

号切り替え] を押すと,データ探索したプロ

ットにサンプル名が表示されます.

1.4.4 規格値を入力して規格外データを

確認するには

ツールボタン[オプション]の規格値タブで規

格値を入力し,[OK]ボタンをクリックします.

散布図に規格線が表示されます.

ツールボタン[データ探索]を押すと,規格外

データの値が表示されています.さらに、規

格外データをマスクしたい場合は,[マスク/

解除]ボタンを押して,[OK]ボタンをクリック

します.

規格外データがマスクされます.

1.4 「散布図」タブ

Page 5: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-5

単回帰分析

PART

第1章

単回帰分析を行う上で,他の値から

飛び離れた値(外れ値)あるいはグ

ループが存在すると,それが回帰式

を大きく歪める場合があります.

外れ値には,回帰式から大きく外れ

ている場合(残差や t 値が大きい)

や傾き,データの重心から大きく外

れている場合(テコ比が大きい)が

あります.

外れた値には重要な情報が含まれて

いる場合(例えば他の説明変数によ

る影響を強くうけている場合や特異

な現象,入力ミスなど)も多く,む

やみに解析から外してはいけませ

ん.十分調査したうえで,外れ値を

解析に用いた場合と用いない場合そ

れぞれの結果を吟味する必要があり

ます.

1.4.5 グラフのレイアウトを整えるには

グラフの軸目盛を変更したい場合は,ツール

ボタン[オプション]の境界値タブで,Y 軸目

盛と X 軸目盛の最大値と最小値を設定します.

Y軸と X軸の目盛りが変更されます.

目盛りの数や数値の小数点以下桁数,単位を

変更したい場合は,散布図の目盛りの数値を

ダブルクリックします.

軸目盛の詳細を設定します.

軸目盛の詳細が変更されました.

グラフに名称を付けたり,補助線を引きたい

場合は,散布図の枠線をダブルクリックしま

す.

1.4 「散布図」タブ

Page 6: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-6

グラフ名称や補助線を引く X や Y の値を入力

します.

補助線にはタグを付けることもできます.

グラフにグラフ名称や補助線が表示されまし

た.

1.4.6 回帰直線の信頼区間や個々のデー

タの予測区間の信頼率を変更するには

ツールボタン[オプション]の補助線・装飾タ

ブで信頼率を設定して[OK]ボタンをクリック

します.

回帰直線の信頼区間(内側の 2本の線)や個々

のデータの予測区間(外側の 2 本の線)の信

頼率が変更されます.

また,ツールボタン[信頼区間切り替え] や

[予測区間切り替え] を押しても,信頼率

を切り替えることができます.(90%→95%→

任意値)

1.4.7 傾きの検定(β1=β10)や切片の

検定(β0=0.00)をするには

例えば,標準機と新検査機があり,新検査機

での測定結果が標準機での測定結果と一致す

るかどうかを調べたい場合に,横軸に標準機

での測定データ,縦軸に新検査機での測定デ

ータの値を取って,傾きβ1=1,切片β0=0 の

回帰直線になるかどうかを検定します.

ツールボタン[オプション]の検定タブで,回

帰係数(傾き)や回帰定数(切片)の「検定

をする」を選択し,β10やβ00の値を入力して

[OK]ボタンをクリックします.

統計量に検定結果が表示されます.

1.4 「散布図」タブ

Page 7: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-7

単回帰分析

PART

第1章

有意水準を 5%とすると,β1=β10の P値が 0.05

より大きければ,「求められた回帰直線の傾き

はβ10 と異なっている」といえません.同様

に,β0=β00 の P 値が 0.05 より大きければ,

「求められた回帰直線の切片はβ00 と異なっ

ている」といえません.

切片についての検定は,x=0の近傍で

のデータがあり,かつ,切片に技術的

に意味がある場合に限り,行って下さ

い.

1.4.8 2 次回帰曲線をあてはめるには

直線回帰では説明できない場合に 2 次回帰曲

線の当てはめを行います.

補助線・装飾タブで「2 次回帰曲線」を選択

して[OK]ボタンをクリックします.

2次回帰曲線が引かれ,2次の回帰式が求めら

れます.またはツールボタン[回帰曲線切り替

え] を押しても,回帰直線と 2 次回帰曲線を

切り替えることができます.

この機能は「多項式回帰分析」の 2

次式の当てはめに相当します.詳しい

分析を行いたい場合は,直交多項式回

帰分析の機能を利用して下さい.

1.4.9 原点を通る回帰直線を求めるには

例えば,車の走行距離とタイヤの磨耗量など,

物理現象に合わせた絶対的な物の大きさを考

えるときに,原点を通る回帰直線を考えます.

ツールボタン[オプション]の補助線・装飾タ

ブで[詳細設定]ボタンをクリックします.

回帰定数(切片)を 0 に設定し,[OK]ボタン

をクリックします.

1.4 「散布図」タブ

Page 8: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-8

回帰定数(切片)が 0 の,原点を通る回帰直

線が求められます.

1.4.10 層ごとの単回帰分析を行うには

ツールボタン[層別」をクリックします.層別

に使う質的変数を指定するか,数量を指定し

てサンプル番号順に 2 カテゴリに分けてから

[OK]ボタンをクリックします.(本システム

では 2カテゴリの層別のみ行えます)

層ごとの単回帰分析が行われます.

1.5 「散布図」タブ(層ごとの単回帰分析)

「変数の指定」で質的変数を指定するか,

「層ごとの単回帰分析を行うには」の手順で,

層別散布図を表示します.層ごとに説明変数

と目的変数の関係を視覚的に確認し,プロッ

トの回帰線へのあてはまり具合や外れ値をチ

ェックします.

■評価・検討項目

チェック項目 使用する統計量

最小二乗法によって

求められた層ごとの

回帰線と回帰式

回帰直線,回帰定

数,回帰係数 1次

傾きβ1=0の検定結果 t値(β1=0.000),

P値

2 本の回帰直線の比

t値(β11=β12),

P 値,t 値(β01=

β02),P値

■解釈のポイント

◆t値(β1=0.000),P値

「2.5 散布図タブ(単回帰分析)」を参照.

◆t値(β11=β12),P値,t値(β01=β02),

P値

「t値(β11=β12)」はβ11=β12 と仮定し

た場合の検定統計量です.つまり,群 1 の

回帰直線の回帰係数(傾き)が群 2 の回帰

直線の回帰係数(傾き)と等しいといえる

かどうかの検定を行うための統計量です.

「t値(β01=β02)」はβ01=β02と仮定し

た場合の検定統計量です.つまり,群 1 の

回帰直線の回帰定数(切片)が群 2 の回帰

直線の回帰定数(切片)と等しいといえる

かどうかの検定を行うための統計量です.

t値が大きく P 値が有意水準より小さけれ

ば有意となり,「β11=β12」や「β01=β02」

の仮説を棄却します.即ち,2 群の傾きや

切片は異なっているといえます.データ数

によって異なりますが,目安としてt値が

2以上ならば有意であると考えます.

2 本の回帰直線の傾きや切片に関する検定

では,まず,2 群の誤差分散が等しいかど

うかの予備検定を行います.予備検定結果

が有意でない(誤差分散が等しくないとい

えない)場合には t検定を,有意である(等

しくないといえる)場合には Welch の検定

を行っています.

2.5 散布図タブ(単回帰分析)

1.4 「散布図」タブ

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 9: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-9

単回帰分析

PART

第1章

■補助機能

解析操作 内容

残差の検討 求められた回帰式の妥当性

の検討.「2.7 残差の検討」

を参照 拡大統合 層を統合し 1 つの図として

新たに表示します オプション 目盛変更,検定などの設定を

します 表示モード グラフの表示モードを変更

します 回帰線切り

替え 現在のデータに 2 次回帰線

を当てはめます

層別散布図 1つの散布図内に複数のカ

テゴリをプロットを変えて

表示します.

層ごとの散

布図 カテゴリの数分だけの散布

図を表示します.

統計量表示

/非表示 層ごとの散布図の表示モー

ドのみ,グラフ上に表示して

いるデータ数,相関係数の表

示/非表示を切り替えます.

1.5.1 層ごとの単回帰式を求める

層別散布図の統計量に回帰定数と回帰係数が

表示されています.

カテゴリ 1:Y=62.035+0.241X

カテゴリ 2:Y=62.214+0.238X

層ごとの散布図を表示したい場合は,ツール

ボタン[表示モード]で「層ごとの散布図」を

指定し,[OK]ボタンをクリックします.また

は,ツールボタン[層ごとの散布図] を押し

ます.

層ごとの散布図が描かれ,各散布図の下に,

求められた層ごとの回帰式が表示されます.

層別散布図に戻したい場合は,表示モードを

「層別散布図」に指定します.

また,層別散布図/層ごとの散布図を拡大した

い場合は,ツールボタン[拡大統合]を押しま

す.統合後のグラフに名称を付けて[OK]ボタ

ンをクリックします.

層別散布図/層ごとの散布図が 1 つに拡大統

合されます.

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 10: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-10

1.5.2 2 本の回帰直線を比較するには

例えば,従来材料と新規材料の 2種類があり,

それぞれの材料硬度から製品硬度への影響が

同じであるかどうかを確認したい場合に,2

本の回帰直線の傾きや切片が等しいかを検定

します.

層別単回帰分析のツールボタン[オプション]

の検定タブで,回帰係数(傾き)や回帰定数

(切片)の「検定をする」を選択します.

統計量に検定結果が表示されます.

有意水準を 5%とすると,β11=β12 の P 値が

0.05 より大きければ,「求められた 2 本の回

帰直線の傾きは異なっている」といえません.

同様に,β01=β02の P値が 0.05より大きけれ

ば,「求められた 2本の回帰直線の切片は異な

っている」といえません.

予備検定の有意水準を変更したい場合は,層

ごとの単回帰分析のツールボタン[オプショ

ン]の検定タブで,[予備検定設定]ボタンをク

リックします.

有意水準を入力し,[OK]ボタンをクリックし

ます.

予備検定の結果に応じて,回帰係数

(傾き)と回帰定数(切片)の検定方

法が変わります.(有意でない:t検

定,有意である:Welchの検定)

本システムでは有意水準 20%を推奨

していますが※,必要があれば変更し

てください.

※「入門 統計解析法」:永田靖,日

科技連出版社より

1.5.3 残差の検討

目的変数yと求められた回帰式から計算し

た推定値との差を残差と呼びます.

回帰分析の結果を検討するうえで残差の検討

は大切です.残差の検討では,求められた回

帰式についてモデルどおりの仮定が成立って

いるか否かを確認します.

■解釈のポイント

1)不偏性 :期待値が0になる.…ヒスト

グラム

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 11: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-11

単回帰分析

PART

第1章

2)独立性 :各残差間とは独立(無相関).

説明変数とも独立(無相関).

…散布図,時系列プロット

3)等分散性:分散が一定である.…散布図

4)正規性 :残差は正規分布N(0,σ2).

(基準化残差は標準正規分布N(0,12))

…ヒストグラム 残差の検討には,以下の機能が用意されてい

ます.層ごとの単回帰分析では層ごとに残差

の検討を行います. ■残差タブ一覧

機能 内容

一覧表 残差の値を表示

ヒストグラム 正規性を確認

時系列(プロット) 独立性を確認

(残差との)連関図 独立性を確認

テコ比とt値(の散

布図)

t値のヒストグラム

残差の検討でモデルから外れた値を

見つけた場合,そのデータを解析から

外すことが考えられます.しかし,外

れた値には重要な情報が含まれてい

る場合(例えば他の説明変数による影

響を強くうけている場合や特異な現

象,入力ミスなど)も多く,むやみに

解析から外してはいけません.十分調

査したうえで,外れ値を解析に用いた

場合と用いない場合それぞれの結果

を吟味する必要があります.

1.5.3.1 モデルから外れた残差をチェックす

「一覧表」タブでは,実測値と予測値,残差

の一覧を表示します(残差の検討の初期画面). 最初に基準値(初期設定ではt>1.5,ま

たは,テコ比>テコ比の平均値*2.5)を

越えるサンプルの実測値と予測値,残差,t

値,テコ比,予測残差などを表示します.ド

ロップダウンリストで残差/基準化残差(ei

‘=ei/√Ve)の切り替えを行うことも可能

です.

テコ比とは,回帰式の推定に対するi番目サ

ンプルの影響の程度を表します.回帰式の計

算において, 平均から離れているサンプルほ

ど回帰式を自分の方に引きつける力が強くな

り,これを定量的に表したものがテコ比です. ■補助機能

解析操作 内容

出力基準値 一覧表に出力する基準値の

切り替えを行います.出力基

準は,次のどちらかに切り替

わります.

・|t|>1.5 または テコ

比>テコ比の平均値*2.5

・全てのサンプル 変数登録 予測値と残差をワークシー

ト上の変数に登録すること

ができます 予測判定グ

ラフ 縦軸に実測値,横軸に予測値

をとった散布図を表示しま

す 昇順ソート 指定した項目をキーとして

サンプル単位で昇順ソート

降順ソート 指定した項目をキーとして

サンプル単位で降順ソート

サ ン プ ル

No.順 サンプル番号で昇順ソート

実測値と予測値が一致していれば,右上がり

45°の直線上にプロットされます.ここでは,

直線から大きく外れた値がないかどうかをチ

ェックします.

「テコ比と t 値」タブでは,x軸にt値・y 軸

にテコ比を取り,散布図を表示します.テコ

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 12: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-12

比側あるいは,t 値側から見て,残差の大き

なサンプルを確認することができます.

ここでは,テコ比の平均値の 2.5 倍以上のデ

ータがあるかt値の絶対値が 1.5 を越えるデ

ータがあるかなどに注目します.必要ならば

データの探索を行い,散布図上のプロット点

からサンプル番号とその値を確認します.

「t値のヒストグラム」タブでは,t値のヒス

トグラムを描きます.t 値の大きなサンプル

の有無を確認することができます.

1.5.3.2 不偏性や正規性をチェックする

「ヒストグラム」タブでは,残差のヒストグ

ラムが表示されます.0を中心とした正規分

布をしているか否かをチェックします.

(1)外れ値

外れ値の表示では該当するサンプルをマスク

後,回帰分析の再計算を行うことができます.

マスク/マスク解除するには

1.メニューボタン[外れ値表示]をクリックす

ると,下図のような外れ値の表示ダイアログ

が表示されます.

2.マスク(マスクを解除)したい外れ値のデ

ータをクリックし,反転させます.

3.[マスク]([マスク解除])ボタンをク

リックします.

表示パネル内の個々のサンプルの属性は,順

位番号の左に以下のように表示されます.

マスク状態・・・・・・・・M

偏差値3以上・・・・・・・**

偏差値2.5以上3未満・・*

とします.ただし,属性が重なる場合,優先

順位はM>**>*となります.

(2)正規確率プロット

正規確率プロットは,分布の形が正規分布と

みなせるかどうか,あるいは正規分布とみな

してよいかどうかなどの検討に用います.こ

こでは残差の正規性を確認してみましょう.

正規確率プロットを利用する際,プロットさ

れた点が右上がり45°にほぼ一直線上に並

んでいれば正規分布とみなされます.

また,正規性検定で有意水準を 5%とすると,

P値が 0.05以下の場合は,「残差が正規分布

に従っている」という仮説を棄却しますが,P

値が 0.05 以上の場合は仮説を棄却しません.

1.5.3.3 独立性や等分散性をチェックする

「連関図」タブでは,残差の連関図をコンパ

クトに表示します.特に残差と説明変数の関

係が無相関の状態かを視覚的にチェックする

ことができます.また残差が等分散になって

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 13: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-13

単回帰分析

PART

第1章

いるか,くせがないかどうかなども見ること

ができます.

拡大後の散布図では縦軸の目盛の数値は0を

中心とし,上下に残差の標準偏差の±1σ,

±2σ,±3σ線を表わしています.このよう

に,特徴がみられる散布図についてはグラフ

を拡大して傾向を確認します.必要ならば該

当サンプルをマスクし,再計算することもで

きます.

「時系列」プロットタブの中に表示されるダ

ービンワトソン比は,残差の系列がランダム

であるかどうかを見るための統計量です.ダ

ービンワトソン比は,0≦d≦4の範囲内の

値を取り,残差の系列がランダムであれば2

に近い値となり,隣同士に正の相関(大きな

波のような系列)があれば0に,負の相関(ギ

ザギザした系列)があれば4に近い値を取り

ます.

1.5.4 「分散分析表」タブ

分散分析表では,用いたデータに直線を当

てはめることに意味があるかどうかを統計的

に判断します.実際には,残差の大きさ,傾

向などの固有技術も含めて吟味し総合的に判

断してください.層ごとの単回帰分析の場合

には,層ごとの結果が表示されます.

■評価・検討項目

チェック項目 使用する統計量

1 データに直線を

当てはめること

に意味があるか

どうか

分散分析表

2 回帰定数(切片)

が 0であるかどう

信頼区間,t値,P

値(両側),

t(φe,0.05),t(φ

e,0.01)

3 回帰係数(傾き)

が 0であるかどう

信頼区間,t値,P

値(両側),

t(φe,0.05),t(φ

e,0.01)

4 説明変数と目的

変数間の直線的

な関係の強さ

相関係数,相関係

数の信頼区間

5 総平方和のうち,

回帰直線によっ

て説明される変

動の割合

寄与率

■解釈のポイント

◆分散分析表

目的変数yの変動を回帰平方和(SR)と残

差平方和(Se)に分解し,自由度,分散,

分散比および検定結果を表示します.単回

帰モデルを検定した結果が,5%有意の場

合には「*」を,1%有意の場合には「*

*」を表示します.有意の場合には,統計

的に使用したデータの範囲内において直線

を当てはめる意味があると判断します.

◆β0=0とした場合の検定結果

ここでの t 値の絶対値が t(φe,0.05)や

t(φe,0.01)より大きい場合に,回帰定数

(切片)は 0 ではない,即ち,回帰直線は

原点 0を通らないといえます.

◆β1=0とした場合の検定結果

ここでの t 値の絶対値が t(φe,0.05)や

t(φe,0.01)より大きい場合に,回帰係数

(傾き)は 0 ではないといえます.

2.7 残差の検討

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 14: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-14

■補助機能

解析操作 内容

当てはまり

の悪さ 説明変数の値(水準)に 1

つでも繰り返しがある場合

に,当てはまりの悪さ(lack

of fit)を表示します.

また,総平方和を級内変動と

級間変動に分解します オプション 信頼区間の信頼率を切り替

えます 指数表示 回帰式の係数の指数表示を

行います

信頼区間切

り替え 信頼区間の信頼率(90%,95%,

任意値)を切り替えます

1.5.4.1 得られた回帰式に意味があるかどう

かを確認する

分散分析表の検定で有意となっているかどう

かを確認します.5%有意の場合には「*」

を,1%有意の場合には「**」を表示しま

す.有意の場合には,統計的に使用したデー

タの範囲内において直線を当てはめる意味が

あると判断します.

1.5.4.2 回帰定数や回帰係数,相関係数の信

頼区間の信頼率を変更するには

回帰定数や回帰係数,相関係数の任意の信頼

率の信頼区間を求めるには,メニューボタン

[オプション]を押して,信頼率を設定し,[OK]

ボタンをクリックします.

信頼区間の信頼率が変更されました.

また,表の表示桁数を変更するには,変更し

たい列を選択します.

選択した状態で右クリックをして「表示桁数

を増やす(+)」を選択します.

表示桁数が増えました.

1.5.5 「予測」タブ

予測タブでは,説明変数に任意の値を入力し,

目的変数の予測値を計算させることができます.

最大30サンプルの予測を行えます.予測された

各統計量を吟味し,データの収集条件,規格

値や許容度などを考慮して十分に検討します.

層ごとの単回帰分析の場合には,層ごとの結

果が表示されます.

■評価・検討項目

チェック項目 使用する統計量

1 説明変数 x の値

を与えたときの

目的変数 y の予

測値

予測値

2 理論上,回帰直線

が通る可能性の

ある範囲

母回帰のα%信頼

区間,母回帰の標準

誤差

3 理論上,データが

存在する範囲

データのα%予測

区間,データの標準

誤差

4 予測をおこなう

説明変数 x の値

の平均からの外

れ具合

テコ比

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 15: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-15

単回帰分析

PART

第1章

■解釈のポイント

◆データのα%予測区間,母回帰のα%信頼

区間

「2.5 散布図タブ(単回帰分析)」を参照

◆テコ比

テコ比は,回帰式の推定に用いたデータの

重心(平均)からのマハラノビス距離と線形

の関係にある統計量です.テコ比の大きい

ものは注意が必要です(外挿のおそれがあ

ります).

■補助機能

解析操作 内容

オプション 出力項目や信頼区間,予測区

間の信頼率を切り替えます 出力項目切

り替え 母回帰の信頼区間,テコ比,

データの標準偏差,母回帰

の標準偏差が表示されます

信頼区間切

り替え 信頼区間の信頼率(90%,95%,

任意値)を切り替えます

予測区間切

り替え 予測区間の信頼率(90%,95%,

任意値)を切り替えます

1.5.5.1 単回帰式を使って予測をする

説明変数に値を入力します.セルへの入力時

に,画面左上に,その説明変数の最小値と平

均値,最大値が表示されるので,参考にしま

す.

ツールボタン[計算開始]をクリックすると,

予測値やデータの信頼区間などが求められま

す.

母回帰の信頼区間やテコ比などを確認するに

は,ツールボタン[オプション]で「詳細表示」

に設定するか,ツールボタン[出力項目切り替

え] をクリックします.

回帰係数と予測値についてコンピュ

ータ内部では,表示されている回帰係

数より細かい精度で計算を行ってお

ります.従って,表示している回帰係

数を使って手計算した値と予測値が

多少異なる場合があります.

回帰分析に用いた説明変数xのデー

タより大きい値や小さい値を指定す

ると,「外挿による予測を行っていま

す」というメッセージが表示され,デ

ータの前に#が表示されます.「外

挿」,すなわち「範囲外データ」によ

る予測は,推定値の信頼度を下げた

り,回帰式そのものが適合しない危険

性があるため注意して下さい.

1.5.5.2 マスクしたデータの予測をするには

画面右上のリストで「マスクデータ予測」を

指定します.

ワークシート上でマスクしていたデータがあ

れば,そのデータの値を使って,予測が行わ

れます.

マスクデータが多い場合は先頭から 100 サン

プルのマスクデータについて予測を行います.

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 16: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-16

1.5.5.3 母回帰の信頼区間やデータの予測区

間の信頼率を変更するには

母回帰の信頼区間やデータの予測区間の信頼

率を変更するには,メニューボタン[オプショ

ン]を押して,信頼率を設定し,[OK]ボタンを

クリックします.

また,ツールボタン[信頼区間切り替え] や

[予測区間切り替え] を押しても,信頼率を

切り替えることができます.(90%→95%→任

意値)

1.5.6 「回帰の逆推定」タブ

求めた回帰式を変換して,目的変数yの値

から逆に説明変数xを推定する場合に使用し

ます.yに規格値が設定されている場合に用

いると便利でしょう.目的変数yの値は,最

大30個まで入力可能です.画面上には,層

ごとの単回帰分析の場合には,層ごとの結果

が表示されます.

■評価・検討項目

チェック項目 使用する統計量

1 目的変数 yから説

明変数 xを逆推定

する式

較正直線の式

2 y の値を与えたと

きの xの推定値,

信頼区間

X の推定値,α%

信頼区間

3 説明変数 x,目的

変数 yの各種統計

最小値,最大値,

平均値,標準偏

差,データ数

■解釈のポイント

◆α%信頼区間

データのα%予測区間と直線 0y y との交

点の xの値を信頼上限・下限としています.

■補助機能

解析操作 内容

オプション 信頼区間の信頼率を切り替

えます 信頼区間切

り替え 信頼区間の信頼率(90%,95%,

任意値)を切り替えます

1.5.6.1 単回帰式を使って逆推定をするには

目的変数 y に値を入力します.画面右に,y

の最小値と平均値,最大値が表示されるので,

参考にします.

メニューボタン[計算開始]をクリックすると,

予測値や信頼区間が求められます.

回帰分析に用いた目的変数yのデー

タより大きい値や小さい値を指定す

ると,「外挿による予測を行っていま

す」というメッセージが表示され,デ

ータの前に#が表示されます.「外挿」

による予測は,逆推定値の信頼度を下

げる可能性があるため,その扱いには

注意が必要です.

1.5.6.2 信頼区間の信頼率を変更するには

信頼区間の信頼率を変更するには,メニュー

ボタン[オプション]を押して,信頼率を設定

し,[OK]ボタンをクリックします.

また,ツールボタン[信頼区間切り替え] を

押しても,信頼率を切り替えることができま

す.(90%→95%→任意値)

1.5 「散布図」タブ(層ごとの単回帰分析)

Page 17: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-1-17

単回帰分析

PART

第1章

Page 18: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-1

重回帰分析・数量化Ⅰ

PART

第2章

第2章 重回帰分析・数量化Ⅰ類

2.1 重回帰分析・数量化Ⅰ類とは

■目的

回帰分析の目的は,yがxの変動に対してどの程度変化しているか,または信頼できるかを予

測し明らかにするためのものです.

重回帰分析・数量化Ⅰ類は,予測のための手法です.yが,変数 x1,x2,…,xPの影響を受け

て変化するとき,その関係は次式で表されます.

exxxfy p ),,,( 21 … eは誤差

そのとき,x1,x2,…,xPを説明変数,yを目的変数と呼びます.

yを最もよく説明する変数の組み合わせを探し出し,その場合のyの実測値と推定値の差を吟味

する場合に,この手法を用います.

本システムの重回帰分析・数量化Ⅰ類では,説明変数として,量的変数,質的変数を混在して用

いることができるのが,特徴となっています.ここで,質的変数のカテゴリ数のことを,アイテ

ムカテゴリ数と呼ぶことがあります.

■活用場面

・中古住宅の価格予測解析

・ホテルの顧客総合満足度調査 など

■データ入力形式

サンプル名(サンプル名)0~1変数,説明変数(量的・質的変数)最大 255 個,目的変数(量的

変数)は1個です.説明変数のアイテムカテゴリ数の最大は 600 となっています.サンプル名を

指定すると,データ探索等で利用できます.

ただし,データに 1つでも欠測値があるサンプル,マスクされているサンプルは解析から除かれ

ます. 変数名

(No.)

サンプル名

・・ 目的変数

(価格(万円))

[量的変数]

説明変数

(土地面積

(m^2))

[量的変数]

説明変数

(建物面積

(m^2))

[量的変数]

・・ 説明変数

(バス乗る・載らな

い)

[質的変数]

1 ・・ 17800 138.58 300.020 ・・ 乗らない

2 ・・ 3980 60.35 70.090 ・・ 乗らない

3 ・・ 3980 60.35 70.090 ・・ 乗らない

4 ・・ 5180 98.48 139.100 ・・ 乗らない

5 ・・ 6480 69.57 113.020 ・・ 乗らない

■機能構成

機能 解析操作 内容

変 数 の 指

説明変数と目的変数を指定する

変数選択

変数選択(2.4) 逐次変数選択

総あたり法

全変数選択

全解除

2.1 重回帰分析・数量化Ⅰ類とは

Page 19: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-2

強調表示

(2.4.1)

オプションで設定した項目について着色を

行うことにより,変数選択をしやすくする.

オプション

(2.4.2)

・表示する統計量を設定する(残差平方和,

AIC,分散比の P 値(上側),標準偏回帰係

数,トレランス,VIF)

・強調表示の On/Offを設定する.

・変数選択の初期状態を設定する

選択履歴 今まで行った変数選択の経過と統計量を確

認する

変数確定

(2.4.3)

目的の回帰モデルの行を選択してからクリ

ックすると,そのモデルが選択される.

強調表示 最大の R**^2,最小の AIC,最小の残差標準

偏差を強調表示し,モデル選択のヒントにす

る.

オプション 表示統計量や強調表示 On/Offの設定.

SE変化グラフ

(2.4.4)

残差平方和(SE)と自由度 2 重調整済寄与

率(R**^2)の変化量グラフを表示.

オプション SE変化グラフの横軸の指定.

偏回帰プロット一

偏回帰プロット

(2.4.5)

回帰モデルが妥当であるかどうかを検証す

る.(回帰式に量的変数が 2 個以上の時に表

示)

拡大 選択した散布図を拡大表示する.

偏回帰残差一覧 変数登録 偏回帰残差をワークシートに登録する.(別

の解析で用いることができるようになる)

確 定 モ デ

確定モデル(2.5) 作成した回帰モデルの統計量と回帰式を表

示する.

モデル登録 作成したモデルの情報を登録する.(登録す

ると,次回以降,変数の指定ダイアログで指

定し,そのモデルを利用できる)

強調表示 強調表示の On/Off.

オプション 表示統計量,強調表示 On/Off,強調表示の

基準を設定する.

回帰係数

(2.5.1)

回帰式を求めて,回帰係数に関する各種統計

量を確認する

強調表示 強調表示の On/Off.

オプション 表示統計量や強調表示 On/Offの設定.

カテゴリスコア

(2.5.2)

質的変数が選択されているときに,カテゴリ

の統合を検討する

カテゴリ統合

(2.5.2.1)

指定した 2 つのカテゴリを1つのカテゴリ

に統合する.

強調表示 t値が基準値より小さいものを調表示し,カ

テゴリ統合のヒントにする.

オプション 強調表示の基準値の設定.

スコアグラフ カテゴリスコアの差を棒グラフで表示する.

予測判定グラフ

(2.5.3)

データ探索 選択した範囲内にあるプロットの項目名の

表示/非表示を設定する.

分 散 分 析 表

(2.5.4)

残 差 の 分

布(2.6)

残差一覧表 変数登録 求められた回帰式でモデルどおりの仮定が

成り立っているかどうかを残差で検討する. 強調表示

2.1 重回帰分析・数量化Ⅰ類とは

Page 20: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-3

重回帰分析・数量化Ⅰ

PART

第2章

オプション

テコ比と残差 t値 データ探索

残差のヒストグラ

外れ値

正規確率プロット 強調表示

オプション

残差 t値のヒスト

グラム

時系列プロット

残 差 の 連

関(2.6)

残差との連関図 拡大

変数の追加 指定した変数を連関図に加える.

連関図(拡大) 統計量 ヒストグラムを拡大した場合に,基本統計量

を求める.

データ探索 散布図を拡大した場合に,選択した範囲内の

プロットを探索する.

層別 散布図を拡大した場合に,質的変数で層別を

行う.

オプション 散布図を拡大した場合に,回帰線を表示した

り,Y軸と X軸の目盛を設定する.

予測

(2.7)

予測 回帰式を用いて,説明変数 x の値から目的変

数 yの予測を行う

計 算 開 始

(2.7.1)

データクリア

変 数 登 録

(2.7.3)

予測した値をワークシートに登録する.(別

の解析で使えるようになる)

オプション 表示する統計量や信頼率αを変更する.

2.2 手法の選択

選択方法 [手法選択]-[多変量解析]-[重回帰分析・数量化Ⅰ類]

2.3 変数の指定

種類 変数の数 操作

目的変数 量的変数1 目的変数(y)とする変数を選択して,「目的変数」

リストの左側の[>]ボタンをクリック.

説明変数 (量的変数+質的変数)≧2 説明変数(x)とする変数を選択して「説明変数」

リストの左側の[>]ボタンをクリック.

サンプル名 サンプル名1 サンプル名を指定して,「サンプル名」リストの

左側の[>]ボタンをクリック

2.1 重回帰分析・数量化Ⅰ類とは

2.2 手法の選択

2.3 変数の指定

Page 21: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-4

2.4 変数選択

解析を行う上で,最初にこの画面で回帰式に取り込む説明変数を選択します.

■用語解説

用語 説明

重相関係数 実測値と予測値との相関係数.

寄与率 R^2,自由度調

整済寄与率 R*^2 ,自

由度 2 重調整済寄与率

R**^2,AIC

目的変数のばらつきのうち,回帰式で説明できる部分の割合.ただし,

寄与率は説明変数の数が増えれば大きくなる.ここで,無意味な説明

変数が含まれると値が小さくなってしまう自由度調整済寄与率や,さ

らに自由度の調整をした自由度 2重調整済寄与率が用いられる.

AICもモデルの良さを表す指標で,相対的に比較し,小さいほど良いモ

デルとなる.

残差平方和,変化量 その説明変数を選択(既に選択されているときには選択解除)した後

の残差平方和の値.変化量は現在の残差平方和からの変化量を表す.

分散比 残差平方和の変化量が統計的に大きいかどうかを判断する指標.

P値(両側) 有意水準を 5%とすると P値が 0.05より小さければ,回帰係数が有意と

なる. 即ち,「回帰係数は 0ではない」と言える.

偏回帰係数 説明変数を回帰式に取り込んだ場合の係数.まだ取り込んでいない量

的な説明変数に対しては,その説明変数を回帰式に加えたときの,偏

回帰係数の符号を示す.

標準偏回帰係数 説明変数間の相関が小さい場合に,各説明変数が目的変数にどれ位影

響を与えているかの指標となる.

トレランス,VIF 一般に,トレランスが 0.1 以下,VIF が 10 以上である場合に,多重共

線性が生じていると考える.多重共線性があるとは,回帰式に取り入

れた説明変数間に相関が強いことを示し,その時に回帰式は不安定で

再現性がないものになる.よって変数選択をやり直すことも検討する.

(VIF=1/トレランス)

変数選択の方法として,以下の方法があります.

手動選択 回帰式に入れたい変数は行をクリックする.変数の行が着色される.

回帰式から除きたい変数は再度行をクリックし,着色を消す.

以下の技術的評価などを加味し,対話的に手動で変数を選択する.

①固有技術的に説明がし易いか

②計測または制御が容易であるか

③時系列予測の場合,先行性があるか

④偏回帰係数の符号が固有技術と一致するか

通常,変数は分散比(F値)の大きい変数(例えば F=2.0 以上)を回帰式に

取り入れる.また,定数項を外し定数項を 0 にすると,原点を通る回帰式を求

めることができる.(変数選択候補が多い場合は,分散比でソートする機能が

便利)

2.4 変数選択

Page 22: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-5

重回帰分析・数量化Ⅰ

PART

第2章

逐次変数

選択

変数を回帰式へ取り入れる条件(Fin),あるいは回帰式から変数を取り除く場

合の条件(Fout)を指定し,自動的に変数選択を行います.(Fin ≧Fout)

◆変数増減法:変数増加法から出発し,必要があれば回帰式から説明変数を除

◆変数減増法:変数減少法から出発し,必要があれば回帰式に説明変数を加え

◆変数増加法:定数項しか含まない回帰式から始め,説明変数を 1 つずつ取り

込んでいく

◆変数減少法:全変数が含まれた回帰式から始め,説明変数を 1 つずつ回帰式

から除いていく

◆逐次選択 4 方法:変数増減法,変数減増法,変数増加法,変数減少法を行っ

て,自由度2重調整寄与率が最も高い変数の組み合わせを自動的に求める

逐次変数選択は,2段階に分けて行われます.

第一段階では,基準値を小さくして多めに説明変数を取り入れるようにして,

予測に有効な変数を見逃す誤り<第2種の誤り>を防ぎます.

第二段階では,基準値を大きくして予測に役立たない変数を除去して<第1種

の誤り>を防ぎます.

総あたり法 説明変数が 10 個以下の場合,説明変数のすべての組み合せの回帰式を求めるこ

とができます.最終的には,自由度 2 重調整済寄与率が最も大きくなった説明

変数の組み合わせが選択されます.

全変数選択 量的変数と質的変数を全て使って回帰式を求めます.

ただし,全変数選択では,説明力の低い変数が入り,回帰式の精度が低下する

ことがあるので注意が必要です.

変数選択の履歴は「選択履歴」タブで確認することができます.

最初に画面を表示した時に,変数が選ばれていない状態か(手動選択),もしくは変数が全て選

ばれている状態か(全変数選択)は,オプションで設定できます.

2.4.1 強調表示

■起動方法

1.ツールボタン「オプション」をクリックし,基準値を設定する.

2.ツールボタン「強調表示」をクリック.

本画面では,選択/除外のヒントとして分散比や,多重共線性の検出のためにトレランスや VIF

を強調表示することができます.

2.4.2 変数選択法の初期状態

■起動方法

1.ツールボタン「オプション」クリック.

2、変数選択の初期状態を「手動選択」か

「全変数選択」に設定.

手動選択とは,最初に定数項のみが取り込

まれている状態で,手動で変数選択を行う

ものです.それに対して,全変数選択は,

変数の指定ダイアログで指定した全ての変

数が取り込まれている状態です.(ただし,

多重共線性があるものは除く)

ここで設定した初期状態は次回起動時にも

有効となります.ユーザーが使いやすい方

に設定してください.

3.6 変数選択タブ

2.4 変数選択

Page 23: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-6

2.4.3 選択履歴での変数確定

■起動方法

「選択履歴」タブでツールボタン「変数確

定」クリック.

選択履歴タブでは,変数選択の経過と統計

量を表示します.初期表示では,自由度2

重調整寄与率が最も大きい説明変数の組み

合せは反転表示されています.

自由度 2 重調整済寄与率や残差平方和など

を比較して各モデルの評価を行い,モデル

を確定します.

「変数選択」タブと同様に,各指標の列を

選んでソートしたり,強調表示を行うこと

で,モデル選択のヒントにすることができ

ます.

なお,「00 05 06 ・・・」は変数 No.

に対して 1 を表示し,どの説明変数が取り

込まれているかを示します.例えば,00 と

05 の列に 1 が表示されていれば,定数項と

変数 No.5の説明変数が取り込まれています.

2.4.4 SE変化グラフの確認

■起動方法

タブ「SE変化グラフ」クリック.

残差平方和 SE の変化を青色のグラフ,自由

度 2 重調整済寄与率 R**^2 の変化を赤色の

グラフで見ることができます. SEが小さく

なっているところや,R**^2が大きくなって

いる箇所に注目し,各モデルを検討します.

2.4.5 偏回帰プロットの確認

■起動方法

タブ「偏回帰プロット一覧」クリック.

(回帰式に量的変数が 2つ以上の場合に表

示)

偏回帰プロットは重回帰式を作成した後に,

回帰診断(その回帰モデルが妥当であるか

どうかを検証する)で用いられます.

偏回帰プロットの横軸は表示された変数名

を目的変数として,残りの説明変数で回帰

式を作成した場合の残差,縦軸は回帰式に

用いられた目的変数を除いて横軸の変数を

目的変数として回帰式を作成した場合の残

差を表示しています.

散布図上に表示されている「a=数値」は

それぞれの散布図の傾きを表し,その値は

作成した回帰式の偏回帰係数に一致します.

同様に,「r=数値」は各説明変数と目的

変数の偏相関係数を表示しています.

プロットは直線状に並ぶことが好ましく,

非線形な傾向や外れ値があるかどうかを視

覚的にチェックします.

「偏回帰プロット一覧」タブで偏回帰プロ

ットを選択後,

①ダブルクリック

②「拡大」ボタンをクリック

③「偏回帰プロット」タブに移動

上記いずれかの操作をすると,拡大されま

す.

拡大後,範囲を選んでから「データ探索」

をクリックし特徴的なサンプルをマーキン

グしておくと,強調表示することができ便

利です.

2.4 変数選択

Page 24: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-7

重回帰分析・数量化Ⅰ

PART

第2章

2.5 確定モデル

「変数選択」後に確定したモデルへのデータの当てはまり度合いや予測精度,多重共線性につい

て確認します.画面下に表示された式が,求められた回帰式となります.ここでの統計量の意味

については「変数選択」の項を参照してください.

上の例だと

価格=-100390.332+15.099×(土地面積)+・・・+ +0.000 (各停)・・・+ +0.000(乗らない)

+429.263 (快速) ―2141.037(乗る)

―832.636 (特快)

となります.

2.5.1 確定モデルの回帰係数の確認

■起動方法

タブ「回帰係数」クリック.

回帰式に量的変数が取り込まれている場合に

使用可能です.

多重共線性をチェックするために,オプショ

ンで「トレランス」や「VIF」を表示したり,

強調表示することができます.多重共線性に

ついては変数選択画面を参照してください.

■用語解説

用語 説明

t 値,P

値 ( 両

側)

その説明変数の回帰係数(偏回帰係

数)が0といえるかどうかの検定を

行うための統計量(0なら回帰の意

味がない).t値が大きく,有意水

準を 5%とすると P値(両側)が 0.05

より小さければ,回帰係数が有意と

なる. 即ち,「β1=0 ではない」

と言える.ここで,t値は偏回帰係

数を標準誤差で割ったもの.

「t値」や「トレランス」「VIF」の確認には,

ソート機能が有効です.

2.5.2 確定モデルのカテゴリスコアの確認

■起動方法

タブ「カテゴリスコア」クリック.

説明変数に質的変数が選択されているときに

使用可能です.各アイテムの第1カテゴリを

0.00 としたときの各カテゴリスコアの差と,

対応するt値,p値(両側)を一覧で見るこ

とができます.

ここではカテゴリの統合を検討します.

カテゴリ内のスコアの差が小さく,t値も小

さい場合,それらのカテゴリを統合し,再解

析することを検討してみます.t値が 1.4 以

下をカテゴリ統合の一応の目安にする場合が

あります.実際には各カテゴリの意味を十分

に考慮し,t値がかなり小さいことを確かめ

てから統合を行ってください.ここで,オプ

ションで t 値の基準値を設定すると,強調表

示がされ,統合のヒントになります.

2.5 確定モデル

Page 25: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-8

また通常,各カテゴリに属するサンプル数は

5以上必要であり,10 以上あることが望まし

く,これより少ない場合は,類似のカテゴリ

と統合した方がよいでしょう.

2.5.2.1 カテゴリの統合

■操作方法

1.ツールボタン「カテゴリ統合」クリック.

2.統合するカテゴリと統合先を選択して

[→]ボタンをクリック.

3.「OK」ボタンで確定すると,「名称変更」

ダイアログが表示されるので,必要ならば,

名称を変更する.

4.統計量を再計算し,「変数選択」が表示さ

れる.

2.5.3. 予測判定グラフ

■起動方法

タブ「予測判定グラフ」クリック.

目的変数の予測値を横軸に実測値を縦軸にし

た散布図を表示します.斜め 45度の直線状に

プロットされていれば,回帰式にあてはまっ

ているといえます.

各統計量の説明については「変数選択」の項

を参照してください.

2.5.4. 確定モデルの分散分析表

■起動方法

タブ「分散分析表」クリック.

(回帰式に量的変数が取り込まれている場

合に使用可能)

求めた回帰式が意味をもつかどうか,即ち,

全部の偏回帰係数が 0 であるかどうかの帰無

仮説を検定します.P値が有意水準より小さく

有意の場合は,回帰式は意味があるといえま

す.

ただし,データ数が多い場合,回帰式はほと

んど有意となるので,これだけで判断するこ

とがないようにして下さい.

2.6 残差の分布と残差の連関

目的変数yと求められた回帰式から計算した推定値との差を残差と呼びます.

回帰分析の結果を検討するうえで残差の検討は大切です.残差の検討では,求められた回帰式に

ついてモデルどおりの仮定が成立っているか否かを確認します.

残差については,特に以下の点についてチェックを行うとよいでしょう.

2.5 確定モデル

2.6 残差の分布と残差の連関

Page 26: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-9

重回帰分析・数量化Ⅰ

PART

第2章

項目 チェック内容 主な確認画面

不偏性 残差の期待値が0になるかど

うか

ヒストグラム

独立性 ・残差間は独立(無相関)で

あるかどうか

・残差と説明変数は独立(無

相関)であるかどうか

散布図

時系列プロット

等分散性 残差の分散が一定であるかど

うか

散布図

正規性 残差は正規分布N(0,σ2).

(基準化残差は標準正規分布

N(0,12))に従うかどうか

ヒストグラム

残差の検討で,モデル通りの仮定が成り立っているかどうかをチェックしますが,通常

はまず,重回帰分析・数量化Ⅰ類を行う前に,予備解析を行い,外れ値等をチェックし

ておくのが重要です.

残差の検討でモデルから外れた値を見つけた場合,そのデータを解析から外すことが考

えられます.しかし,外れた値には重要な情報が含まれている場合(例えば他の説明変

数による影響を強くうけている場合や特異な現象,入力ミスなど)も多く,むやみに解

析から外してはいけません.十分調査したうえで,外れ値を解析に用いた場合と用いな

い場合それぞれの結果を吟味する必要があります.

2.6.1 モデルから外れた残差をチェックする

■操作方法

タブ「残差一覧表」や「テコ比と残差 t値」,

「残差 t値のヒストグラム」クリック.

「残差一覧表」のタブでは,実測値,予測値,

残差とその残差 t 値(的スチューデント化残

差),テコ比,予測残差を表示します.

画面左上のドロップダウンリストで残差/基

準化残差(ei‘=ei/√Ve)の切り替えを行う

ことも可能です.

テコ比とは,回帰式の推定に対するi番目サ

ンプルの影響の程度を表します.回帰式の計

算において, 平均から離れているサンプルほ

ど回帰式を自分の方に引きつける力が強くな

り,これを定量的に表したものがテコ比です.

ここでは残差やテコ比が大きいサンプルに注

意します.

「出力基準値変更」機能を使うと,基準値よ

り大きいサンプルだけを表示することができ

ます.(ここで出力したサンプルは「テコ比

と残差 t値」タブで確認することができます.)

また「強調表示」機能でも,それらの特徴的

なサンプルを見つけやすくすることができま

す.

「テコ比と t 値」タブでは,x 軸に残差t値,

y軸にテコ比を取り,散布図を表示します.テ

コ比側あるいは,t値側から見て,残差の大き

なサンプルを確認することができます.

ここでは,テコ比の平均値の 2.5 倍以上のデ

ータがあるかt値の絶対値が 2.0 を越えるデ

ータがあるかなどに注目します.必要ならば

データの探索を行い,散布図上のプロット点

からサンプル番号とその値を確認します.

2.6 残差の分布と残差の連関

Page 27: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-10

「残差 t値のヒストグラム」タブでは,残差 t

値のヒストグラムを描きます.t値の大きなサ

ンプルの有無を確認することができます.

2.6.2 不偏性や正規性をチェックする

■操作方法

タブ「正規確率プロット」や「残差のヒスト

グラム」クリック.

「正規確率プロット」タブでは,分布の形が

正規分布とみなせるかどうかの検討に用いま

す.ここでは残差の正規性を確認してみまし

ょう.

正規確率プロットを利用する際,プロットさ

れた点が右上がり 45°にほぼ一直線上に並ん

でいれば正規分布とみなされます.

また,正規性検定で有意水準を 5%とすると,P

値が 0.05以下の場合は,「残差が正規分布に

従っている」という仮説を棄却しますが,P値

が 0.05以上の場合は仮説を棄却しません.

「残差のヒストグラム」タブでは,0を中心と

した正規分布をしているか否かをチェックし

ます.

2.6.2.1 残差の大きなサンプルをマスクする

■操作方法

1.タブ「残差のヒストグラム」で,ツールボ

タン「外れ値」クリック.

2.マスクしたい外れ値のデータをクリック

し,反転させる.

3.「マスク」ボタンをクリック.

4.マスクを解除したい場合は,マスクを解

除したいサンプルをクリックし,「マスク解

除」ボタンをクリック.

「外れ値」ボタンを押すと,偏差値が大きな

サンプルが表示されます.

偏差値 3以上・・・・・・・**

偏差値 2.5以上 3未満・・*

マスク状態・・・・・・・・M

(属性が重なる場合は M>**>*の順番で優先)

該当するサンプルをマスク後,回帰分析の再

計算を行うことができます.

2.6.3 独立性や等分散性をチェックする

■操作方法

タブ「時系列プロット」やグループ「残差の

連関」クリック.

「時系列プロット」タブの中に表示されるダ

ービンワトソン比は,残差の系列がランダム

であるかどうかを見るための統計量です.ダ

ービンワトソン比は,0≦d≦4 の範囲内の値

を取り,残差の系列がランダムであれば 2 に

近い値となり,隣同士に正の相関(大きな波

2.6 残差の分布と残差の連関

Page 28: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-11

重回帰分析・数量化Ⅰ

PART

第2章

のような系列)があれば 0 に,負の相関(ギ

ザギザした系列)があれば 4 に近い値を取り

ます.

「残差との連関図」グループとは,残差との

連関図をコンパクトに表示します.特に残差

と説明変数の関係が無相関の状態かを視覚的

にチェックすることができます.また残差が

等分散になっているか,くせがないかどうか

なども見ることができます.

「残差との連関図」タブで連関図を選択後,

①ダブルクリック

②「拡大」ボタンをクリック

③「連関図(拡大)」タブに移動

上記いずれかの操作をすると,拡大されます.

拡大後の散布図では縦軸の目盛の数値は 0 を

中心とし,上下に残差の標準偏差の±1σ,±

2σ,±3σ線を表わしています.必要ならば

「データ探索」機能で,該当サンプルをマス

クし,再計算することもできます.

2.7 予測

回帰式に取り入れた各変数に,任意の値を入力し,目的変数の予測値を計算させることができま

す.最大 100 サンプルの予測を行えます.予測された各統計量を吟味し,データの収集条件,規

格値や許容度などを考慮して十分に検討します.

オプションで「詳細表示」に設定すると,予測値とこれから取られるデータのα%予測区間に加

えて,データの標準誤差,母回帰のα%信頼区間と標準誤差,テコ比が表示されます.信頼率α

はオプション内で設定できます.

■用語解説

用語 説明

予測値 説明変数 xの値を与えたときの目的変数 yの予測値

データのα%予測区間 理論上,データが存在する範囲.推定した値のまわりに正規分布を仮

定し,個々のデータが理論的にα%の確率でこの区間内に存在するこ

とを意味する.回帰式の信頼度が低ければこの区間の幅が大きくなり

実用に耐えられなくなる.なお,求められた予測値はあくまでも 50%

平均値であり,可能性としては,この信頼区間内の全ての値を取りう

る可能性があるので,予測値で判断をする場合にはこの点に注意する.

母回帰のα%信頼区間 回帰直線がxの平均値に対するyの予測値を支点として変動する範囲

で,理論上,回帰直線が通る可能性のある範囲.

テコ比 回帰式の推定に用いたデータの重心(平均)からのマハラノビス距離と

線形の関係にある統計量で,回帰式の推定に対するサンプルの影響の

程度を示す.テコ比の大きいものは注意が必要(外挿のおそれがある).

2.7 残差の検討

2.6 残差の分布と残差の連関

2.7 予測

Page 29: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-12

2.7.1 重回帰式を使って予測をする

■操作方法

1.説明変数のセルをクリックすると,画面

左上に,その説明変数の最小値と平均値,最

大値が表示されるので,それを参考にし値を

入力する.

2.ツールボタン「計算開始」クリック.

なお,既に入力した数値を消したい場合は,

「データクリア」ボタンを押します.

回帰分析に用いた説明変数xのデー

タより大きい値や小さい値を指定す

ると,「外挿による予測を行っていま

す」というメッセージが表示され,デ

ータの前に#が表示されます.「外

挿」,すなわち「範囲外データ」によ

る予測は,推定値の信頼度を下げた

り,回帰式そのものが適合しない危険

性があるため注意して下さい.

2.7.2マスクしたデータの予測をするには

■操作方法

画面右上のリストで「マスクデータ予測」を

選択

ワークシート上でマスクしていたデータがあ

れば,そのデータの値を使って,予測が行わ

れます.

マスクデータが多い場合は先頭から 100 サン

プルのマスクデータについて予測を行います.

2.7.3 予測値をワークシートに登録する

■操作方法

ツールボタン「変数登録」クリック.

「予測」タブで入力した説明変数の値と,予

測やその他の統計量をワークシート上に登録

します.ワークシートで登録することにより,

基本解析などのその他の解析に使えるように

なります.

参考:AICの算出式の導出

重回帰分析では,分布の仮定は誤差に対してのみ仮定される;

ippiii xxy 110 , 2,0 ei N

このことから,重回帰分析の尤度は

2

1

2

2

12

2

2exp2

2exp

2

1

e

n

i iine

nn

i e

ii

e

yyL

となる.特に,最尤法でのパラメータはβ0,β1,…,βp,σeであることに注意(AICを算出す

る際のパラメータ数に関係する).

これより,対数尤度は

2

1

2

2

1

2

2

2ln2ln

22exp2lnln

e

n

i ii

e

e

n

i iine

n yn

nyL

となる.最尤法では,パラメータβ0,β1,…,βp,σeは対数尤度 lnL が最小となるように推定

される.

まず,パラメータσeを推定するために,対数尤度 lnL をσeで偏微分すると

3

1

2

2

1

2

2ln2ln

2

ln

e

n

i ii

ee

n

i ii

eee

ynyn

nL

となるので,これが 0となるようなσeを求めると

n

i iie

e

n

i ii

e

yn

yn1

22

3

1

21

0

2.7 予測

Page 30: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-2-13

重回帰分析・数量化Ⅰ

PART

第2章

となる.よって,このσeを対数尤度 lnL に代入すると

2

1ln

22ln

22

1ln2ln

2ln

1

2

1

2 ny

n

nnny

nn

nL

n

i ii

n

i ii

となる.

次に,パラメータβ0,β1,…,βpを推定するために,対数尤度 lnL をβiで偏微分すると

n

i iii

n

i ii

n

i iiii

yn

yn

nny

n

nnL1

21

1

2

1

2 11

22

1ln

22ln

2

ln

n

i iii

n

i ii

n

i iiii

yn

yn

nny

n

nnL1

21

1

2

1

2 11

22

1ln

22ln

2

ln

となる.これより,パラメータβ0,β1,…,βpの最尤推定値は最小二乗解と一致することが分

かる.

≪まとめ≫

・最尤度では,パラメータはβ0,β1,…,βp,σeとなる.特に,パラメータに誤差の標準偏

差も含まれることに注意.

・誤差の標準偏差の最尤推定値は e

n

i iie Sn

yn

1

22

となる.

・パラメータβ0,β1,…,βpの最尤推定値は最小二乗解と一致する.

一般的に,AICは

AIC=-2×最大対数尤度+2×パラメータ数

で定義されるので,重回帰分析の場合は

pSn

nnnpnyn

nnpLAIC e

n

i ii 21

ln2ln2ˆ1

ln2ln2ln21

2

ただし,パラメータ数 p は,上記の注意の通り,

p=定数項を含む偏回帰係数の数+1= 1 en

となる(+1 は誤差の標準偏差の分).

≪まとめ≫

・重回帰分析の AICは次のように算出される;

pSn

nnnAIC e 21

ln2ln

p=定数項を含む偏回帰係数の数+1= 1 en

2.7 予測

Page 31: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-3-1

直交多項式回帰

PART

第3章

第3章 直交多項式回帰

3.1 直交多項式回帰とは

■目的

直交多項式回帰分析とは,yを目的変数とし,xを説明変数とするとき,回帰曲線

y=β0+β1x+β2x2+・・+βPx

P+ε

の式によって現象を説明しようとする手法です.

直交多項式回帰分析は,説明変数が1つで目的変数との関係が直線か曲線か,また曲線の場合には

何次式が適当なのかが問題となり,次元を上げながら残差の検討,分散分析等を行い最適な回帰式を

求めます.

次元の増加は最大6次元まで可能です.また,データ数が少ない場合には次元の増加の制限は,(有

効サンプル数)-2より少ない分だけしか増加できません.また,次元の減少は1次元まで可能です.

■活用場面

・材料硬度から製品硬度への影響度の分析 など

■データ入力形式

解析可能なデータ数は,目的変数の和×水準数(サンプル数)<=8192です.

(サンプル名)

[サンプル名]

(鋳込み温度)

[量的変数]

(比重 1)

[量的変数]

(比重 5)

[量的変数]

1 1.30 4.56 … 1.53

2 1.40 2.67 … 2.12

3 1.50 3.10 … 3.58

4 1.60 3.46 : 4.32

■機能構成

機能 解析操作 内容

変 数 の

指定

説明変数と目的変数を指定する

変 数 選

次元の変更 何次元の多項式を当てはめるのかが適当か

検討する.

次元の増加 直交多項式の次元を増加する.

次元の減少 直交多項式の次元を減少する.

正規直交多項式の

係数

各次元における正規直交多項式の回帰係数

を表示する.

分散分析表 回帰式における分散分析表の表示

確 定 モ

デル

特性値グラフ 回帰式の当てはめが妥当かどうか特性値をグ

ラフ表示

オプション ・X軸と Y軸の目盛を設定する.

・最高次数での回帰曲線の表示/非表示の設

定.

・各次元の回帰曲線の重ね合わせの表示/非

表示の設定.

推定値 説明変数の値ごとに,目的変数の実測値の

平均値,推定値,残差(平均値-推定値)を

表示する.

3.1 直交多項式回帰とは

Page 32: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-3-2

残差プロット 横軸を説明変数,縦軸を残差としてプロットす

る.

目盛変更 X軸と Y軸の目盛を変更する.

予測

予測 計算開始 入力された値をもとに,特性値の予測値と信

頼区間を計算する.

データクリア 画面に入力されたデータを全てクリアする.

オプション 信頼区間の信頼率を変更する.

3.2 手法の選択

選択方法 [手法選択]-[多変量解析]-[直交多項式回帰]

3.3 変数の指定

種類 変数の数 操作

説明変数 量的変数 1 説明変数(x)とする変数を選択して「説明変数」

リストの左側の[>]ボタンをクリック.

目的変数 量的変数 1~63 目的変数(y)とする変数を選択して「目的変数」

リストの左側の[>]ボタンをクリック.

サンプル名 サンプル名1(0可) サンプル名をリストより選択.

3.4 次元の変更

何次元の多項式を当てはめるのかが適当かど

うかを検討します.初期表示では1次までの直

交多項式分析結果を表示しています.各指標の

意味については「重回帰分析・数量化Ⅰ類」の章

を参照してください.

何次式を当てはめるのが適当か分からない場合

には,まず1次式を当てはめてから,順に次元を

1つずつ上げ,逐次に検定を行い高次の項を追

加していく方法が取られます.どこまで次元を上

げていったらよいかは,分散分析表の画面で残

差の分散か級内変動と比べて有意かどうかを検

討し判断します.

3.5 直交多項式結果

指定した変数について1次までの直交多項式

分析結果を表示します.

多項式の当てはめを行う場合には,何次式

を当てはめるのが適当かわからない場合がありま

す.このような場合には,まず1次式を当てはめ

てから,順に次元を1つずつ上げ,逐次に検定を

行い高次の項を追加していく方法が取られます.

画面中央には,直交回帰係数,回帰係数,係数

の標準誤差,係数のt値を表示します.画面下部

には,重相関係数および寄与率を表示します.

どこまで次元を上げていったらよいかは,分散分

析表の画面で残差の分散か級内変動と比べて

有意かどうかを検討し判断します.

直交多項式の当てはめにおいては,各項の

係数は独立で,次数を上げていっても低次の項

の係数は変化しません.従って,多項式の次数

を決定するにあたっては直交多項式による当て

はめを行うとよいでしょう.

回帰式の次数を1つずつ上げていった場合は,

次の分散分析表を見ながら,回帰式の1次成分,

2次成分について順次有意かどうか検定結果を

みながら解析をすすめていく必要があります.ま

た画面下部のタブをクリックすることによりさらに

詳しく解析することができます.

3.6 分散分析

分散分析表では,回帰からの残差の分散を

最高次の誤差分散(級内変動)で検定していま

す.有意な場合にはさらに次元を上げた方がよ

いのか,検討する必要があります.

3.1 直交多項式回帰とは 3.2 手法の選択 3.3 変数の指定

3.4 次元の変更 3.5 直交多項式結果 3.6 分散分析

Page 33: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-3-3

直交多項式回帰

PART

第3章

3.7 特性値グラフ

回帰式の当てはめが妥当かどうかグラフにより

視覚的にチェックすることができます.特性値を

プロットし,現在の次元における回帰曲線とその

95%信頼区間の表示あるいは各次元ごとの曲

線の重ね合せを表示することができます.

3.8 予測

求められた回帰式を使って,説明変数に対して

任意の値を入力し,目的変数の値を予測するこ

とができます.説明変数の値を入力後,ツールボ

タン[計算開始]をクリックして下さい.また,外れ

値等マスクデータがある場合には,ドロップダウ

ンリストをマスクデータの予測に切り替えることに

より,マスクデータの予測を行います.

3.6 分散分析

3.7 特性値グラフ

3.8 予測

Page 34: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-1

ロジスティック回帰分析

PART

第4章

第4章 ロジスティック回帰分析

4.1 ロジスティック回帰分析とは

ロジスティック回帰分析は,目的変数pが比率データ(0.0~1.0 の範囲に限定される)の場合にpiのロ

ジット変換値( zp

pi

i

i

ln1

)に対する回帰式を求め,pの値を予測する手法です.

z i=b0+b1x1+b2x2+・・・+bpxp+ε

ここで,b0を定数,biを偏回帰係数,εを誤差と呼びます.求めた z i より exp( )

pz

i

i

1

1を

求めます.

目的変数は反応のあった個数rと全体のサンプル数nの2変数,または(1:反応あり,2:反応なし)の

質的変数にて入力されます.本システムでは,前者を“集団観測値”,後者を“個々の観測値”と呼びま

す.

目的変数が集団観測値の場合には,データを比率piに変換して解析に用います(ただし,nは正の

整数,rは0または正の整数).

pr

ni

i

i

なお,個々のサンプルが観測されている場合(本システムでは個々の観測値という)には,サンプルご

とに良・不良などの結果を0,1あるいは1,2で入力します.またn個中r個が不良の場合(集団観測値

と呼ぶ)には,ある条件で観測された結果をそれぞれ不良個数r,試料個数nとして入力します.

4.1 ロジスティック回帰分析とは

Page 35: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-2

■機能構成

ロジスティック回帰分析

変数の選択

集団観測値に基く解析

変数選択 残差の検討 一覧表 出力基準値

変数登録

予測判定グラフ

閉じる

データ探索

Arocin変換

ヒストグラム 外れ値

正規確率プロット オプション

時系列

連関図 拡大

変数の追加

テコ比と残差 データ探索

変数選択方法

精密解

打切回数

変数の選択

選択履歴 寄与率変化グラフ

回帰係数

カテゴリスコア カテゴリの統合

スコアグラフ

予測 計算開始

オプション

データ探索

層別

オプション

個々の観測値に基く解析

変数選択 残差の検討

一覧表 出力基準値

変数登録

予測判定グラフ

閉じる

ヒストグラム 外れ値

正規確率プロット オプション

時系列

連関図 拡大

変数の追加

データ探索

層別

オプションテコ比と残差 データ探索

変数選択方法

精密解

判定グラフ 判定境界値変更

打切回数

変数の指定

ロジスティック判別

ジャックナイフ判別

判定結果 境界変更

サンプル表示 境界変更

判定境界値と誤判定率

誤判定グラフ 強調表示

ROC曲線

判定結果 境界変更

サンプル表示 境界変更

判定境界値と誤判定率

誤判定グラフ 強調表示

ROC曲線

選択履歴 寄与率変化グラフ

回帰係数

カテゴリスコア カテゴリの統合

スコアグラフ

予測 計算開始

オプション

グルーピング オプション

4.1 ロジスティック回帰分析とは

Page 36: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-3

ロジスティック回帰分析

PART

第4章

手法の選択 メニューから[手法選択]-[多変量解析]-[ロジスティック回帰分析]を選択します.

4.2 データ形式

ロジスティック回帰分析で扱えるデータ形式は,以下の例のようになっています.

目的変数が量的変数の場合(集団観測値)

No検査件数[量的変数]

要因B[量的変数]

要因A[量的変数]

変数名サンプル名

1 10.01.025.01

2 15.02.032.02

3 12.03.038.03

4 15.05.042.04

5 13.06.047.05

故障件数[量的変数]

2.0

3.0

4.0

2.0

1.0

目的変数

目的変数が質的変数の場合(個々の観測値)

目的変数

No再発の有無[質的変数]

要因B[量的変数]

要因A[量的変数]

変数名サンプル名

1 21.90.81

2 21.40.92

3 10.80.83

4 10.71.04

5 21.30.95

要因C[量的変数]

0.996

0.992

0.982

0.986

0.980

4.1 ロジスティック回帰分析とは

4.2 データ形式

Page 37: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-4

扱える説明変数は,集団観測値の場合には最大 254 まで,個々の観測値

の場合には最大 255 まで解析に用いることができます.

質的変数を解析対象に含める場合には,説明変数のアイテムカテゴリ総

数は最大 600 ですが,各質的変数のカテゴリ数は2以上 24 以下です.ま

た,任意の2変数の個々のデータが全て同値である場合は,解析するこ

とができません.

目的変数が,質的変数(2値)である場合,比率はサンプル数のうちの

カテゴリ2の割合を意味しています.予測比率には,カテゴリ1を 0.0,

カテゴリ2を 1.0 として表示します.

2値の量的変数を目的変数として,質的変数である場合と同様に解析を

行なうことができます.

4.3 変数の指定

「変数の指定」ダイアログにおいて,解析に用いる

変数を指定します.

目的変数は,量的変数,質的変数のどちらも扱うこ

とができます.集団観測値に基づく解析の場合には,

最後に指定した2つの変数を目的変数(r,nの順)と

し,それ以外の変数を全て説明変数として解析しま

す.個々の観測値に基づく解析の場合には,最後

に指定した変数を目的変数として解析します.

集団観測値の場合では,比率pは,

p

最後の1つ前の変数

最後の変数

となります.必ずこの順序で変数を指定して下さい.

使用する変数内に欠測値が存在する場合は,その

サンプルおよびマスクサンプルを除いて,解析を行

います.

4.4 変数選択

「変数の指定」ダイアログで[次へ進む]をクリックす

ると,変数選択ウィンドウが表示されます.

ここでは,尤度比の変化量やχ2(カイ二乗)の上側

確率値などを手がかりに,変数の選択を行います.

尤度比の変化量の大きい変数または,χ2(カイ二

乗)の上側確率値(P 値(上側))の小さい(例 0.01 以

下)変数をクリックし,回帰式に取り込みます.取り込

んだ変数を再びクリックすると,その変数は回帰式よ

り外されます.

変数を1つ取り込むと,変数選択ウィンドウの表示

は図のように変わります.

変数番号,変数名,各説明変数を取り込んだ場合

の尤度比検定量,尤度比検定量の変化量,χ2(カイ

二乗)の上側確率値(p),偏回帰係数などが表示さ

4.2 データ形式

4.3 変数の指定

4.4 変数選択

Page 38: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-5

ロジスティック回帰分析

PART

第4章

れます.

表の上部3行には,逐次計算による第1次近似解と

して,各種統計量(寄与率,他)が表示されます.

ここで,主な統計量について簡単な説明をします.

[尤度比検定量]

対数尤度の変化を評価する値です.

[寄与率(尤度比)]

得られた式での対数尤度を定数項のみの対数尤

度で割って求めます.通常の回帰分析の回帰による

平方和と総平方和を得られた式の対数尤度と定数

項のみの対数尤度に対応させてみることができま

す.

[二重調整寄与率(尤度比)]

寄与率は,回帰式に取り込む変数が多くなればな

るほど,値が大きくなります.しかし,取り込まれた説

明変数の数により調整した二重調整寄与率は,効果

のない説明変数を取り込むと下がります.二重調整

寄与率の大きなモデルがよいといえます

ツールボタン 昇順ソート 尤度比変化量またはχ2の

上側確率で昇順ソート

降順ソート 尤度比変化量またはχ2の

上側確率で降順ソート

変数番号順ソート 変数番号順にソート

残差の検討 目的変数yと求められた回

帰式から計算した予測値と

の差(残差)の検討を行いま

す.「4.10 残差の検討

(個々の観測値,集団観測

値)」を参照.

変数選択方法 逐次選択,全変数選択,全

解除の設定

精密解 精密解を求める

打切回数 反復計算の打ち切り回数(1

~50)を入力設定

判定グラフ 判定グラフ表示.(個々の観

測値つまり2値データの解

析のみで,しかも説明変数

が1つの場合).

ロジスティック判別 (個々の観測値に基づく解

析のみの機能)「4.11 判

定結果(ロジスティック判別,

ジャックナイフ判別)」を参

照.

ジャックナイフ判別 (個々の観測値に基づく解

析のみの機能)「4.11 判

定結果(ロジスティック判別,

ジャックナイフ判別)」を参

照.

タブ 選択履歴 変数選択の履歴を表示.

「4.5 選択履歴の評価」を

参照.

回帰係数 偏回帰係数,標準誤差,χ2

の上側確率,トレランス等を

表示.「4.6 回帰係数」を

参照.

カテゴリスコア カテゴリスコアを表示.「4.7

カテゴリスコア」を参照.

予測 回帰結果の予測を行う.「4.

8 予測」を参照.

グルーピング データのグルーピングを行

う.(個々の観測値に基づく

解析のみ),「4.9 グルー

ピング(個々の観測値)」を

参照.

反復計算の打切基準は偏回帰係数の変化

量の比が 0.0001(絶対値)であり,また,

反復回数の制限(打ち切り回数)の初期

値は 30回となっています.

メニューボタン[精密解]をクリックすると,図のよう

に解析結果が表示されます.

回帰式に取り込まれた変数番号,変数名,回帰式を

吟味するための各種統計量(尤度比検定量,尤度比

検定量の変化量,χ2の上側確率 (p),偏回帰係数

など)が表示されています.

ここで,尤度比検定量はその変数を除いた,ある

いは取り込んだときの尤度比検定量を意味し,変化

量は,変数を取り込むときの尤度比検定量の変化す

る量を意味します.

4.4 変数選択

Page 39: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-6

4.5 選択履歴の評価

「変数選択」ウィンドウ上側の「選択履歴」タブをクリ

ックすると,図のように変数選択の履歴が一覧表示さ

れます.

ここでの機能は,以下のとおりです.

ツールボタン 寄与率変化グラフ

変数の選択履歴に応じて,二重調整寄与率の

変化量グラフを表示します.変数を取り入れたこと

によって二重調整寄与率がどのように変化するか

視覚的に確認することができます.

4.6 回帰係数

「変数選択」ウィンドウ上側の「回帰係数」タブをクリッ

クすると回帰式に取り込んだ量的変数について,回

帰係数の詳細が表示されます.ここでは,偏回帰係

数に関して,さらに検討をすることができます.

変数番号,変数名,偏回帰係数,標準誤差,χ2の

上側確率,トレランスなどが表示されます.χ2の上

側確率が5%有意の場合には「*」が,1%有意の場

合には「**」が表示されます.

ツールボタン 昇順ソート P 値(上側確率)またはト

レランスで昇順ソート

降順ソート P 値(上側確率)またはト

レランスで降順ソート

変数番号順ソート 変数番号順にソート

実数/指数 実数表示と指数表示の切り

替え

4.7 カテゴリスコア

「変数選択」ウィンドウ上側の「カテゴリスコア」タブ

をクリックすると,回帰式に取り込んだ質的変数の回

帰係数の詳細(対角線左下にカテゴリ間のスコアの

差,右上には対応するp値)が表示されます.

ここでの機能としては,説明変数内のカテゴリを必

要に応じて統合し,その場で再計算することができ

ます.(判別式に質的変数が取り込まれていない

場合は,本画面は表示できません)

ツールボタン カテゴリの統合 あるカテゴリを別のカテゴリに統

合.例えばカテゴリ1・2間のスコ

アの差が小さく,統合する場合に

は,旧カテゴリフィールド内のカ

テゴリ2をクリックし反転,統合先

フィールドのカテゴリ1をクリックし

て反転させ, ボタンをクリック

すると結果フィールドのカテゴリ2

はカテゴリ1に統合されることが

わかります.

スコアグラフ カテゴリスコアのグラフ表示

カテゴリ統合を確認後,[OK]ボタンをクリッ

クすると,「名称変更」ダイアログが表示され,

ここで,統合後のカテゴリ名称を入力し,[OK]

をクリックするとダイレクトにロジスティック回

帰分析の再計算を実施します.

なお,ここで,[変数登録]ボタンをクリックすると,統

合後のカテゴリの情報を新しい変数として登録する

ことができます.

4.5 選択履歴の評価

4.6 回帰係数

4.7 カテゴリスコア

Page 40: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-7

ロジスティック回帰分析

PART

第4章

取り込まれた質的変数のカテゴリスコアをグラフで

表示するには,「スコアグラフ」ボタンをクリックして確

認します.

4.8 予測

「変数選択」ウィンドウ上側の「予測」タブをクリックし

ます.ここで,求めた回帰式に対して取り込んだ各

変数に値を入力し,[計算開始]ボタンをクリックすると,

予測値とその 95%信頼区間が表示されます.また,

出力項目の表示設定によりロジット変換値の予測値

と,信頼区間が表示されます.

ツールボタン 計算開始 入力された値を用いてこの画

面上で予測値を再計算して

みることができる.

データクリア 入力されたデータをクリアす

る.

オプション 予測の出力項目や信頼区間

の設定変更を行う.

詳細/簡易 詳細表示/簡易表示の切り

替えを行います.

信頼区間幅 母回帰の信頼区間の信頼率

を変更します.

4.9 グルーピング(個々の観測値)

個々の観測値に基づく解析(目的変数が質的変

数)の場合,「変数選択」ウィンドウ上側の「グルーピ

ング」タブをクリックすると,判定境界値によるグルー

ピング情報が表示されます.各グループの境界ごと

に,サンプル数,観測値の平均,予測確率値の平均,

χ値などを表示します.またχ2統計量,自由度,χ2の上側確率 (p)などを参考にして,予測値と観測値

との関連性を見ることができます.

データを予測確率値の順に並べ替えて適当な間隔

で区切ってあります.グループ数の初期値は 0.0~

1.0 までを5等分しています.予測確率値の判定境

界値はツールボタンにより変更することができます.

ツールボタン オプション グループ数,境界の決定方法を

指定.

境界等間隔 各グループの境界を等間隔に区

分.

データ等間隔 各グループのサンプル数を均等

に区分グループ数,境界の決定

方法を指定.

4.10 残差の検討(個々の観測値,集団観測

値)

ロジスティック回帰分析の結果を検討する上で,残

差を診断することが大切です.残差とは,観測値と

求められた回帰式から計算した予測値との差のこと

です.ロジスティック回帰分析に用いる残差は,逸脱

度残差とピアソン残差があります.

4.7 カテゴリスコア 4.8 予測

4.9 グルーピング(個々の観測値)

4.10 残差の検討(個々の観測値,集団観測値)

Page 41: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-8

逸脱度残差 :観測値と予測値との対数尤度の差

ピアソン残差:(観測値-予測値)を基準化して

求めた残差

求められた回帰式は,モデルどおりの仮定が成り

立っているかどうかなどを残差から調べます.

メニューボタン[残差の検討]をクリックすると,図の

ように予測値と残差の一覧表が表示されます.

サンプル番号,観測値,予測値,残差,テコ比,予

測残差などが表示されています.

ウィンドウ上部には,サンプルを出力する基準値

逸脱度残差の絶対値 > 1.5

テコ比> テコ比の平均値の 2.5倍

が表示されています.個々の観測値を解析する場

合には,誤判別されたサンプルは基準値に達してい

なくても表示します. 逸脱度残差とピアソン残差の

切り替えは画面上部のドロップダウンリストで行いま

す.

[逸脱度残差]

観測値と予測値との対数尤度の差です.

[ピアソン残差]

観測値と予測値の差を基準化して求めた残差で

す.

[テコ比]

観測値が1単位変化したときの予測値の変化量で

す.通常の回帰分析では,平均値よりかけ離れた観

測値があると,テコ比が大きくなります.ロジスティッ

ク回帰分析では重みを付けているので,予測確率が

0に近いあるいは1に近い重みの小さな点では,テ

コ比が小さくなります.

[予測残差]

i番目の観測値を除いて求めた回帰式による予測

値 iyと観測値

yi との差のei のことです.

ツールボタン 昇順ソート P 値(上側確率)またはト

レランスで昇順ソート

降順ソート P 値(上側確率)またはト

レランスで降順ソート

変数番号順ソート 変数番号順にソート

出力基準値 表示する範囲として全サン

プルまたは, 基準値を設

定.

変数登録 予測値と残差をワークシー

トに登録.

予測判定グラフ 予測値と観測値の散布図

表示.

「4.10.5 予測判定グラ

フ」を参照.

タブ

ヒストグラム 「4.10.1 残差のヒストグラム」

を参照.

時系列 「4.10.2 残差の時系列プロッ

ト」を参照.

連関図 「4.10.3 残差との連関図」を

参照.

テコ比と残差 「4.10.4 テコ比と残差との散

布図」を参照.

4.10.1 残差のヒストグラム

選択されている残差,すなわち,逸脱度残差

あるいはピアソン残差についての,ヒストグラム

を表示しています.

ウィンドウ右側には,残差の種類(逸脱度残差

/ピアソン残差),サンプル数,最小値,最大

値,平均値,標準偏差,ひずみ,とがりなどが

表示されています.

ツールボタン 外れ値

偏差値が大きい順に上側下側それぞれ10個の

サンプルを表示します.

4.10 残差の検討(個々の観測値,集団観測値)

Page 42: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-9

ロジスティック回帰分析

PART

第4章

正規確率プロット

選択された残差に対し,正規確率プロットが表示さ

れます.

ツールボタン オプション

正規性の検定方法,補助線の有無を設定す

ることができます.

4.10.2 残差の時系列プロット

選択されている残差についての時系列プロットを

表示します.

ウィンドウ右側には,残差の種類,サンプル数,最小

値,最大値,平均値,標準偏差,ダービン・ワトソン

比が表示されます.

ダービン・ワトソン比は,残差がランダムならば2に

なりますが,隣り合う残差に正の自己相関があれば2

より小さくなり,負の自己相関があれば2より大きくな

ります.ダービン・ワトソン比の検定を詳しく行いたい

場合は,ダービン・ワトソン比の数値表を用いて行っ

てください.

4.10.3 残差との連関図

選択されている残差に対し,予測値や説明変数と

残差との連関図を,コンパクトに表示します.説明変

数に質的変数が取り込まれている場合には,層別ヒ

ストグラムを表示します.

ツールボタン 拡大

残差との連関図において任意のグラフを拡大表示

し,詳しく見ることが可能.目的のグラフをクリックして

反転表示させた後,[拡大]ボタンをクリックする.

変数の追加

回帰式に取り入れてない変数を指定し,残差との

散布図を描かせることが可能.

4.10.4 テコ比と残差との散布図

選択されている残差についてのテコ比と残差との

散布図を表示します.

4.10 残差の検討(個々の観測値,集団観測値)

Page 43: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-10

ツールボタン データ探索

散布図において,サンプル番号とその値を確認す

ることができます.グラフ上で目的のプロット点を囲

むようにマウスを矩形にドラッグし,[データ探索]ボ

タンをクリックします.テコ比が平均値の2.5倍を越え

るサンプルや残差の絶対値が 1.5を越えるサンプル

などをチェックします.

4.10.5 予測判定グラフ(集団観測値)

集団観測値の場合,残差の検討の一覧表でメニュ

ーボタン[予測判定グラフ]をクリックすることにより,

予測値と観測値を散布図上にプロットすることができ,

モデルのあてはまり具合を見ることができます.予測

値をX軸に,観測値をY軸にとったグラフ上に,傾き

45度の線が表示されます.

(個々の観測値の場合,本機能は使用できません)

メニュー データ探索 グラフ上で探索したい範囲を矩形

領域で囲み[データ探索]ボタンをク

リックするとサンプルNo,サンプル

名などを表示.

arcsin変換 X 軸 に s in p 1 , Y 軸 に

s in p 1 に変換したデータを,プ

ロットすることが可能.比率pが 1.0

に近いデータが,より拡大されて表

示される.

4.11 判定結果(ロジスティック判別,ジャ

ックナイフ判別)

目的変数が2値(質的変数)の場合の判定結果

「変数選択」ウィンドウのツールボタン[ロジスティッ

ク判別]をクリックすると,予測確率 0.5を判別境界値

として,予測値と観測値との判別結果の表を見ること

ができます.

「ジャックナイフ判別」の場合には,ジャックナイフ

判別によって,n個のサンプルから1個を除いた(n-

1)個のサンプルに基づいた判別式が計算されます.

その式に除いたサンプルの値を代入し,正しく判別

されているかどうかを調べます.1番目からn番目ま

でのサンプルを,1つずつ順次除いて計算します.

このように,n個のサンプルから(n-m)個(ここでは

m=1)のサンプルを取り込んで解析します.

4.10 残差の検討(個々の観測値,集団観測値)

4.11 判定結果(ロジスティック判別,ジャックナイフ判別)

Page 44: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-11

ロジスティック回帰分析

PART

第4章

タブ 判定結果 観測値と予測値の判定結

果を集計し、一覧表示

サンプル表示 「4.11.1 サンプル表

示」を参照.

判定境界値と誤判定率 「4.11.2 判定境界値

と誤判定率」を参照.

誤判定グラフ 「4.11.3 誤判定グラ

フ」を参照.

ROC曲線 「4.11.4 ROC 曲線:

検査性能の評価」を参

照.

ツールボタン 境界変更 判定境界値を任意に変更.

集団の生起確率が必ずしも5分5分

でなく,大きくかたよっている場合

や判定境界値を変えた場合に判別

結果がどのように変化するかを確認

したいときに使用します.

4.11.1 サンプル表示

すべてのサンプルの観測値,予測値,予測確率を

一覧表示します.どのサンプルが正しく判定され,ど

のサンプルが誤判別されているか,サンプルの情報

をもとに確認する場合に利用します.画面上のドロッ

プダウンリストで誤判別サンプル(デフォルト設定)/

全サンプルの表示切り替えを行ないます.

ツールボタン 境界変更 表示するサンプルの確率の境界値を

設定.(詳細は「判定結果」を参照.)

4.11.2 判定境界値と誤判定率

判定境界値ごとの各組み合わせによる誤判定率を

一覧表示します.境界値が変化していくと,判定率

がどのように変化するのか確認することができます.

4.11 判定結果(ロジスティック判別,ジャックナイフ判別)

Page 45: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-12

4.11.3 誤判定グラフ

横軸に判定境界値(初期値:0.5),縦軸に誤判定

率をとったグラフを表示することができます.判定境

界値を変更した場合に,それぞれの誤判定率がど

のように変化するか,判定の安定性などにも着目し,

視覚的にみることができます.

ツールボタン 強調表示 誤判定グラフの任意の線を強調表

示可能.

4.11.4 ROC曲線:検査性能の評価

個々の観測値タイプのロジスティック判別結果

をROC曲線で表示します.

薬効評価などでよく使われるROC曲線

(Receiver Operating Characteristic Curve)は,

ロジスティック回帰の結果,得られる感度

( Sensitivity)を縦軸に,横軸に偽陽性

(1-Specificity)をとり作成されます.ここでの

感度とは観測値を1とし,予測が1となった場合

の判定率を表し,偽陽性は,1-(観測値0で予

測値が0となった判定率)を意味します.

予測値

0 1 計

観測値 0 A B E

(真値) 1 C D F

計 G H I

感度はD/F,擬陽性はB/Eで計算します.

なお,擬陽性は検定で通常使用する第一種のあ

やまりの確率値α:危険率を表し,感度は,1-

(第二種のあやまりの確率β):検出力を表してい

ます.

検査性能は図の左辺隅にあるほど,つまり擬陽

性が低く,感度が高いほどよいことを示しており,

図を見比べることにより,実験ごとあるいはモデ

ルごとに検査の性能を視覚的に評価,比較するこ

とができます.

4.12 判定グラフ(個々の観測値)

個々の観測値(目的変数が2値データ)の場合,変

数選択で説明変数が1つだけ選択されているとき,

「変数選択」ウィンドウの[判定グラフ]ボタンをクリック

すると,説明変数と観測値や予測値の(判定)散布図

を表示することができます.

強調表示する線をチェッ

クし,[OK]ボタンをク

リックします.

4.11 判定結果(ロジスティック判別,ジャックナイフ判別)

4.12 判定グラフ(個々の観測値)

Page 46: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-4-13

ロジスティック回帰分析

PART

第4章

ここでは「判定境界値変更」で,予測値を判定する

ための境界値(初期値:0.5)を変更することができま

す.

4.12 判定グラフ(個々の観測値)

Page 47: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-5-1

重みつき回帰分析

PART

第5章

第5章 重みつき回帰分析

5.1 重みつき回帰分析とは

■目的

重みつき回帰分析は,説明変

数によって目的変数の変動を説

明し予測するための手法です.

目的変数yと説明変数 x1,x2,…,

xPの関係は,通常,次式で表さ

れます.

y x x xi i i p ip i 0 1 1 2 2 は誤差

上記の式で,x1,x2,…,xPを説明変数,yを目的変数と呼びます.

このとき,誤差 iは等分散性が仮定されていますが,誤差に等分散性の前提が成立しない場合(例

えば,説明変数が大きくなると目的変数のばらつきも大きくなったり,ケースごとに重みが異なる場合な

ど),重みを用いた最小二乗法を適用することでモデル式を構築することができます.

本システムでは,説明変数として,量的変数,質的変数あるいは量的変数の積や交互作用項を作

成・指定することができますし,重みとして頻度や重み関数として変数を与えることができます.

■活用場面

・中古住宅の価格予測解析

・ホテルの顧客総合満足度調査 等

■データ入力形式

目的変数と説明変数の和が最大 256,説明変数の総アイテムカテゴリ数の最大は 600 となっていま

す.また,重みに用いる変数は量的変数1つ,頻度に用いる変数は量的変数1つとなっています.積の

項や交互作用項は変数の指定ダイアログで作成することができます.

ただし,データに 1 つでも欠測値があるサンプル,マスクされているサンプルは解析から除か

れます. 変数名

(No.)

サンプル

・・ 目的変数

(価格(万円))

[量的変数]

説明変数

(土地面積

(m^2))

[量的変数]

説明変数

(建物面積

(m^2))

[量的変数]

・・ 説明変数

(バス乗る・載ら

ない)

[質的変数]

1 ・・ 17800 138.58 300.020 ・・ 乗らない

2 ・・ 3980 60.35 70.090 ・・ 乗らない

3 ・・ 3980 60.35 70.090 ・・ 乗らない

4 ・・ 5180 98.48 139.100 ・・ 乗らない

5 ・・ 6480 69.57 113.020 ・・ 乗らない

■機能構成

重みつき回帰分析の機能は重回帰分析・数量化Ⅰ類とほぼ同等のものとなります.各機能に

ついては重回帰分析・数量化Ⅰ類の章を参照してください.

5.2 手法の選択

選択方法 [手法選択]-[多変量解析]-[重みつき回帰分析]

i

5.1 重みつき回帰分析とは

5.2 手法の選択

Page 48: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-5-2

5.3 変数の指定

目的変数,説明変数とその交互作用(量的変

数のみ),重みに使用する変数,頻度に使用す

る変数などを指定します.また,ここで量的変数

を指定することにより,自動的に交互作用モデ

ル(例: 2121 xcxbxax ),2 次モデル(例:

215

2

24

2

132211 xxaxaxaxaxa )を

作成することができます.

左側に変数名一覧,サンプル名一覧が表示さ

れています.右側に特性値(目的変数),説明変

数,重み,頻度,サンプル名のリストが表示され

ています.左側の変数一覧より,特性値とする変

数,説明変数とする変数,重みとする変数,頻

度とする変数,サンプル名をそれぞれマウスで

選択し, ボタンをクリックして,リストに追

加します.

詳しい機能は下記のとおりです.

・共通

ボタン 機能

変数名一覧のリストを全選択します.変数名が反転表示されます

変数名一覧のリストより量的変数のみを全て選択します

変数名一覧のリストより質的変数のみを全て選択します.

・特性値,頻度,サンプル名

ボタン 機能

選択した変数を指定したリストに取り込みます.

選択した変数を指定したリストから外します.

頻度に指定した変数に,0のデータが含まれている場合には,以下の2種類の方法

で処理を行いますので,どちらか選択してください.

①解析対象から外すか ②頻度を1とする.

9.4 変数の指定

5.3 変数の指定

Page 49: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-5-3

重みつき回帰分析

PART

第5章

説明変数

ボタン 機 能

選択した変数を1次の変数として取り込みます.

選択した変数を2変数ごとの積の変数として取り込みます

(例:X2,X3 を指定した場合,X2×X3 として取り込みます)

選択した変数を2乗項として取り込みます.

(例:X2 という変数を指定した場合,X2×X2 として取り込みま

す)

選択した変数をリストより解除します

リストに選択した変数を全て解除します

選択した変数を全て1次モデルとして,取り込みます.

(例:X1,X2,X3 という変数が選択された場合には,そのまま,

取り込まれます)

選択した変数を全て交互作用モデルとして,取り込みます.

(例:X1,X2,X3 という変数が選択された場合には,X1,X2,X

3,X1×X2,X1×X3,X2×X3 として取り込まれます)

選択した変数を全て 2次モデルとして,取り込みます.

(例:X1,X2,X3 という変数が選択された場合には,X1,X2,X

3 の他,X1×X2,X1×X3,X2×X3,X1×X1,X2×X2,X3×

X3が 2次項として取り込まれます)

ボタン 機能

リストの内容を指定順かつ1次項→交互作用→2次項の順に並べ

替えます

指定された交互作用項,2次項に対して中心化を行います.

・重み

ボタン 機能

選択した変数を重みの変数として取り込みます(量的変数のみ有

効です).なお,重みとして指定しない場合,重みが期待値に比例

する設定も可能です.

取り込んだ変数については変数名の下のリストボックスで,X(既に

変数が重みとなっている場合),1/X(分散が X に比例する場合),

1/X^2(標準偏差が Xに比例する場合)の3種類が選択できます(変

数を重みとして選択した場合,初期値は 1/X となっています).

重みの変数を解除します.

重みの変数に,0のデータが含まれている場合には,以下の2種類の方法で処理

を行いますので,どちらか選択してください.

①解析対象から外すか ②指定した変数の最小値の 1/2 の値を代用する.

5.4 変数選択

変数の指定を行った後,変数の選択画面が表示されます(重み変数が指定されている場合には,使

用された変数名,および,重みの関数(X,1/X,1/X^2)が表示されます).

変数の手動選択では,分散比を見ながら画面上で該当する説明変数(項目)の行をクリック

して行います.クリックして行が反転表示されると同時に再計算されます.

5.3 変数の指定

5.4 変数選択

Page 50: 第1章 単回帰分析 - Mie Universitysns.dousoukai.eng.mie-u.ac.jp/manual/bunkatsu/_pdf/... · 8-1-1 単 回 帰 分 析 P A R T 8 第 1 章 第1章 単回帰分析 1.1単回帰分析とは

8-5-4

5.4 変数選択