エクセルで統計分析3 回帰分析のやり方

55
エクセルで統計分析3 HADによる回帰分析・分散分析 清水裕士 広島大学大学院総合科学研究科

Upload: hiroshi-shimizu

Post on 06-Dec-2014

11.296 views

Category:

Education


0 download

DESCRIPTION

Excelで動くフリーの統計分析プログラム、HADの解説です。 プログラムは、以下のサイトからダウンロードできます。 http://norimune.net/had エクセルで統計分析 HADについて http://slidesha.re/10ARA0k エクセルで統計分析2 HADの使い方 http://slidesha.re/RsVBp7 エクセルで統計分析3 回帰分析のやり方 http://slidesha.re/XVATPV エクセルで統計分析4 因子分析のやり方 http://slidesha.re/YWUGNY

TRANSCRIPT

Page 1: エクセルで統計分析3 回帰分析のやり方

エクセルで統計分析3 HADによる回帰分析・分散分析

清水裕士

広島大学大学院総合科学研究科

Page 2: エクセルで統計分析3 回帰分析のやり方

HADとは

• 清水が作ったExcelで動くフリーソフト

– 心理統計分析のほとんどが実行可能

– http://norimune.net/had

• 無償・無登録で利用可能です。

• HADの基本的な使い方

– http://slidesha.re/RsVBp7

• こちらのスライドシェアを先に御覧ください

Page 3: エクセルで統計分析3 回帰分析のやり方

多変量解析

• 2つのカテゴリから選ぶ – 回帰分析:因果関係を推測する分析 – 因子分析:次元圧縮やカテゴリ分けの分析

• 該当するオプションボタンを押すと、モデリングスペースが開く

下は回帰分析のモデリングスペース

Page 4: エクセルで統計分析3 回帰分析のやり方

多変量解析の使用方法

• 使用変数のところに変数を指定 – これはほかの分析と同じ

– その後、モデリングスペースでモデルを指定したり、分析オプションを選択して、「分析実行」ボタンを押す

– 「オプション」ボタンを押すと、各分析のより詳細な設定を変更することができる

• 詳しくはWebで。

– 清水のブログでも解説しています • HADのページ • http://norimune.net/?=800

Page 5: エクセルで統計分析3 回帰分析のやり方

回帰分析グループ

• モデリングシートの「回帰分析」を押す – 回帰分析用のモデリングスペースが開く

– 主に変数の因果関係を検討する分析法の集まり

• 「回帰分析」の中のサブカテゴリ – 回帰分析:回帰分析、ロジスティック、判別分析

– 分散分析:5要因までの分散分析と多重比較

– 媒介分析:3変数の媒介関係を分析

– 多変量:多変量回帰分析や正準相関分析

Page 6: エクセルで統計分析3 回帰分析のやり方

回帰分析のモデリングスペース

Page 7: エクセルで統計分析3 回帰分析のやり方

回帰分析

Page 8: エクセルで統計分析3 回帰分析のやり方

回帰分析

• 分析のタイプを選択 – 重回帰分析

– 判別分析・・・従属変数がカテゴリ変数

– 多変量回帰分析・・・従属変数が多変量

• 変数の投入方法 – 階層的投入(デフォルト)・・・5ステップまで可能

– ステップワイズ法・・・変数を有意確率が低い順に投入していく方法

Page 9: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 「目的変数を投入」ボタン – 選択したセルを目的変数に指定する

• 「主効果を全投入」ボタン – 目的変数に指定した変数以外を主効果に投入 – Shiftキーを押しながら押すと、選択した変数のみ

• 「交互作用を全投入」ボタン – 目的変数に指定した以外の変数の主効果と交互作用を

すべて投入 – Shiftキーを押しながら押すと、選択した変数のみの交互

作用項を投入(主効果はすべて投入)

Page 10: エクセルで統計分析3 回帰分析のやり方

交互作用項の単純効果検定

• スライス変数を指定

– スライス変数・・・群分けをする変数

• 高群・低群に分ける変数のこと

– 3要因の交互作用の単純効果を検討可能

• スライス変数に指定できるのは2変数まで

• それぞれ別のセルに変数名を入力する

• 「スライスに」投入ボタンを押す

– 選択したセルにある変数をスライス変数に投入

Page 11: エクセルで統計分析3 回帰分析のやり方

こんな感じ • 目的変数:idt • 説明変数:talkとperと、その交互作用項 • スライス変数:per

Page 12: エクセルで統計分析3 回帰分析のやり方

分析実行

• 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる

• 出力 – Step・・・分析結果をステップごとに出力

• 階層的重回帰の場合は入力ステップ

• 「各ステップを出力しない」を押すと、出力されない

– HRA・・・階層的重回帰分析の結果をまとめたもの

– Slice・・・単純効果検定の結果

Page 13: エクセルで統計分析3 回帰分析のやり方

回帰分析の出力 talk talk

-1SD +1SDper_-1SD 3.127 3.187per_+1SD 3.181 4.172 **

2

2.5

3

3.5

4

4.5

-1SD +1SD

idt

talk

per_-1SD

per_+1SD

Page 14: エクセルで統計分析3 回帰分析のやり方

回帰分析の設定

• 2値データの説明変数をカテゴリ変数として扱う – 2値データをスライス変数に指定するとき、±1SDで

スライスせず、2値のそれぞれの値の場合の単純効果を推定します。

– これをチェックすると、分散分析と同じ結果になります。

• 交互作用項がある場合、主効果を中心化 – 交互作用項は主効果の変数の積で計算しますが、そ

のまま計算すると多重共線性が問題となります。

– そこで、これをチェックすると交互作用項がある場合、主効果をすべて中心化します。

Page 15: エクセルで統計分析3 回帰分析のやり方

ステップワイズ法

• ステップワイズ法をチェック

– モデリングスペースが変わる

Page 16: エクセルで統計分析3 回帰分析のやり方

ステップワイズ法のモデル指定

• 変数の入力は1行で – モデルのところにだけ入力する – 「主効果を全投入」や「交互作用を全投入」を押すと便利。

• 強制投入 – 必ず投入する変数を指定 – その変数もモデルに入れておく

• 出力 – 変数の投入ごとに結果を出力

– 「各ステップを出力しない」をチェックすると最後のモデルだけが出力される

Page 17: エクセルで統計分析3 回帰分析のやり方

判別分析

Page 18: エクセルで統計分析3 回帰分析のやり方

判別分析

• 従属変数がカテゴリカルデータの場合 – カテゴリへの所属を予測する

• 回帰分析のオプションから選択 – 判別分析を選択する

• 判別分析も、重回帰と同様のことができる – 階層的投入orステップワイズ

– 交互作用と単純効果の検定

Page 19: エクセルで統計分析3 回帰分析のやり方

回帰分析のオプション

Page 20: エクセルで統計分析3 回帰分析のやり方

多変量回帰分析

Page 21: エクセルで統計分析3 回帰分析のやり方

多変量回帰分析

• 従属変数が多変量の場合

– 複数の従属変数への影響を予測する

• 回帰分析のオプションから選択

– 多変量回帰分析を選択する

Page 22: エクセルで統計分析3 回帰分析のやり方

多変量を選択

• 多変量回帰分析のモデリングスペース

Page 23: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 目的変数

– 複数の目的変数を選択可

– 複数のセルを選択して、「目的変数を投入」

• 説明変数

– 主効果・交互作用を投入可

– ただし、単純効果の検定は不可

Page 24: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 以下のように投入

Page 25: エクセルで統計分析3 回帰分析のやり方

分析実行

• 出力はこんな感じ

モデル適合 ※PillaiとはPillaiのトレースを意味しています

変数名 R2 Pillai F値 df1 df2 p値

全体 .241 .245 13.469 6 578 .000

説明変数の多変量検定

変数名 β 偏η 2 F値 df1 df2 p値

skill skill .221 .060 6.179 3 288 .000con con .423 .191 22.614 3 288 .000

Page 26: エクセルで統計分析3 回帰分析のやり方

正準相関分析

• 同時に正準相関分析結果も出力 正準相関分析

正準相関 尤度 χ 2値 自由度 p値

成分1 .477 0.759 80.039 6 .000成分2 .135 0.982 5.337 2 .069

 正準係数

目的変数 成分1 成分2idt .485 .893talk .762 -.542per -.214 .161

説明変数 成分1 成分2skill .429 .961con 1.776 -.920

Page 27: エクセルで統計分析3 回帰分析のやり方

分散分析

Page 28: エクセルで統計分析3 回帰分析のやり方

分散分析

• モデリングスペースの「分散分析」を押す

Page 29: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 目的変数 – 従属変数を指定 – 参加者内要因(Within)がある場合、参加者内要因を構成する変

数すべてを指定する

• モデル – 説明変数を主効果・交互作用ともに指定(共変量含む) – 「交互作用を全投入」ボタンを押すととりあえず全部入る

• 共変量 – 共変量を指定。共変量もモデルに指定しておく。

• 反復要因 – 参加者内要因の水準数を入力する(後述)

Page 30: エクセルで統計分析3 回帰分析のやり方

1要因参加者間要因

• 目的変数:x4・・・$マークはここでは気にしない • 要因:a・・・参加者間要因

Page 31: エクセルで統計分析3 回帰分析のやり方

2要因参加者間要因

• 目的変数:x4・・・$マークはここでは気にしない • 要因:aとcと、その交互作用・・・すべて参加者間要因

Page 32: エクセルで統計分析3 回帰分析のやり方

一要因参加者内要因

• 目的変数:x1~x4・・・$マークのあとに要因名をつける • 要因:b・・・$のあとの名前が参加者内要因名となる

Page 33: エクセルで統計分析3 回帰分析のやり方

2要因以上の参加者内要因

• 参加者内要因の構造 – 入れ後になるように読み込む

• 反復測定要因の水準数 – $マークの後に入力した順番に数字を指定

• 2以上の数値をセルごとに入力

– 上の例だと、b1が2水準、b2も2水準なので、2,2と書く • 参加者内要因が1つの場合は、水準数を書く必要はない

要因b1

要因b2 b2=1 b2=2 b2=1 b2=2

目的変数 x1 x2 x3 x4

b1=1 b1=2

Page 34: エクセルで統計分析3 回帰分析のやり方

2要因参加者内要因

• 目的変数:x1~x4・・・$マークのあとに二つ指定 • 要因:b1とb2・・・$のあとの名前が参加者内要因名となる • 反復測定・・・参加者内要因の水準数を入力

Page 35: エクセルで統計分析3 回帰分析のやり方

2要因混合計画

• 目的変数:x1~x4・・・$マークのあとに参加者内要因名を書く • 要因:aとbと、その交互作用

Page 36: エクセルで統計分析3 回帰分析のやり方

共変量のあるモデル

• 共変量はモデルにも指定しておく

– さきに共変量に指定してから、「交互作用を全投入」を押すのが便利

• 共変量の投入ルール

– 「交互作用を全投入」ボタンを押した場合、

– 参加者間要因とは交互作用は作らない

– 参加者内要因とは交互作用項を作る

– というルールで投入される(SPSSのデフォルトと同じ)

Page 37: エクセルで統計分析3 回帰分析のやり方

共変量のあるモデル

• 目的変数:x1~x4 • 要因:aとbと交互作用・・・$のあとの名前が参加者内要因名となる • 共変量:d・・・参加者内要因とだけ交互作用を作る

Page 38: エクセルで統計分析3 回帰分析のやり方

単純効果の検定

• スライスに群分け変数を指定 – 「スライスに投入」ボタンを利用すると便利

• 分散分析は5要因まで検討可能 – スライスには4変数まで指定できる

– すべての単純主効果・単純交互作用を検討することができる

• オプションで単純効果検定の方法を選択 – プールされた誤差項による検定・・・検出力が高い

– 水準別の誤差項による検定・・・等分散を仮定しない

Page 39: エクセルで統計分析3 回帰分析のやり方

単純効果の検定

• スライス変数:a・・・内・間どちらの要因でも指定可能

Page 40: エクセルで統計分析3 回帰分析のやり方

分析結果 交互作用のp値 = .004 **

x1 x2 x3 x4a=1 3.067 5.074 6.074 7.374 **a=2 3.947 4.141 3.741 3.501

0.602 0.602 0.602 0.6020.539 0.539 0.539 0.539

※エラーバーは標準誤差

0

1

2

3

4

5

6

7

8

9

a=1 a=2

得点

x1

x2

x3

x4

Page 41: エクセルで統計分析3 回帰分析のやり方

分散分析のオプション

Page 42: エクセルで統計分析3 回帰分析のやり方

一般化線形モデル

Page 43: エクセルで統計分析3 回帰分析のやり方

一般化線形モデル

• 目的変数に様々なタイプの変数を指定可能 – 順序・・・2値か順序性のある順序尺度変数

– 名義・・・順序性のない、名義尺度変数

– カウント・・・度数データ

– 打ち切り・・・天井・床効果のように途中で測定が 打ち切られているようなデータ

• 回帰分析とほぼ同じようなことができる – 階層的投入orステップワイズ

– 交互作用と単純効果の検定

Page 44: エクセルで統計分析3 回帰分析のやり方

一般化線形モデル

• モデリングスペース

Page 45: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 基本は回帰分析と同じ – 一つの目的変数と,複数の説明変数を選択

– ステップは5つまで

• 目的変数のタイプを指定 – 連続,順序,カウント,打ち切り,名義から一つ選択

• 頑健標準誤差の推定の有無 – モデルの仮定から逸脱していても,妥当な検定を行うこ

とができる

Page 46: エクセルで統計分析3 回帰分析のやり方

分析実行

• 「分析実行」ボタンを押す – もしモデリングにエラーがあれば、分析が止まる

• 出力・・・重回帰と同じ – Step・・・分析結果をステップごとに出力

• 階層的投入の場合は入力ステップ

• 「各ステップを出力しない」を押すと、出力されない

– HRA・・・階層的重回帰分析の結果をまとめたもの

– Slice・・・単純効果検定の結果

Page 47: エクセルで統計分析3 回帰分析のやり方

分析結果

• モデル適合の指標が重回帰と異なる

• Χ2乗値: – 有意な場合,モデルの説明率は0ではない

• 適合指標 – 近似R2:残差分散から近似的に計算されたR2

Page 48: エクセルで統計分析3 回帰分析のやり方

媒介分析

Page 49: エクセルで統計分析3 回帰分析のやり方

媒介分析

• 目的変数と説明変数の関連を説明

– 間接効果検定とブートストラップ信頼区間を算出

• 多くの分析手法で実行可能

– 重回帰分析

– 一般化線形モデル・・・パラメトリックのみ

– 階層線形モデル・・・パラメトリックのみ

Page 50: エクセルで統計分析3 回帰分析のやり方

媒介分析を選択

• 媒介分析のモデリングスペース

Page 51: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• 媒介モデル – X→Yの効果を、変数Mが媒介

– つまり、X→M→Yというモデルを検討

• 目的変数 – 変数Yを指定

• モデル – 変数M、変数Xの順に指定

– モデルに指定できるのは2変数のみ

Page 52: エクセルで統計分析3 回帰分析のやり方

モデルの指定

• con→talk→idtというモデルを検討

Page 53: エクセルで統計分析3 回帰分析のやり方

分析実行

• 後は「分析実行」を押すだけ

– ブートストラップ標本数などはオプションで指定

• 出力はこんな感じ

con

talk

idt

.38** .27**

.19** → .09

Page 54: エクセルで統計分析3 回帰分析のやり方

媒介分析の設定

• ブートストラップ標本の抽出法 – ノンパラメトリック法

• データから反復抽出によるサンプリングを行う

– パラメトリック法 • 推定値とその標準誤差から、正規乱数を発生させる

• ブートストラップ信頼区間の推定法 – バイアス修正法

• 推定値を平均値に調整した場合の信頼区間

– パーセンタイル法 • リサンプリングした推定値をそのまま使う方法

Page 55: エクセルで統計分析3 回帰分析のやり方

媒介分析のオプション