目次
単純回帰 例えば、作物の収穫量と降雨量の関係、パンの味とオーブンの温度の関係など、2つの変数の関係を推定するために、一般的に解析が使用されます。 しかし、従属変数と2つ以上の独立変数の関係を調査する必要がある場合が多くあります。 例えば、不動産業者が、次のようなことを知りたい場合があります。家の大きさ、寝室の数、近隣の平均所得などが、家の売買価格とどのように関係しているのか。 このような問題は、次のような方法で解決することができる。 重回帰分析 そして、この記事では、Excelを使った重回帰分析の方法についてまとめています。
問題点
例えば、無作為に選んだ5人の営業マンを対象に、下表のような情報を収集したとします。 教育やモチベーションが年商に影響を与えるかどうか?
最高学歴 | ヒギンズ・モチベーション・スケールによるモチベーションの評価 | ドル建て年間売上高 |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | $429,000 |
16 | 50 | $435,000 |
18 | 65 | $433,000 |
方程式
一般的に 重回帰分析 は、従属変数(y)と独立変数(x1、x2、x3 ... xn)の間に線形関係があると仮定しています。 そして、このような線形関係は以下の式で記述することができます。
Y = 定数 + β1*x1 + β2*x2+... + βn*xn
ここでは、定数と係数について説明します。
Y | Yの予測値 |
定数 | Y切片 |
β1 | x1が1増加するごとにYが変化する。 |
β2 | x2が1増加するごとのYの変化量 |
... | ... |
βn | xnが1増加するごとにYが変化する。 |
定数、β1、β2・・・βnは、入手可能なサンプルデータに基づいて計算することができます。 定数、β1、β2・・・βnの値を求めたら、それを使って予測することが可能です。
今回の問題では、私たちが関心を持つ要素は2つだけである。 したがって、式は次のようになる。
年間売上高=定数+β1*(最高学歴)+β2*(ヒギンズ・モチベーション・スケールで測定したモチベーション)
セットアップモデル
図1のように、A列には年商、B列には最高学歴、C列にはモチベーションが入力されています。 従属変数(ここでは年商)は常に独立変数の前に置く方がよいでしょう。
図1
Analysis ToolPakのダウンロード
Excelには、定数や係数の値を返すデータ解析機能がありますが、この機能を使用する前に、解析ツールパックをダウンロードする必要があります。 ここでは、そのインストール方法について説明します。
をクリックします。 ファイル tab -> オプション をクリックし アドイン において エクセルオプション をクリックすると、ダイアログボックスが表示されます。 行く の下にあるボタンをクリックします。 エクセルオプション を開くダイアログボックス アドイン ダイアログボックスで アドイン ダイアログボックスで 分析 TookPak のチェックボックスにチェックを入れ オッケー .
今、クリックすると データ タブに表示されます。 データ分析 が表示されます。 分析 グループ(右図)。
図2[画像をクリックすると拡大表示されます]
重回帰分析
をクリックします。 データ分析 において 分析 のグループです。 データ タブで選択します。 リグレッション プロンプトで データ分析 ダイアログボックスで、他の操作を行うこともできます。 統計解析 t-test、ANOVAなど。
図3.1
A リグレッション を選択すると、ダイアログボックスが表示されます。 リグレッション .図3.2のようなダイアログボックスを表示します。
入力Yレンジは従属変数とデータを含み、入力Xレンジは独立変数とデータを含みます。 ここで、独立変数は隣接した列にあるべきであることを思い出してください。 そして、独立変数の最大数は15です。
A1: C1 は変数ラベルを含むので、Labels チェックボックスを選択する必要があります。 実際、Input Y Range と Input X Range を埋めるときは、毎回ラベルを含めることをお勧めします。 これらのラベルは Excel が返す要約レポートを確認するときに役に立ちます。
図3.2
残差のチェックボックスを選択すると、Excelは各オブザベーションの残差をリストすることができます。 図1を見てください。合計5つのオブザベーションがあるので、5つの残差が得られます。 残差は、観察値から予測値を引いたときに残るものです。 標準化残差は、残差をその標準偏差で割ったものです。
また,Excel が残差プロットを返すようにするために,残差プロット チェックボックスを選択することもできる. 残差プロットの数は,独立変数の数と等しい. 残差プロットは,Y軸に残差を,X軸に独立変数を示すグラフである. 残差プロットのX軸まわりにランダムに分散した点は,独立変数の値が,その独立変数の値よりも小さいことを意味する. 線形回帰 例えば、図3.3は残差プロットの3つの典型的なパターンですが、左側のパターンだけが線形モデルへの適合性を示しており、他の2つのパターンは非線形モデルへの適合性を示しています。
図3.3
線分適合プロットチェックボックスを選択すると、Excelは適合線図を返します。 適合線図は、1つの従属変数と1つの独立変数の関係をプロットできます。 言い換えれば、Excelは独立変数のそれと同じ数の適合線図を返します。 例えば、この問題では2つの適合線図が得られます。
結果
Okボタンをクリックすると、Excelは以下のようなサマリーレポートを返します。 緑と黄色でハイライトされたセルは、最も重要な部分であり、注意が必要です。
図3.4
R二乗(セルF5)が大きいほど、従属変数と独立変数の間に密接な関係が存在することになります。 そして、第3表の係数(範囲F17:F19)は、定数と係数の値を返します。 式は、年商 = 1589.2 + 19928.3*(Higgins Motivation Scaleで測定したモチベーション) + 11.9* (モチベーション)でなければならないでしょう。
しかし、結果が信頼できるかどうかを見るために、黄色でハイライトされたp値もチェックする必要があります。 セルJ12のp値が0.05より小さい場合のみ、回帰式全体が信頼できます。 しかし、定数と独立変数が従属変数の予測に有用かどうかを見るために範囲I17:I19のp値もチェックする必要があります。 我々の問題に対しては、以下を捨てる方が良いのでしょう。独立変数を考慮した場合のモチベーション
続きを読む: Excelで線形回帰のP値を計算する方法(3つの方法)
独立変数からモチベーションを削除
独立変数であるMotivationを削除した後、同じ手法で単回帰分析をしてみました。 これで全ての値が0.05以下になったことが分かります。 最終的な式はこうなるはずです。
年間売上高=1167.8+19993.3*(最高学歴の卒業年)
図3.5 [画像をクリックすると拡大表示されます。]
備考
図4
アドインツールの他に、LINEST 関数を使用して重回帰分析を行うこともできます。 LINEST 関数は、1 つのセルまたはセル範囲の結果を返すことができる配列関数です。 まず、範囲 A8:B12 を選択して、この範囲の最初のセル(A8)に数式 "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" を入力します。 CTRL + Shift +ENTER を押すと、Excel は次のように結果を返します。図 3.4 と比較すると、19993.3 が最高学歴の係数で、1167.8 は定数であることがわかる。 いずれにせよ、アドインツールを使うことをお勧めする。 より簡単である。
続きを読む...
Excelで逆What-If分析
Excelでワイルドカードを使用するには?
作業用ファイルのダウンロード
下記リンクから作業ファイルをダウンロードしてください。
多重回帰分析.xlsx