Excelで回帰結果を解釈する方法(詳細分析)

  • これを共有
Hugh West

回帰分析は、以下のようなほぼすべての統計ソフトに搭載されています。 SPSS , R, 回帰は、変数間の関係を大まかに把握することができます。 Excel では、線形回帰は データ分析 この記事では、その方法を紹介します。 Excelで回帰結果を解釈する。

練習用ワークブックをダウンロードする

この練習用ワークブックは以下からダウンロードできます。

回帰結果の解釈.xlsx

回帰とは何か?

回帰分析とは、データ分析において、複数の変数間の関連性を調べるためによく使われます。 回帰分析では、独立変数の1つが変化した場合に従属変数に何が起こるかを選ぶことができます。 また、どの独立変数が影響を持つかを数学的に把握することもできます。

単回帰分析 とは別物です。 じゅうせんかいき 統計学でいうところの一次関数を使って、シンプルに 線形回帰分析 変数と1つの独立変数との間の関連性。 重回帰分析 は、変数を決定するために2つ以上の説明因子を使用する場合です。 従属変数の代わりに非線形回帰を使用すると、データの関係が線形ではないので、非線形関数と表現されます。 この記事では、集中的に説明します。 じゅうせんかいき ができることを実証するために Excelで回帰結果を解釈する。

Excelで回帰を行うための手順

回帰分析のために、以下のデータセットを使用する。 ここでは、独立変数を 価格 カラムと 売約済み の欄があります。 インディペンデント カラムは 需要 の欄があります。

ステップス

  • に行く必要があります。 データ タブをクリックし データ分析 を行うには、回帰する .

  • 新しいウィンドウが表示されます。従属変数と独立変数のデータ範囲を選択します。
  • 次に、チェックを入れます。 ラベル ボックスと コンフィデンス ボックスを使用します。
  • 次に、出力セル範囲ボックスをクリックして、出力セルのアドレスを選択します。
  • 次に 残量 を使って残差を計算します。
  • その後 残量 プロットおよび ラインフィットプロットボックス
  • クリック よっしゃー この後

  • をクリックすると OKです。 の場合、解析の主要な出力パラメータは指定されたセルになります。

  • そして、次のようなパラメータも取得します。 意義 の値など。 分散分析 ( 分散分析 )の表です。
  • これです。 デフ は分散源に関係する自由度を表す。
  • 親衛隊 は二乗和を表す。 が小さいほど、よりデータを反映したモデルとなる。 残量 よりもSSが小さい。 SSの合計。
  • かくのうメッセージ は正方形を意味します。
  • F を表します。 F -帰無仮説の検定
  • 有意差 F を表します。 P -価 F .

  • そして、変数の係数や有意値なども表で得ることができます。

  • そして、係数表の下に、各エントリーの残差値を含む最終表が得られます。

  • 次に 需要 価格 回帰チャート、トレンドライン付き。

  • このあと 需要 売約済み トレンドライン付きの回帰チャート。

  • からの各エントリーの残差の分布を示す別の図がある。 売約済み の変数になります。

  • からの各エントリーの残差の分布を示す別の図がある。 価格 の変数になります。

次に、この回帰結果をExcelで解釈する方法を紹介します。

続きを読む エクセルでロジスティック回帰を行う方法(簡単な手順付き)

Excelで回帰結果を解釈する方法

回帰分析をして次に必要なことは、その解釈です。 その結果について、以下に記述し、詳しく説明します。

多重R2乗回帰値分析

があります。 R二乗 の数値は、データセットの要素がどれだけ密接に関連し、回帰直線がどれだけデータにマッチするかを示します。 これから重回帰分析を使って、2つ以上の変数が主因子に与える影響を判断します。 これは、独立変数の1つが変わると従属変数がどう変わるかを指します。 この係数の範囲は、次のとおりです。-1~1です。

  • 1は密接な正の関係を意味する
  • 0は変数間に関係がないことを意味し、言い換えれば、データポイントはランダムであることを意味します。
  • -1は、変数間の逆相関または負相関を意味する。

上記の出力結果では、与えられたデータセットの多重 R 値は o.7578( およそ )であり、変数間の関係が強いことを示している。

R2乗

Rの2乗 この場合、0.574(近似)であり、変数間の関係はそれなりに良好であると解釈される。

調整後R2乗

の別バージョンに過ぎません。 Rの2乗 の値をシャッフルします。 預言者 変数を予測しながら レスポンス という変数で計算されます。

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1) ]である。

これです。 R^2 : その R^2 の値は、データセットから取得したものです。

n : オブザベーションの数です。

K : 予測変数の数。

この値が重要なのは、2つのデータ間の回帰分析を行っているときです。 預言者 変数が2つ以上ある場合 預言者 という変数がある場合、R2乗の値が膨らんでしまい、非常に好ましくない。 調整後 Rの2乗 の値はこのインフレを調整し、変数を正確に把握することができます。

標準誤差

回帰分析の精度を示すもう一つの適合度指標で、数値が低いほど回帰分析の確実性が高い。

標準誤差 は、各点がトレンドラインから離れる平均距離を表す経験的な指標である。 これに対して R2 は従属変数の変動比率を表している。 この場合、値 標準誤差 は288.9( およそ )であり、平均してトレンドラインから288.9ポイント下がっていることを示している。

観察記録

観測数またはエントリ数を示す。

有意な変数の決定

があります。 有意差値 は、分析の信頼性(統計的に正しいかどうか)を表します。 つまり、データセットが誤っている確率を表します。 この値は5%以下でなければなりません。 しかし、この場合、有意水準は0.00117で、0.1%となり、5%を十分下回っています。 したがって、この分析は問題ありません。そうでなければ、分析に使う変数を変更しなければならないかも知れません。

回帰分析におけるP値

重要な価値と密接にリンクしています。 P値 は係数値が間違っている確率を示す。 P値は帰無仮説と変数の関連性を示す。

もし、あなたが p値 <は 意義 の数値は、帰無仮説を棄却するのに十分な証拠がある。 これは、変数の間にゼロでない相関があることを意味している。

しかし、もし p値 > 意義 の値では、帰無仮説を棄却する十分な証拠がないことになります。 これは、変数間に相関がない可能性を示しています。

またはその場合 P値 オブ・ザ・バリアブル 価格 =0.000948 <0.00117 (有意水準)。

つまり、ここでは帰無仮説は成り立たず、変数間の相関を宣言するのに十分な根拠があるのです。

一方、変数 売約済み 0.0038515 <0.0011723 (有意水準)

つまり、ここでは帰無仮説が成り立ち、変数間の相関がゼロでないと断言するには十分な根拠がない可能性があります。

ほとんどの場合、このP値によって変数がデータセットに含まれるかどうかが決まります。 たとえば、ある変数を削除するために 売約済み 変数で、データセットの頑健性を保持することができます。

回帰式

Excelで線形回帰分析を決定すると、トレンドラインも線形になるはずです。 一般的な形はこうです。

Y=mX+Cです。

これです。 Y は従属変数である。

そして、Xはここでは独立変数で、変数Xの変化が変数Yに及ぼす影響を判断するということです。

C は、単に直線のY軸交点の値になります。

この場合、C切片の値は9502.109853に等しくなる

そして、2つの変数のmの値は、-809.265と0.424818である。

そこで、2つに分かれた変数の最終的な式が出来上がりました。

まず1つ目は

Y=-809.265771X+9502.12

そして、2つ目の変数の式は、次のようになります。

y=0.4248x+9502.12

係数

得られた係数は m1=-809.2655 m2=04248 .そして、インターセプター。 C= 9502.12 .

  • まず、インターセプターの値は、価格がゼロのときに需要が9502になることを示す。
  • の値も m 価格係数の値は-809.265であり、1単位当たりの価格上昇で約809単位需要が減少することがわかる。
  • 2番目の変数Soldのm値は0.424であり、これは販売された商品1個あたりの変化量が0424倍の単位で増加することを表しています。

残差

があります。 残量 の差は、回帰線から計算されたエントリーと元のエントリーの差である。 残差 は、実際の値が直線からどれだけ離れているかを示しています。 例えば、最初のエントリーの回帰分析による計算値は9497です。 そして、最初の元の値は9500です。 ですから、残差は2.109程度になります。

T-Statisticsの値

T-statics値は、係数を標準値で割ったもので、この値が高いほど係数の信頼性が高いことを示しています。

この値には、もう一つの意味があり、それは、次のように要求されます。 はP値を計算する。

95%信頼区間について

ここでは、最初に設定した変数の信頼度を95としています。 しかし、これは変更可能です。

  • ここで、下位95%の係数値は8496.84、上位95%の係数値は10507.37と算出される。
  • つまり、主係数が約9502.1であるのに対し、95%のケースで8496以下、5%のケースで10507.37以上となる可能性が高いということである。

続きを読む

覚えておきたいこと

回帰分析法は、あくまで対象となる変数間の関係を評価するものであり、因果関係を証明するものではありません。 つまり、相関関係の側面のみを考慮します。 ある行為が何かを引き起こすと、それは因果関係となります。 ある変数の変化が変化を生み出すと、それは因果関係と考えることができるのです。

回帰分析では、外れ値が大きな障害となる。 分析を行う前に、あらゆる種類の外れ値を除去しなければならない。 Excelで回帰分析の結果を分析し、解釈するためには、以下の点を考慮する必要がある。

結論

要約すると、「Excelで回帰結果を解釈する方法」という質問に対して、精緻に分析し、後に解釈することです。 分析は、以下のような方法で行います。 データ分析 のツールを使用します。 データ タブで表示します。

この問題では、回帰分析の練習とその解釈ができるワークブックをダウンロードできます。

ご質問やご意見は、コメント欄からお気軽にお寄せください。 より良い製品作りのためのご提案があれば、ぜひお寄せください。 Exceldemy を高く評価します。

Hugh West は、業界で 10 年以上の経験を持つ、非常に経験豊富な Excel トレーナー兼アナリストです。彼は会計と財務の学士号と経営管理の修士号を取得しています。ヒューは教えることに情熱を持っており、理解しやすい独自の教育アプローチを開発しました。彼の Excel に関する専門知識は、世界中の何千人もの学生や専門家がスキルを向上させ、キャリアで優れた成果を上げるのに役立ってきました。 Hugh はブログを通じて知識を世界に共有し、個人や企業が潜在能力を最大限に発揮できるよう無料の Excel チュートリアルとオンライン トレーニングを提供しています。