目次
データセットから統計計算を行うために、外れ値を特定する必要がある場合があります。 Microsoft Excelを使って、膨大なデータセットから外れ値を発見する方法は数多くあります。 この記事では、Microsoft Excelで外れ値を計算する方法を、5つの異なる方法を使って紹介します。
練習用ワークブックをダウンロードする
ここから無料のExcelワークブックをダウンロードし、ご自身で練習してください。
外れ値を探す.xlsxExcelで外れ値を計算するための5つの便利な方法
異常値 は、データセット内の他のデータ値とは著しく異なるデータ値である。 つまり、外れ値は、例外的な値である。 高い いやしくも ロー データセットの他の値との比較において。 異常値の発見 は、データ解析の結果に影響を与えるので、統計計算には欠かせない。
例えば、12人の日収を示すデータセットがあったとします。 さて、マイクロソフト・エクセルを使って外れ値を計算する必要があります。 ここでは、そのための簡単なアプローチを5つ紹介します。
1.Excelで外れ値を計算するためにソートやフィルタを使用する
を利用することで、小さなデータセットから外れ値を計算することができます。 ソート&フィルター ソートやフィルタ機能を使用して外れ値を計算したい場合は、以下の手順で行います。
ステップ1.
- まず、Excelのデータセットで、並べ替えたい列のヘッダーを選択します。 例えば、与えられたデータセットで、ファイルの列のヘッダーの名前に 日収 (セル C40 が選択される)。
ステップ2.
- 次に ホーム をクリックし、リボン上の 編集 のグループです。
ステップ3.
- その後 編集グループ をクリックします。 ソート&フィルター コマンドをクリックし カスタム ソート .
ステップ4.
- という名前の新しいダイアログボックスが表示されます。 ソート が表示されるので、ポップアップしたダイアログボックスで デイリー 収入 において 並び替え のドロップダウンと 最小から最大まで をクリックします。 よっしゃー .
ステップ5.
- 最後に 日収 この手順を実行した後、データ範囲に異常がないかを調べ、外れ値を決定する。
例えば、上記の結果のように、列の最初の2つの値はデータセットの残りの値より大幅に低く、列の最後の2つの値は大幅に高くなっています。
続きを読む Excelの回帰分析で外れ値を見つける方法(3つの簡単な方法)
2.QUARTILE関数を使用してExcelで外れ値を計算する
QUARTILE関数 のアプローチは、Excel で外れ値を計算するのにより科学的な方法です。 この関数を使用して、データセットを 4 等分に分割することができます。 以下の値が QUARTILE関数 :
- があります。 さいしょう の値を設定します。
- があります。 第1回 四分位値(Q1- 与えられたデータセットの最低25%)。
- があります。 第2回 四分位値(Q2-データセットの次の下位25%)。
- があります。 3位 四分位値(Q3-データセットの中で2番目に高い25%)。
- があります。 最大 の値を設定します。
の構文です。 QUARTILE関数 をExcelで表示すると
=QUARTILE(array,quart)です。
構文は以下の引数を含む。
- a レイ : 四分位値を計算するデータセットのセル範囲を指定します。
- クオート これは、どの値を返すかを指定するものである。
上記データセットの外れ値を計算するために QUARTILE関数を使用します。 は、以下の手順で行ってください。
ステップ1.
- まず、以下の計算式を入力して決定します。 第1回 四分位 Q1 )を以下に示す。
=quartile($c$5:$c$16,1)
ステップ2.
- ここでも、計算式は 3位 四分位 Q3 )を以下に示す。
=quartile($c$5:$c$16,3)
ステップ3.
- 3つ目は、決定することです。 IQR。 というものである。 四分位値間の範囲 (を表します。 50% の、第1四分位と第3四分位に入る範囲のデータセットから、与えられたデータを差し引いたもの)。 Q1 (セル内 G4 )から Q3 (セル内 G5 ). 次の計算式を入力して、引き算を計算してください。
=G5-G4
ステップ4.
- を見つけた後 IQR。 を決定する必要があります。 上 と 下げる なぜなら 上 と 下げる 上限値を求めるには、次のような式を書けばよい。
=G5+(1.5*G6)
ステップ5.
- そして、下限値を計算するために、次の式を書き出す。
=G4-(1.5*G6)
ステップ6.
- 最後に、前のステップを終えたら、各データ値の外れ値を決定します。 エクセルのワークシートに、次の数式を入力します。 オア関数 細胞内 D5 .
=OR(C5$G$7)
- この式は、上記の範囲制限に該当しないデータを特定するのに役立ちます。 処理後の式は、以下のように表示されます。 TRUEステートメント 特定のデータが異常値である場合、および FALSE であれば ダブルクリック について オートフィル セル内ツール C5でコピー の残りのセルに数式を入力します。 C列 このように、データセット内のすべての外れ値の横に「真」の値を表示することができます。
3.AVERAGE関数とSTDEV.P関数を組み合わせて、平均値と標準偏差から外れ値を計算する。
A 標準偏差 又は σ は、データセット全体の平均値に対して、データがどの程度分布しているかを判断するための指標です。 標準偏差が小さいとデータは平均値の周りに集まり、標準偏差が大きいとデータはより広がります。 を使って外れ値を計算するには、次のようにします。 平均値 と 標準偏差 の場合は、以下の手順で行います。
ステップ1.
- まず、冒頭と同じデータセットを使って、平均と標準偏差を計算します。 平均を計算するには、次の数式をタイプしてください。 AVERAGE機能 細胞内 G5 .
=平均値(c5:c16)
ステップ2.
- 標準偏差を計算する場合は、以下の数式を挿入してください。 STDEV.P関数 細胞内 G6 .
=stdev.p(c5:c16)
ステップ3.
- 次に、さらに工程を進めるための上限を計算します。 セル内 G7 の場合、下限値を以下の式で算出する。
=G5-(1.25*G6)
ステップ4.
- そして、細胞内 G8 は、次の式から上限値を算出する。
=G5+(1.5*G6)
ステップ5.
- その後、外れ値があるかどうかを計算するために、次の数式をセルに入力します。 D5 .
=OR(C5$G$8)
- したがって、この式は 真 の値は、目的のセルの特定のデータが異常値であり、かつ FALSEです。
- ダブルクリック について オートフィル セル内ツール D5 の残りのセルに数式をコピーします。 D列 こうして、データセットに残っている外れ値をすべて見つけることができます。
続きを読む Excelで標準偏差を使って外れ値を見つける方法(簡単な手順付き)
4.Excelで外れ値を計算するためにZ-Scoreを挿入する
があります。 Zスコア は、外れ値を特定するために最もよく使われる指標の1つである。 この方法は、特定のデータが、その標準偏差に関してデータセットの平均からどれだけ離れているかを示す。 を使って外れ値を計算するには、次のようにする。 Zスコア をExcelで表示すると、以下のような手順で表示されます。
ステップ1.
- まず、目的のデータセットを取ります。
ステップ2.
- 第二に、セルにおいて H5, を入力すると、次の計算式で計算されます。 平均値 を指定した。
=平均値(c5:c16)
ステップ3.
- 第三に、計算する。 標準偏差 与えられたデータセットのセル H6 を以下の式で算出する。
=stdev.p(c5:c16)
ステップ4.
- その後に、決定してください。 Z -点数 これを行うには、以下の公式を使用します。
=(c5-$h$5)/$h$6
ステップ5.
- をすべて計算した上で Z値です。 の範囲にあることがわかります。 Z値 の間にある。 -1.44 と 13 の値を考える。 Zスコア 1.2未満またはそれ以上 +1.8 を異常値限界に設定します。
- 次に、次の数式をセルに入力します。 E 5 .
=OR((D51.8))
- 最後に、この式は 真 を返します。 FALSE
- ダブルクリック オンセル E5 を使用します。 オートフィル の残りのセルに数式をコピーするには、ツールフィルハンドルを使用します。 E列 こうして、データセットに残っている外れ値をすべて見つけることができる。
続きを読む ExcelでZスコアを使用して外れ値を検索する方法(簡単な手順付き)
5.LARGE関数とSMALL関数を統合してExcelで外れ値を探す
LARGE機能 と SMALL機能 は、Excelでは逆の操作になります。 ここでは、データセット内の最大と最小のデータまたは値をそれぞれ見つけるために使用します。 この関数は、データセット内のすべてのデータを引き出し、最小と最大の数値を見つけます。 2番目に小さいまたは最大、3番目に大きいまたは最小、などを見つけることができるのです。
ステップ1.
- まず、セルで次の数式を使用します。 E5 をもって LARGE機能 .
=large($c$5:$c$16,1)です。
- したがって、から 12 の値を見ると、1番大きな値が表示されています。 780 .
ステップ2.
- その後、セル内 G5 の場合、次の式で最小値を求めよ。
=small($c$5:$c$16,1)です。
- 最後に、から 12 の値では 第1回 最小値 110 .
- 必要な値がすべてわかれば、データセットの異常値を簡単に指摘することができる。
結論
以上で本記事を終了します。 本記事がお役に立てれば幸いです。 本記事をお読みになった方は、いずれかの方法を用いてExcelで外れ値を計算できるようになります。 さらにご質問やお勧め情報がありましたら、以下のコメント欄でお知らせください。