エクセルで外れ値を計算する方法(5つの簡単な方法)

  • これを共有
Hugh West

データセットから統計計算を行うために、外れ値を特定する必要がある場合があります。 Microsoft Excelを使って、膨大なデータセットから外れ値を発見する方法は数多くあります。 この記事では、Microsoft Excelで外れ値を計算する方法を、5つの異なる方法を使って紹介します。

練習用ワークブックをダウンロードする

ここから無料のExcelワークブックをダウンロードし、ご自身で練習してください。

外れ値を探す.xlsx

Excelで外れ値を計算するための5つの便利な方法

異常値 は、データセット内の他のデータ値とは著しく異なるデータ値である。 つまり、外れ値は、例外的な値である。 高い いやしくも ロー データセットの他の値との比較において。 異常値の発見 は、データ解析の結果に影響を与えるので、統計計算には欠かせない。

例えば、12人の日収を示すデータセットがあったとします。 さて、マイクロソフト・エクセルを使って外れ値を計算する必要があります。 ここでは、そのための簡単なアプローチを5つ紹介します。

1.Excelで外れ値を計算するためにソートやフィルタを使用する

を利用することで、小さなデータセットから外れ値を計算することができます。 ソート&フィルター ソートやフィルタ機能を使用して外れ値を計算したい場合は、以下の手順で行います。

ステップ1.

  • まず、Excelのデータセットで、並べ替えたい列のヘッダーを選択します。 例えば、与えられたデータセットで、ファイルの列のヘッダーの名前に 日収 (セル C40 が選択される)。

ステップ2.

  • 次に ホーム をクリックし、リボン上の 編集 のグループです。

ステップ3.

  • その後 編集グループ をクリックします。 ソート&フィルター コマンドをクリックし カスタム ソート .

ステップ4.

  • という名前の新しいダイアログボックスが表示されます。 ソート が表示されるので、ポップアップしたダイアログボックスで デイリー 収入 において 並び替え のドロップダウンと 最小から最大まで をクリックします。 よっしゃー .

ステップ5.

  • 最後に 日収 この手順を実行した後、データ範囲に異常がないかを調べ、外れ値を決定する。

例えば、上記の結果のように、列の最初の2つの値はデータセットの残りの値より大幅に低く、列の最後の2つの値は大幅に高くなっています。

続きを読む Excelの回帰分析で外れ値を見つける方法(3つの簡単な方法)

2.QUARTILE関数を使用してExcelで外れ値を計算する

QUARTILE関数 のアプローチは、Excel で外れ値を計算するのにより科学的な方法です。 この関数を使用して、データセットを 4 等分に分割することができます。 以下の値が QUARTILE関数 :

  • があります。 さいしょう の値を設定します。
  • があります。 第1回 四分位値(Q1- 与えられたデータセットの最低25%)。
  • があります。 第2回 四分位値(Q2-データセットの次の下位25%)。
  • があります。 3位 四分位値(Q3-データセットの中で2番目に高い25%)。
  • があります。 最大 の値を設定します。

の構文です。 QUARTILE関数 をExcelで表示すると

=QUARTILE(array,quart)です。

構文は以下の引数を含む。

  • a レイ : 四分位値を計算するデータセットのセル範囲を指定します。
  • クオート これは、どの値を返すかを指定するものである。

上記データセットの外れ値を計算するために QUARTILE関数を使用します。 は、以下の手順で行ってください。

ステップ1.

  • まず、以下の計算式を入力して決定します。 第1回 四分位 Q1 )を以下に示す。
=quartile($c$5:$c$16,1)

ステップ2.

  • ここでも、計算式は 3位 四分位 Q3 )を以下に示す。
=quartile($c$5:$c$16,3)

ステップ3.

  • 3つ目は、決定することです。 IQR。 というものである。 四分位値間の範囲 (を表します。 50% の、第1四分位と第3四分位に入る範囲のデータセットから、与えられたデータを差し引いたもの)。 Q1 (セル内 G4 )から Q3 (セル内 G5 ). 次の計算式を入力して、引き算を計算してください。

    =G5-G4

ステップ4.

  • を見つけた後 IQR。 を決定する必要があります。 下げる なぜなら 下げる 上限値を求めるには、次のような式を書けばよい。

    =G5+(1.5*G6)

ステップ5.

  • そして、下限値を計算するために、次の式を書き出す。
=G4-(1.5*G6)

ステップ6.

  • 最後に、前のステップを終えたら、各データ値の外れ値を決定します。 エクセルのワークシートに、次の数式を入力します。 オア関数 細胞内 D5 .
=OR(C5$G$7)

  • この式は、上記の範囲制限に該当しないデータを特定するのに役立ちます。 処理後の式は、以下のように表示されます。 TRUEステートメント 特定のデータが異常値である場合、および FALSE であれば ダブルクリック について オートフィル セル内ツール C5でコピー の残りのセルに数式を入力します。 C列 このように、データセット内のすべての外れ値の横に「真」の値を表示することができます。

3.AVERAGE関数とSTDEV.P関数を組み合わせて、平均値と標準偏差から外れ値を計算する。

A 標準偏差 又は σ は、データセット全体の平均値に対して、データがどの程度分布しているかを判断するための指標です。 標準偏差が小さいとデータは平均値の周りに集まり、標準偏差が大きいとデータはより広がります。 を使って外れ値を計算するには、次のようにします。 平均値 標準偏差 の場合は、以下の手順で行います。

ステップ1.

  • まず、冒頭と同じデータセットを使って、平均と標準偏差を計算します。 平均を計算するには、次の数式をタイプしてください。 AVERAGE機能 細胞内 G5 .
=平均値(c5:c16)

ステップ2.

  • 標準偏差を計算する場合は、以下の数式を挿入してください。 STDEV.P関数 細胞内 G6 .
=stdev.p(c5:c16)

ステップ3.

  • 次に、さらに工程を進めるための上限を計算します。 セル内 G7 の場合、下限値を以下の式で算出する。
=G5-(1.25*G6)

ステップ4.

  • そして、細胞内 G8 は、次の式から上限値を算出する。
=G5+(1.5*G6)

ステップ5.

  • その後、外れ値があるかどうかを計算するために、次の数式をセルに入力します。 D5 .
=OR(C5$G$8)

  • したがって、この式は の値は、目的のセルの特定のデータが異常値であり、かつ FALSEです。
  • ダブルクリック について オートフィル セル内ツール D5 の残りのセルに数式をコピーします。 D列 こうして、データセットに残っている外れ値をすべて見つけることができます。

続きを読む Excelで標準偏差を使って外れ値を見つける方法(簡単な手順付き)

4.Excelで外れ値を計算するためにZ-Scoreを挿入する

があります。 Zスコア は、外れ値を特定するために最もよく使われる指標の1つである。 この方法は、特定のデータが、その標準偏差に関してデータセットの平均からどれだけ離れているかを示す。 を使って外れ値を計算するには、次のようにする。 Zスコア をExcelで表示すると、以下のような手順で表示されます。

ステップ1.

  • まず、目的のデータセットを取ります。

ステップ2.

  • 第二に、セルにおいて H5, を入力すると、次の計算式で計算されます。 平均値 を指定した。
=平均値(c5:c16)

ステップ3.

  • 第三に、計算する。 標準偏差 与えられたデータセットのセル H6 を以下の式で算出する。
=stdev.p(c5:c16)

ステップ4.

  • その後に、決定してください。 Z -点数 これを行うには、以下の公式を使用します。
=(c5-$h$5)/$h$6

ステップ5.

  • をすべて計算した上で Z値です。 の範囲にあることがわかります。 Z値 の間にある。 -1.44 13 の値を考える。 Zスコア 1.2未満またはそれ以上 +1.8 を異常値限界に設定します。
  • 次に、次の数式をセルに入力します。 E 5 .
=OR((D51.8))

  • 最後に、この式は を返します。 FALSE
  • ダブルクリック オンセル E5 を使用します。 オートフィル の残りのセルに数式をコピーするには、ツールフィルハンドルを使用します。 E列 こうして、データセットに残っている外れ値をすべて見つけることができる。

続きを読む ExcelでZスコアを使用して外れ値を検索する方法(簡単な手順付き)

5.LARGE関数とSMALL関数を統合してExcelで外れ値を探す

LARGE機能 SMALL機能 は、Excelでは逆の操作になります。 ここでは、データセット内の最大と最小のデータまたは値をそれぞれ見つけるために使用します。 この関数は、データセット内のすべてのデータを引き出し、最小と最大の数値を見つけます。 2番目に小さいまたは最大、3番目に大きいまたは最小、などを見つけることができるのです。

ステップ1.

  • まず、セルで次の数式を使用します。 E5 をもって LARGE機能 .
=large($c$5:$c$16,1)です。

    • したがって、から 12 の値を見ると、1番大きな値が表示されています。 780 .

ステップ2.

  • その後、セル内 G5 の場合、次の式で最小値を求めよ。
=small($c$5:$c$16,1)です。

  • 最後に、から 12 の値では 第1回 最小値 110 .
  • 必要な値がすべてわかれば、データセットの異常値を簡単に指摘することができる。

結論

以上で本記事を終了します。 本記事がお役に立てれば幸いです。 本記事をお読みになった方は、いずれかの方法を用いてExcelで外れ値を計算できるようになります。 さらにご質問やお勧め情報がありましたら、以下のコメント欄でお知らせください。

Hugh West は、業界で 10 年以上の経験を持つ、非常に経験豊富な Excel トレーナー兼アナリストです。彼は会計と財務の学士号と経営管理の修士号を取得しています。ヒューは教えることに情熱を持っており、理解しやすい独自の教育アプローチを開発しました。彼の Excel に関する専門知識は、世界中の何千人もの学生や専門家がスキルを向上させ、キャリアで優れた成果を上げるのに役立ってきました。 Hugh はブログを通じて知識を世界に共有し、個人や企業が潜在能力を最大限に発揮できるよう無料の Excel チュートリアルとオンライン トレーニングを提供しています。