目次
統計的な確率計算では、zスコアが最も重要です。 データセットのデータ分布や外れ値は、この用語で判断できます。 データセットから手動で判断することも可能です。 大きなデータセットであれば、自由に使えるツールがいくつかあります。 Excelもその一つです。 Excelでzスコアを使用して外れ値を見つける特別なトリックを探しているなら、この用語を使ってみてください。この記事では、zスコアを使った外れ値の見つけ方について、すべてのステップを説明します。 このすべてを学ぶために、完全なガイドに従ってみましょう。
練習用ワークブックをダウンロードする
この記事を読みながら、この練習用ワークブックをダウンロードして練習してください。 このワークブックには、すべてのデータセットが異なるスプレッドシートに含まれており、明確に理解できます。 ステップバイステップのプロセスを進めながら、自分自身を試してみてください。
Zスコアを使った外れ値の検索.xlsxZスコアとは?
統計学では、z スコアは特定のデータポイントの母集団からの標準偏差を表します。 この指標は、特定の値がその標準偏差との関係で集合の平均からどれくらい離れているかを示します。 標準偏差はすべての異なるポイントと平均のRMS値です)。 z スコアの数学式は、次のとおりです。
どこで
Z = z スコア
X =観測値
x̅ = 平均値
σ = 標準偏差
Outlierとは?
外れ値とは、データセット内の他の値とは著しく異なる値のことである。 別の言い方をすれば、データセットの平均値や中央値よりもはるかに高い値や低い値を外れ値という。 Excelのグラフでは、他のデータ点から大きく離れているデータ点を外れ値と考えることができる。 例えば、総得点が5点のシナリオを考えてみよう。ここで、エクセルでグラフを描くと、300点が他から大きく離れていることがわかります。 つまり、この3000点が異常値ということになります。
の範囲内のzスコア値を外れ値とする。 3 まで -3 というのも、これらの値は平均の値からかなり離れているからです。
ExcelでZスコアを使用して外れ値を検索するステップバイステップの手順
このセクションでは、Excel の z スコアを使用して外れ値を見つける効果的でトリッキーな方法を 1 つ使用します。 すべての数値の平均と標準偏差を計算してサンプルの z スコアを決定します。 そして、それぞれの観測値の外れ値を見つけます。 このセクションでは、この方法について幅広く詳細に説明します。 これらのすべてを学習して適用し、あなたの能力を向上させる必要があります。思考力とExcelの知識。 Microsoft Office 365 のバージョンもありますが、お好みに応じてご利用ください。
ステップ1:データセットの平均を計算する
まず、データセットの平均を求めます。 これは、標準偏差とzスコアを決定するのに役立ちます。 AVERAGE機能 この関数は、一連の引数または値の範囲を受け取り、それらの平均を返します。 データセットの平均を計算する手順を追ってみましょう。
- まず、セルの範囲を選択し、セルに次の数式を入力します。 H4 .
=平均値(c5:c20)
- 次に、 を押します。 入力 .
- 結果として、すべてのデータの平均値を得ることができます。
続きを読む Excelで標準偏差を使って外れ値を見つける方法(簡単な手順付き)
ステップ2:標準偏差の推定
次に、標準偏差を推定する。 STDEV.P関数 この関数は、引数として受け取った一連の数値または値の範囲から標準偏差を返します。 標準偏差を推定する手順を説明しましょう。
- まず、セルの範囲を選択し、セルに次の数式を入力します。 H5 .
=stdev.p(c5:c20)
- 次に、 を押します。 入力 .
- その結果、すべてのデータの標準偏差の値を得ることができます。
続きを読む エクセルで外れ値を計算する方法(5つの簡単な方法)
ステップ3:Zスコアの評価
それでは、z スコアの評価を行います。 値の z スコアを求めるには、まず、平均値との差を求め、それを公式に従って標準偏差で割ります。 z スコアを推定する手順を説明しましょう。
- まず、z スコアを評価するには、次の数式をセルに入力する必要があります。 D5 .
=(c5-$h$4)/$h$5
- 次に、 を押します。 入力 .
- その結果、データセットの最初の値に対するzスコアが得られます。
- 次に フィルハンドル アイコンをクリックすると、列の残りのセルに数式が入力されます。
- その結果、データセットのすべてのエントリのzスコアが得られます。
- 我々のデータセットでは、平均値は 113.875 であり、標準偏差は 100.21 の具体的な値について考えてみましょう。 $79 であり、この値に対するzスコアは -0.347 ということは $79 でございます 0.347 平均値または平均値より標準偏差が小さいこと。
- また、別のケースでは、値が $500 となり、Z スコアは 3.85 ということは $500 でございます 3.85 平均値より標準偏差が大きい。
続きを読む Excelの回帰分析で外れ値を見つける方法(3つの簡単な方法)
ステップ4:データセットから外れ値を探す
ここで、データセットから外れ値を見つけることにする。 外れ値とは、z スコア値が 3 まで -3 では、データセットから外れ値を見つける手順を説明します。 ここでは、データセットから外れ値を見つけるために オア関数 を利用して、データセット中の値が外れ値を含んでいるかどうかを調べる。 もし、範囲内の値のいずれかが条件を満たしていれば、結果は 真です。
- まず、外れ値を見つけるには、次の数式をセルに入力する必要があります。 E5 .
=OR((D53))
- 次に、 を押します。 入力 .
- その結果、データセットの最初の値に外れ値が含まれているかどうかが分かる。
- 次に フィルハンドル アイコンをクリックすると、列の残りのセルに数式が入力されます。
- その結果、以下のように、データセット内の値に外れ値が含まれているかどうかを知ることができます。
上記のデータセットから、zスコアが3以上のIDは1つだけであることがわかる。
では、外れ値を表示するために 散布 チャートで確認することができます。
- まず、セルの範囲を選択します C5:D20 .
- 次に インサート タブで選択します。 散布図(X、Y)またはバブルチャートを挿入します。 を選択し、最後に 散布 .
- その結果、以下のようなチャートが表示されます。
- チャートのスタイルを変更するには チャート デザイン を選択し、希望の スタイル9 オプションを指定します。 チャートスタイル のグループです。
- その結果、次のようなものが得られます。 散布 チャートで確認できます。
続きを読む エクセルで外れ値を見つける方法(5つの便利な方法)
結論
以上で本日のセッションは終了です。 これからは、Excelでz scoreを使って外れ値を見つけることができるようになると強く信じています。 もし、何かご質問やお勧めがありましたら、以下のコメント欄で共有してください。
ホームページのチェックをお忘れなく Exceldemy.com Excelに関する様々な問題や解決策を 新しい手法を学び、成長し続けることができます。