如何在Excel中使用Z评分查找异常值(快速步骤)

  • Share This
Hugh West

在统计学概率计算中,z分是最重要的。 数据集中的数据分布和异常值可以用这个术语来确定。 可以从数据集中手动确定它们。 如果你有一个更大的数据集,有几个工具供你使用。 Excel就是其中之一。 如果你正在寻找一些特殊的技巧,用Excel中的z分来寻找异常值。本文将讨论使用Z评分寻找异常值的方法的每一步。 让我们跟随完整的指南来学习这一切。

下载实践工作手册

在阅读本文的同时,下载这个练习工作簿进行练习。 它包含了不同电子表格中的所有数据集,以便清楚地了解。 在你逐步进行的过程中尝试自己。

使用Z分数查找异常值.xlsx

什么是Z评分?

在统计学中,Z分数代表了某一特定数据点与人口的标准差。 这一衡量标准告诉我们,一个特定的数值与它的标准差相比,离平均值有多远。 标准差是所有不同点和平均值的有效值)。 Z分数的数学公式是

在哪里?

Z = Z评分

X =观察值

= 均值

σ =标准偏差

什么是离群值?

离群值是指与数据集中其他数值有显著差异的数值。 另一种说法是,离群值是指比数据集的平均值和中位数高得多或低得多的数值。 在Excel图表中,你可以把那些与其他数据点保持距离的数据点视为离群值。 例如,考虑一个场景,你有5个总得分在NBA赛季中,不同球员的得分分别是1600、1400、300和1500。 现在,如果你在Excel中绘制图表,你会发现300点与其他点相距甚远。 因此,在这个3000点是一个异常点。

一个离群点被认为是在以下范围内的Z得分值 3 -3 因为这些数值与平均值有相当大的距离。

在Excel中使用Z评分寻找异常值的步骤

在下一节中,我们将使用一种有效而棘手的方法,在Excel中使用z分数来寻找离群值。 我们将通过计算所有数字的平均值和标准差来确定样本的z分数。 然后我们将找到每个观察值的离群值。 本节提供了关于这种方法的大量细节。 你应该学习并应用所有这些来提高你的我们使用的是 "中国"。 微软Office 365 在这里,你可以利用任何其他版本,根据你的偏好。

步骤1:计算数据集的平均值

首先,我们要找到数据集的平均值,这将有助于确定标准差和Z分数。 我们使用 平均函数 这个函数接收一系列的参数或数值范围,并返回它们的平均值。 让我们走过计算数据集平均值的步骤。

  • 首先,选择单元格的范围,并在单元格中输入以下公式 H4 .

=average(c5:c20)

  • 然后,按 进入 .
  • 因此,你将得到所有数据的平均值。

阅读更多。 如何在Excel中用标准偏差查找异常值(含快速操作步骤)

第2步:估计标准差

现在,我们要估计一下标准差。 我们将使用 STDEV.P函数 这个函数将从一系列数字或作为参数的数值范围中返回标准偏差。 让我们走过估计标准偏差的步骤。

  • 首先,选择单元格的范围,并在单元格中输入以下公式 H5 .

=stdev.p(c5:c20)

  • 然后,按 进入 .
  • 因此,你将得到所有数据的标准偏差值。

阅读更多。 如何在Excel中计算离群值(5种简单方法)

第3步:评估Z分数

现在,我们要评估Z分数。 为了确定数值的Z分数,首先,我们需要数值与平均值的差异,然后根据公式除以标准差。 让我们走过估计Z分数的步骤。

  • 首先,为了评估Z得分,你必须在单元格中输入以下公式 D5 .

=(c5-$h$4)/$h$5

  • 然后,按 进入 .
  • 因此,你将得到数据集中第一个值的Z得分。

  • 接下来,拖动 填充手柄 图标,将该列中的其他单元格填入公式。
  • 因此,你将得到数据集中所有条目的Z得分。

  • 在我们的数据集中,均值为 113.875 而标准差为 100.21 现在,如果我们考虑到以下的具体数值 $79 ,这个值的Z得分是 -0.347 这意味着 $79 0.347 低于平均值或均值的标准差。
  • 在另一种情况下,当值为 $500 ,我们得到的Z得分是 3.85 这意味着 $500 3.85 平均值以上的标准差。

阅读更多。 如何在Excel的回归分析中找到异常值(3种简单的方法)

第4步:从数据集中找到离群值

现在我们要在我们的数据集中找出异常值。 异常值被认为是在以下范围内的Z得分值 3 -3 让我们通过步骤来找出数据集中的异常值。 这里,我们将使用 循环功能 如果范围内的任何数值满足条件,那么结果将是 是的。

  • 首先,为了找到离群值,你必须在单元格中输入以下公式 E5 .

=OR((D53))

  • 然后,按 进入 .
  • 结果是,你会发现数据集中的第一个值是否包含离群值。

  • 接下来,拖动 填充手柄 图标,将该列中的其他单元格填入公式。
  • 因此,你将能够知道数据集中的数值是否包含离群值,如下图所示。

从上面的数据集,我们可以看到只有一个id的z分值高于3,这就是为什么我们只得到一个离群点。

现在,我们要用一个显示离群值的 散点 图:我们必须遵循以下程序。

  • 首先,选择单元格的范围 C5:D20 .
  • 然后,去到 插入 标签:选择 插入散点图(X,Y)或气泡图。 并最终选择 散点 .

  • 因此,你将得到以下图表。

  • 要修改图表样式,选择 图表 设计 然后,选择你想要的 风格9 选项,从 图表样式 组。

  • 因此,你将得到以下结果 散点 图。

阅读更多。 如何在Excel中查找异常值(5种实用方法)

总结

今天的课程就到此结束了。 我坚信从现在开始,你也许可以用Excel中的z score找到异常值。 如果你有任何疑问或建议,请在下面的评论区分享。

不要忘记查看我们的网站 独家专访 不断学习新的方法,不断成长!

Hugh West is a highly experienced Excel trainer and analyst with over 10 years of experience in the industry. He holds a Bachelor's degree in Accounting and Finance and a Master's degree in Business Administration. Hugh has a passion for teaching and has developed a unique teaching approach that is easy to follow and understand. His expert knowledge of Excel has helped thousands of students and professionals worldwide improve their skills and excel in their careers. Through his blog, Hugh shares his knowledge with the world, offering free Excel tutorials and online training to help individuals and businesses reach their full potential.