如何在Excel中计算离群值(5种简单方法)

  • Share This
Hugh West

为了对数据集的数据进行统计计算,可能需要识别离群值。 你可以用Microsoft Excel以多种方式从巨大的数据集中发现离群值。 在这篇文章中,我们将向你展示如何用五种不同的方式在Microsoft Excel中计算离群值。

下载实践工作手册

你可以从这里下载免费的Excel工作簿,自己练习。

寻找离群值.xlsx

在Excel中计算离群值的5种方便的方法

离群索居者 换句话说,离群值是指非同寻常的数值。 它们要么是特别的 或过多的 与数据集中的其他数值相比。 寻找离群值 在统计计算中是至关重要的,因为它们对我们的数据分析结果有影响。

例如,你有一个数据集,显示了12个人的每日收入。 现在,你需要用Microsoft Excel计算离群值。 在这里,我将向你展示五个简单的方法来做到这一点。

1.在Excel中使用排序和过滤来计算离群值

你可以从一个小的数据集中计算出离群值,方法是利用 排序 & 筛选 如果你想用排序和过滤功能来计算离群值,你可以按照下面的步骤来做。

步骤1。

  • 首先,在你的excel数据集中选择你想排序的列头。 例如,在给定的数据集中,在文件列头名为 每日收入 (细胞 C40 被选中)。

第2步。

  • 然后,按 首页 在功能区上的标签,进入 编辑工作 组。

第3步。

  • 此后,在 编辑组 点击 排序 & 筛选 命令,并点击 定制 分类 .

第4步。

  • 然后,一个新的对话框名为 分类 在弹出的对话框中,选择 每日 收入 排序方式 下拉和 最小的到最大的 之后,点击 认可 .

第5步。

  • 最后, 每日收入 运行该程序后,寻找数据范围中的任何不规则现象以确定异常值。

例如,如上述结果所示,该列中的前两个数值明显低于,该列中的最后两个数值大大高于数据集中的其他数值。

阅读更多。 如何在Excel的回归分析中找到异常值(3种简单的方法)

2.应用QUARTILE函数计算Excel中的异常值

QUARTILE函数 方法是在Excel中计算异常值的一种更科学的方法。 你可以用这个函数将你的数据集分成四个相等的部分。 以下的值将被返回到 QUARTILE函数 :

  • ǞǞǞ 最低限度 价值。
  • ǞǞǞ 第一届 四分位数(Q1-特定数据集的最低25%)。
  • ǞǞǞ 第2次 四分位数(Q2-数据集的下一个最低25%)。
  • ǞǞǞ 第三届 四分位数(Q3-数据集中第二高的25%)。
  • ǞǞǞ 最大限度 价值。

的语法。 QUARTILE函数 在Excel中是。

=QUARTILE(array,quart)

该语法包含以下参数。

  • a 睿智 : 你要计算四分位数的数据集的单元格范围。
  • 夸特。 这指定了应该返回哪个值。

为了计算上述数据集的离群值,使用 QUARTILE函数。 请按照以下步骤操作。

步骤1。

  • 首先,输入以下公式,以确定 第一届 四分位数( Q1 )如下所示。
=quartile($c$5:$c$16,1)

第2步。

  • 在这里,计算的公式还是 第三届 四分位数( Q3 )如下所示。
=quartile($c$5:$c$16,3)

第3步。

第4步。

  • 在发现 IQR。 接下来,你必须确定 上层 较低的 因为 上层 较低的 写下以下公式来计算上限。

    =G5+(1.5*G6)

第5步。

  • 然后,为了计算下限,写下以下公式。
=G4-(1.5*G6)

第6步。

  • 最后,在完成上一步后,你可以确定每个数据值的离群值。 在excel工作表中,键入以下公式,用 循环功能 在细胞中 D5 .
=OR(C5$G$7)

  • 这个公式将有助于识别不属于上述范围限制的数据。 在处理后,该公式将显示一个 TRUE 声明 如果特定的数据是一个异常值,并且 失败 如果不是这样的话。 双击 关于 自动填表 细胞中的工具 C5复制 中的其他单元格的公式。 C列 因此,你可以在你的数据集中的所有离群值旁边观察到一个 "真 "值。

3.结合AVERAGE和STDEV.P函数,从平均值和标准差中计算出异常值

A 标准差 (或 σ 当标准差较低时,数据围绕着平均值分组,而当标准差较高时,数据则更加分散。 要计算离群值,可使用 平均值 标准偏差 你可以遵循以下步骤。

步骤1。

  • 首先,使用本文开头所示的同一数据集,然后计算平均数和标准差。 要计算平均数,请输入以下公式,并加上 平均函数 在细胞中 G5 .
=average(c5:c16)

第2步。

  • 要计算标准差,请插入以下公式,其中包括 STDEV.P函数 在细胞中 G6 .
=stdev.p(c5:c16)

第3步。

  • 接下来,你将计算出进一步推进进程的上限。 在单元格中 G7 ,用以下公式计算出下限。
=G5-(1.25*G6)

第4步。

  • 而在细胞中 G8 根据以下公式计算出上限
=G5+(1.5*G6)

第5步。

  • 之后,为了计算是否存在任何异常值,在单元格中输入以下公式 D5 .
=OR(C5$G$8)

  • 因此,该公式将返回一个 为真 如果所需单元格中的特定数据是一个离群值,那么该值为 错。
  • 双击 关于 自动填表 细胞中的工具 D5 将公式复制到其余的单元格中。 D列 因此,你可以在你的数据集中找出所有剩余的离群点。

阅读更多。 如何在Excel中用标准偏差查找异常值(含快速步骤)

4.在Excel中插入Z-分数来计算异常值

ǞǞǞ Z-score 是识别异常值最常用的指标之一。 这种方法显示了一个特定的数据与数据集的平均数相比,其标准偏差有多大。 要计算异常值,使用 Z-score 在Excel中,你可以看到下面描述的步骤。

步骤1。

  • 首先,取所需的数据集。

第2步。

  • 其次,在细胞 H5, 键入以下公式来计算 意味着 对于给定的数据。
=average(c5:c16)

第3步。

  • 第三,计算出 标准差 的单元格中,给定数据集的 H6 通过使用以下公式。
=stdev.p(c5:c16)

第4步。

  • 在这之后,你必须确定 Z -分数 要做到这一点,你要使用下面的公式。
=(c5-$h$5)/$h$6

第5步。

  • 在计算了所有 Z值。 你会看到,在这个范围内 Z值 是在 -1.44 13 因此,我们考虑的值是 Z-score 小于-1.2或大于 +1.8 为异常值的限制。
  • 然后,在单元格中键入以下公式 E 5 .
=OR((D51.8))

  • 最后,该公式将返回一个 为真 值,如果特定的数据是一个离群值,将返回 失败
  • 双击 细胞上 E5 来使用 自动填表 工具的填充柄,将公式复制到其他的单元格中。 E栏 因此,你可以在你的数据集中找到所有剩余的离群值。

阅读更多。 如何在Excel中使用Z评分查找异常值(快速步骤)

5.合并LARGE和SMALL函数来寻找Excel中的异常值

LARGE功能 小号功能 在Excel中,有相反的操作。 我们将用它来分别寻找一个数据集中最大和最小的数据或数值。 这个函数将拉出一个数据集中的所有数据,找到最小和最大的数字。 他们能够找到第二小或最大的,第三大或最小的,以此类推。

步骤1。

  • 首先,在单元格中使用以下公式 E5 巨大的功能 .
=large($c$5:$c$16,1)

    • 因此,从 12 值,你可以看到第一大值是 780 .

第2步。

  • 此后,在细胞 G5 ,写下下面的公式来寻找最小的值。
=small($c$5:$c$16,1)

  • 最后,从 12 值,你可以看到 第一届 最小值 110 .
  • 一旦你找出了所有需要的数值,那么你就可以很容易地指出数据集中的任何异常值。

总结

本文到此结束。 希望本文对你有所帮助。 读完本文后,你将能够使用任何一种方法在Excel中计算离群值。 如有进一步疑问或建议,请在下面的评论区与我们分享。

Hugh West is a highly experienced Excel trainer and analyst with over 10 years of experience in the industry. He holds a Bachelor's degree in Accounting and Finance and a Master's degree in Business Administration. Hugh has a passion for teaching and has developed a unique teaching approach that is easy to follow and understand. His expert knowledge of Excel has helped thousands of students and professionals worldwide improve their skills and excel in their careers. Through his blog, Hugh shares his knowledge with the world, offering free Excel tutorials and online training to help individuals and businesses reach their full potential.