Table of contents
为了对数据集的数据进行统计计算,可能需要识别离群值。 你可以用Microsoft Excel以多种方式从巨大的数据集中发现离群值。 在这篇文章中,我们将向你展示如何用五种不同的方式在Microsoft Excel中计算离群值。
下载实践工作手册
你可以从这里下载免费的Excel工作簿,自己练习。
寻找离群值.xlsx在Excel中计算离群值的5种方便的方法
离群索居者 换句话说,离群值是指非同寻常的数值。 它们要么是特别的 高 或过多的 低 与数据集中的其他数值相比。 寻找离群值 在统计计算中是至关重要的,因为它们对我们的数据分析结果有影响。
例如,你有一个数据集,显示了12个人的每日收入。 现在,你需要用Microsoft Excel计算离群值。 在这里,我将向你展示五个简单的方法来做到这一点。
1.在Excel中使用排序和过滤来计算离群值
你可以从一个小的数据集中计算出离群值,方法是利用 排序 & 筛选 如果你想用排序和过滤功能来计算离群值,你可以按照下面的步骤来做。
步骤1。
- 首先,在你的excel数据集中选择你想排序的列头。 例如,在给定的数据集中,在文件列头名为 每日收入 (细胞 C40 被选中)。
第2步。
- 然后,按 首页 在功能区上的标签,进入 编辑工作 组。
第3步。
- 此后,在 编辑组 点击 排序 & 筛选 命令,并点击 定制 分类 .
第4步。
- 然后,一个新的对话框名为 分类 在弹出的对话框中,选择 每日 收入 在 排序方式 下拉和 最小的到最大的 之后,点击 认可 .
第5步。
- 最后, 每日收入 运行该程序后,寻找数据范围中的任何不规则现象以确定异常值。
例如,如上述结果所示,该列中的前两个数值明显低于,该列中的最后两个数值大大高于数据集中的其他数值。
阅读更多。 如何在Excel的回归分析中找到异常值(3种简单的方法)
2.应用QUARTILE函数计算Excel中的异常值
QUARTILE函数 方法是在Excel中计算异常值的一种更科学的方法。 你可以用这个函数将你的数据集分成四个相等的部分。 以下的值将被返回到 QUARTILE函数 :
- ǞǞǞ 最低限度 价值。
- ǞǞǞ 第一届 四分位数(Q1-特定数据集的最低25%)。
- ǞǞǞ 第2次 四分位数(Q2-数据集的下一个最低25%)。
- ǞǞǞ 第三届 四分位数(Q3-数据集中第二高的25%)。
- ǞǞǞ 最大限度 价值。
的语法。 QUARTILE函数 在Excel中是。
=QUARTILE(array,quart)
该语法包含以下参数。
- a 睿智 : 你要计算四分位数的数据集的单元格范围。
- 夸特。 这指定了应该返回哪个值。
为了计算上述数据集的离群值,使用 QUARTILE函数。 请按照以下步骤操作。
步骤1。
- 首先,输入以下公式,以确定 第一届 四分位数( Q1 )如下所示。
=quartile($c$5:$c$16,1)
第2步。
- 在这里,计算的公式还是 第三届 四分位数( Q3 )如下所示。
=quartile($c$5:$c$16,3)
第3步。
- 第三,你必须确定 IQR。 这就是 四分位数之间的范围 (它代表 50% 属于第一和第三四分位数的一组数据中的给定数据),减去 Q1 (在细胞 G4 ) 从 Q3 (在细胞 G5 ).键入以下公式来计算减法。
=G5-G4
See_also: 如何在Excel中为散点图添加数据标签(2种简单方法)
第4步。
- 在发现 IQR。 接下来,你必须确定 上层 和 较低的 因为 上层 和 较低的 写下以下公式来计算上限。
=G5+(1.5*G6)
第5步。
- 然后,为了计算下限,写下以下公式。
=G4-(1.5*G6)
第6步。
- 最后,在完成上一步后,你可以确定每个数据值的离群值。 在excel工作表中,键入以下公式,用 循环功能 在细胞中 D5 .
=OR(C5$G$7)
- 这个公式将有助于识别不属于上述范围限制的数据。 在处理后,该公式将显示一个 TRUE 声明 如果特定的数据是一个异常值,并且 失败 如果不是这样的话。 双击 关于 自动填表 细胞中的工具 C5复制 中的其他单元格的公式。 C列 因此,你可以在你的数据集中的所有离群值旁边观察到一个 "真 "值。
3.结合AVERAGE和STDEV.P函数,从平均值和标准差中计算出异常值
A 标准差 (或 σ 当标准差较低时,数据围绕着平均值分组,而当标准差较高时,数据则更加分散。 要计算离群值,可使用 平均值 和 标准偏差 你可以遵循以下步骤。
步骤1。
- 首先,使用本文开头所示的同一数据集,然后计算平均数和标准差。 要计算平均数,请输入以下公式,并加上 平均函数 在细胞中 G5 .
=average(c5:c16)
第2步。
- 要计算标准差,请插入以下公式,其中包括 STDEV.P函数 在细胞中 G6 .
=stdev.p(c5:c16)
第3步。
- 接下来,你将计算出进一步推进进程的上限。 在单元格中 G7 ,用以下公式计算出下限。
=G5-(1.25*G6)
第4步。
- 而在细胞中 G8 根据以下公式计算出上限
=G5+(1.5*G6)
第5步。
- 之后,为了计算是否存在任何异常值,在单元格中输入以下公式 D5 .
=OR(C5$G$8)
- 因此,该公式将返回一个 为真 如果所需单元格中的特定数据是一个离群值,那么该值为 错。
- 双击 关于 自动填表 细胞中的工具 D5 将公式复制到其余的单元格中。 D列 因此,你可以在你的数据集中找出所有剩余的离群点。
阅读更多。 如何在Excel中用标准偏差查找异常值(含快速步骤)
4.在Excel中插入Z-分数来计算异常值
ǞǞǞ Z-score 是识别异常值最常用的指标之一。 这种方法显示了一个特定的数据与数据集的平均数相比,其标准偏差有多大。 要计算异常值,使用 Z-score 在Excel中,你可以看到下面描述的步骤。
步骤1。
- 首先,取所需的数据集。
第2步。
- 其次,在细胞 H5, 键入以下公式来计算 意味着 对于给定的数据。
=average(c5:c16)
第3步。
- 第三,计算出 标准差 的单元格中,给定数据集的 H6 通过使用以下公式。
=stdev.p(c5:c16)
第4步。
- 在这之后,你必须确定 Z -分数 要做到这一点,你要使用下面的公式。
=(c5-$h$5)/$h$6
第5步。
- 在计算了所有 Z值。 你会看到,在这个范围内 Z值 是在 -1.44 和 13 因此,我们考虑的值是 Z-score 小于-1.2或大于 +1.8 为异常值的限制。
- 然后,在单元格中键入以下公式 E 5 .
=OR((D51.8))
- 最后,该公式将返回一个 为真 值,如果特定的数据是一个离群值,将返回 失败
- 双击 细胞上 E5 来使用 自动填表 工具的填充柄,将公式复制到其他的单元格中。 E栏 因此,你可以在你的数据集中找到所有剩余的离群值。
阅读更多。 如何在Excel中使用Z评分查找异常值(快速步骤)
5.合并LARGE和SMALL函数来寻找Excel中的异常值
LARGE功能 和 小号功能 在Excel中,有相反的操作。 我们将用它来分别寻找一个数据集中最大和最小的数据或数值。 这个函数将拉出一个数据集中的所有数据,找到最小和最大的数字。 他们能够找到第二小或最大的,第三大或最小的,以此类推。
步骤1。
- 首先,在单元格中使用以下公式 E5 与 巨大的功能 .
=large($c$5:$c$16,1)
- 因此,从 12 值,你可以看到第一大值是 780 .
第2步。
- 此后,在细胞 G5 ,写下下面的公式来寻找最小的值。
=small($c$5:$c$16,1)
- 最后,从 12 值,你可以看到 第一届 最小值 110 .
- 一旦你找出了所有需要的数值,那么你就可以很容易地指出数据集中的任何异常值。
总结
本文到此结束。 希望本文对你有所帮助。 读完本文后,你将能够使用任何一种方法在Excel中计算离群值。 如有进一步疑问或建议,请在下面的评论区与我们分享。