Table of contents
在统计学概率计算中,z分是最重要的。 数据集中的数据分布和异常值可以用这个术语来确定。 可以从数据集中手动确定它们。 如果你有一个更大的数据集,有几个工具供你使用。 Excel就是其中之一。 如果你正在寻找一些特殊的技巧,用Excel中的z分来寻找异常值。本文将讨论使用Z评分寻找异常值的方法的每一步。 让我们跟随完整的指南来学习这一切。
下载实践工作手册
在阅读本文的同时,下载这个练习工作簿进行练习。 它包含了不同电子表格中的所有数据集,以便清楚地了解。 在你逐步进行的过程中尝试自己。
使用Z分数查找异常值.xlsx什么是Z评分?
在统计学中,Z分数代表了某一特定数据点与人口的标准差。 这一衡量标准告诉我们,一个特定的数值与它的标准差相比,离平均值有多远。 标准差是所有不同点和平均值的有效值)。 Z分数的数学公式是
在哪里?
Z = Z评分
X =观察值
x̅ = 均值
σ =标准偏差
什么是离群值?
离群值是指与数据集中其他数值有显著差异的数值。 另一种说法是,离群值是指比数据集的平均值和中位数高得多或低得多的数值。 在Excel图表中,你可以把那些与其他数据点保持距离的数据点视为离群值。 例如,考虑一个场景,你有5个总得分在NBA赛季中,不同球员的得分分别是1600、1400、300和1500。 现在,如果你在Excel中绘制图表,你会发现300点与其他点相距甚远。 因此,在这个3000点是一个异常点。
一个离群点被认为是在以下范围内的Z得分值 3 至 -3 因为这些数值与平均值有相当大的距离。
在Excel中使用Z评分寻找异常值的步骤
在下一节中,我们将使用一种有效而棘手的方法,在Excel中使用z分数来寻找离群值。 我们将通过计算所有数字的平均值和标准差来确定样本的z分数。 然后我们将找到每个观察值的离群值。 本节提供了关于这种方法的大量细节。 你应该学习并应用所有这些来提高你的我们使用的是 "中国"。 微软Office 365 在这里,你可以利用任何其他版本,根据你的偏好。
步骤1:计算数据集的平均值
首先,我们要找到数据集的平均值,这将有助于确定标准差和Z分数。 我们使用 平均函数 这个函数接收一系列的参数或数值范围,并返回它们的平均值。 让我们走过计算数据集平均值的步骤。
- 首先,选择单元格的范围,并在单元格中输入以下公式 H4 .
=average(c5:c20)
- 然后,按 进入 .
- 因此,你将得到所有数据的平均值。
阅读更多。 如何在Excel中用标准偏差查找异常值(含快速操作步骤)
第2步:估计标准差
现在,我们要估计一下标准差。 我们将使用 STDEV.P函数 这个函数将从一系列数字或作为参数的数值范围中返回标准偏差。 让我们走过估计标准偏差的步骤。
- 首先,选择单元格的范围,并在单元格中输入以下公式 H5 .
=stdev.p(c5:c20)
- 然后,按 进入 .
- 因此,你将得到所有数据的标准偏差值。
阅读更多。 如何在Excel中计算离群值(5种简单方法)
第3步:评估Z分数
现在,我们要评估Z分数。 为了确定数值的Z分数,首先,我们需要数值与平均值的差异,然后根据公式除以标准差。 让我们走过估计Z分数的步骤。
- 首先,为了评估Z得分,你必须在单元格中输入以下公式 D5 .
=(c5-$h$4)/$h$5
- 然后,按 进入 .
- 因此,你将得到数据集中第一个值的Z得分。
- 接下来,拖动 填充手柄 图标,将该列中的其他单元格填入公式。
- 因此,你将得到数据集中所有条目的Z得分。
- 在我们的数据集中,均值为 113.875 而标准差为 100.21 现在,如果我们考虑到以下的具体数值 $79 ,这个值的Z得分是 -0.347 这意味着 $79 是 0.347 低于平均值或均值的标准差。
- 在另一种情况下,当值为 $500 ,我们得到的Z得分是 3.85 这意味着 $500 是 3.85 平均值以上的标准差。
阅读更多。 如何在Excel的回归分析中找到异常值(3种简单的方法)
第4步:从数据集中找到离群值
现在我们要在我们的数据集中找出异常值。 异常值被认为是在以下范围内的Z得分值 3 至 -3 让我们通过步骤来找出数据集中的异常值。 这里,我们将使用 循环功能 如果范围内的任何数值满足条件,那么结果将是 是的。
- 首先,为了找到离群值,你必须在单元格中输入以下公式 E5 .
=OR((D53))
- 然后,按 进入 .
- 结果是,你会发现数据集中的第一个值是否包含离群值。
- 接下来,拖动 填充手柄 图标,将该列中的其他单元格填入公式。
- 因此,你将能够知道数据集中的数值是否包含离群值,如下图所示。
从上面的数据集,我们可以看到只有一个id的z分值高于3,这就是为什么我们只得到一个离群点。
现在,我们要用一个显示离群值的 散点 图:我们必须遵循以下程序。
- 首先,选择单元格的范围 C5:D20 .
- 然后,去到 插入 标签:选择 插入散点图(X,Y)或气泡图。 并最终选择 散点 .
- 因此,你将得到以下图表。
- 要修改图表样式,选择 图表 设计 然后,选择你想要的 风格9 选项,从 图表样式 组。
- 因此,你将得到以下结果 散点 图。
阅读更多。 如何在Excel中查找异常值(5种实用方法)
总结
今天的课程就到此结束了。 我坚信从现在开始,你也许可以用Excel中的z score找到异常值。 如果你有任何疑问或建议,请在下面的评论区分享。
不要忘记查看我们的网站 独家专访 不断学习新的方法,不断成长!