Как найти выбросы с помощью Z Score в Excel (с быстрыми шагами)

  • Поделись Этим
Hugh West

В статистических вероятностных расчетах показатель z имеет первостепенное значение. С его помощью можно определить распределение данных и выбросы в наборе данных. Можно определить их вручную по набору данных. Если у вас большой набор данных, в вашем распоряжении несколько инструментов. Excel - один из них. Если вы ищете некоторые специальные приемы для поиска выбросов с помощью показателя z в Excel,Вы пришли по адресу. В этой статье мы обсудим каждый шаг метода поиска выбросов с помощью z score. Давайте последуем полному руководству, чтобы узнать все это.

Скачать Рабочую тетрадь для практических занятий

Скачайте эту рабочую тетрадь для тренировок, пока вы читаете эту статью. В ней содержатся все наборы данных в разных электронных таблицах для ясного понимания. Попробуйте себя, пока вы проходите пошаговый процесс.

Поиск выбросов с помощью Z Score.xlsx

Что такое Z Score?

В статистике показатель z представляет собой стандартное отклонение от популяции для конкретной точки данных. Этот показатель говорит нам о том, насколько далеко конкретное значение находится от среднего значения набора по отношению к его стандартному отклонению. (Стандартное отклонение - это среднеквадратичное значение всех различных точек и среднего значения). Математическая формула для показателя z следующая

Где,

Z = z оценка

X = наблюдаемое значение

= среднее значение

σ = стандартное отклонение

Что такое выброс?

Выбросы - это значения, которые значительно отличаются от других значений в наборе данных. По-другому это можно сказать так: выброс - это значение, которое намного выше или ниже среднего и медианы набора данных. На графике Excel вы можете рассматривать точки данных, которые находятся далеко от других точек данных, как выбросы. Например, рассмотрим сценарий, в котором общее количество очков, набранных 5Набранные очки - 1600, 1400, 300 и 1500. Теперь, если построить график в Excel, вы увидите, что точка 300 лежит далеко от остальных. Таким образом, 3000 - это выброс.

Выбросом считается значение z-балла в диапазоне 3 на -3 потому что эти значения довольно далеки от значения среднего.

Пошаговая процедура поиска выбросов с помощью Z Score в Excel

В следующем разделе мы используем один эффективный и хитрый метод поиска выбросов с помощью z score в Excel. Мы определим z score выборки, рассчитав среднее и стандартное отклонение всех чисел. А затем мы найдем выбросы каждого наблюдения. В этом разделе приведены подробные сведения об этом методе. Вам следует изучить и применить все эти методы, чтобы улучшить свои знания.способность мыслить и знание Excel. Мы используем Microsoft Office 365 здесь приведена версия, но вы можете использовать любую другую версию в соответствии с вашими предпочтениями.

Шаг 1: Вычислить среднее значение набора данных

В начале, мы собираемся найти среднее значение набора данных. Это будет полезно для определения стандартного отклонения и z-балла. Для этого мы используем функция AVERAGE Эта функция принимает ряд аргументов или диапазон значений и возвращает их среднее значение. Давайте пройдемся по шагам, чтобы вычислить среднее значение набора данных.

  • Прежде всего, выделите диапазон ячеек и введите в ячейку следующую формулу H4 .

= СРЕДНЕЕ(C5:C20)

  • Затем нажмите Войти .
  • Как следствие, вы получите среднее значение всех данных.

Читать далее: Как найти выбросы с помощью стандартного отклонения в Excel (с быстрыми шагами)

Шаг 2: Оценка стандартного отклонения

Теперь мы собираемся оценить стандартное отклонение. Мы будем использовать функция STDEV.P для определения стандартного отклонения для набора данных. Эта функция вернет стандартное отклонение от ряда чисел или диапазона значений, которые она принимает в качестве аргументов. Давайте пройдемся по шагам, чтобы оценить стандартное отклонение.

  • Прежде всего, выделите диапазон ячеек и введите в ячейку следующую формулу H5 .

=STDEV.P(C5:C20)

  • Затем нажмите Войти .
  • Как следствие, вы получите значение стандартного отклонения для всех данных.

Читать далее: Как рассчитать выбросы в Excel (5 простых способов)

Шаг 3: Оценить Z-балл

Теперь мы собираемся оценить z score. Для определения z score значений, прежде всего, нам нужна разница значения от среднего, а затем разделить ее на стандартное отклонение по формуле. Давайте пройдемся по шагам, чтобы оценить z score.

  • Прежде всего, чтобы оценить показатель z, необходимо ввести в ячейку следующую формулу D5 .

= (C5-$H$4)/$H$5

  • Затем нажмите Войти .
  • В результате вы получите z-оценку для первого значения в наборе данных.

  • Затем перетащите Наполнительная рукоятка значок , чтобы заполнить формулой остальные ячейки столбца.
  • В результате вы получите оценку z для всех записей набора данных.

  • В нашем наборе данных среднее значение составляет 113.875 а стандартное отклонение составляет 100.21 . Теперь, если мы рассмотрим конкретное значение $79 z оценка для этого значения равна -0.347 что означает $79 это 0.347 стандартных отклонений ниже среднего или среднего значения.
  • В другом случае, когда значение $500 получаем, что показатель z 3.85 . Это значит $500 это 3.85 стандартных отклонений выше среднего значения.

Читать далее: Как найти выбросы в регрессионном анализе в Excel (3 простых способа)

Шаг 4: Найти выбросы из набора данных

Теперь мы собираемся найти выбросы в нашем наборе данных. Выбросом считается значение оценки z в диапазоне 3 на -3 Давайте пройдемся по шагам, чтобы найти выбросы в наборе данных. Здесь мы будем использовать функция ИЛИ чтобы выяснить, содержат ли значения в наборе данных выбросы или нет. Если любое из значений в диапазоне удовлетворяет условию, то результат будет следующим TRUE.

  • Прежде всего, чтобы найти выбросы, необходимо ввести в ячейку следующую формулу E5 .

=OR((D53))

  • Затем нажмите Войти .
  • В результате вы узнаете, содержит ли первое значение выбросы или нет в наборе данных.

  • Затем перетащите Наполнительная рукоятка значок , чтобы заполнить формулой остальные ячейки столбца.
  • Как следствие, вы сможете узнать, содержат ли значения в наборе данных выбросы или нет, как показано ниже.

Из приведенного выше набора данных видно, что только у одного идентификатора показатель z превышает значение 3. Поэтому мы получаем только один выброс.

Теперь мы собираемся показать выбросы, используя Разброс схема. Мы должны следовать следующему процессу:

  • Во-первых, выберите диапазон ячеек C5:D20 .
  • Затем перейдите к Вставка вкладка. Выбрать Вставьте диаграмму разброса (X, Y) или пузырьковую диаграмму, и, наконец, выберите Разброс .

  • В результате вы получите следующий график.

  • Чтобы изменить стиль графика, выберите График Дизайн а затем выберите нужный Стиль 9 опция из Стили диаграмм группа.

  • Как следствие, вы получите следующее Разброс диаграмма.

Читать далее: Как найти выбросы в Excel (5 полезных способов)

Заключение

На этом сегодняшнее занятие закончено. Я твердо уверен, что теперь вы сможете находить промахи с помощью z score в Excel. Если у вас есть какие-либо вопросы или рекомендации, пожалуйста, поделитесь ими в разделе комментариев ниже.

Не забудьте заглянуть на наш сайт Exceldemy.com для решения различных проблем, связанных с Excel. Постоянно изучайте новые методы и развивайтесь!

Хью Уэст — опытный тренер и аналитик Excel с более чем 10-летним опытом работы в отрасли. Он имеет степень бакалавра в области бухгалтерского учета и финансов и степень магистра делового администрирования. Хью страстно любит преподавать и разработал уникальный подход к обучению, которому легко следовать и который легко понять. Его экспертные знания Excel помогли тысячам студентов и специалистов по всему миру улучшить свои навыки и преуспеть в своей карьере. В своем блоге Хью делится своими знаниями со всем миром, предлагая бесплатные учебные пособия по Excel и онлайн-обучение, чтобы помочь отдельным лицам и компаниям полностью раскрыть свой потенциал.