Excel에서 Z 점수를 사용하여 이상값을 찾는 방법(빠른 단계 포함)

  • 이 공유
Hugh West

통계 확률 계산에서 z 점수는 가장 중요합니다. 데이터 집합의 데이터 분포 및 이상값은 이 용어로 확인할 수 있습니다. 데이터 세트에서 수동으로 결정하는 것이 가능합니다. 더 큰 데이터 세트가 있는 경우 마음대로 사용할 수 있는 여러 도구가 있습니다. 엑셀도 그 중 하나입니다. Excel에서 z 점수를 사용하여 이상값을 찾는 특별한 방법을 찾고 있다면 잘 찾아오셨습니다. 이 기사에서는 z 점수를 사용하여 이상값을 찾는 방법의 모든 단계에 대해 설명합니다. 이 모든 것을 배우기 위해 완전한 가이드를 따르십시오.

연습 워크북 다운로드

이 기사를 읽는 동안 연습할 이 연습 워크북을 다운로드하십시오. 여기에는 명확한 이해를 위해 다양한 스프레드시트의 모든 데이터 세트가 포함되어 있습니다. 단계별 프로세스를 진행하는 동안 직접 시도해 보십시오.

Z 점수를 사용하여 이상값 찾기.xlsx

Z 점수란 무엇입니까?

통계에서 z 점수는 특정 데이터 포인트에 대한 모집단의 표준 편차를 나타냅니다. 이 측정은 특정 값이 표준 편차와 관련하여 집합의 평균에서 얼마나 떨어져 있는지 알려줍니다. (표준 편차는 모든 다른 점과 평균의 RMS 값입니다). z 점수의 수학 공식은

여기서

Z = z 점수

입니다.

X =관측치

= 평균치

σ = 표준편차

무엇아웃라이어는?

이상값은 데이터세트의 다른 값과 크게 다른 값입니다. 이를 다르게 표현하면 이상값은 데이터 세트의 평균 및 중앙값보다 훨씬 높거나 낮은 값입니다. Excel 그래프에서 다른 데이터 포인트와 멀리 떨어져 있는 데이터 포인트를 이상값으로 간주할 수 있습니다. 예를 들어, NBA 시즌에 5명의 다른 플레이어가 득점한 총 점수가 있는 시나리오를 생각해 보십시오. 점수는 1600, 1400, 300, 1500입니다. 이제 Excel에서 그래프를 그리면 300점이 다른 점과 멀리 떨어져 있음을 알 수 있습니다. 따라서 이 3000이 이상값입니다.

이상값은 3 ~ -3 범위 내의 z 점수 값으로 간주됩니다. 이러한 값은 상당히 멀리 떨어져 있기 때문입니다.

Excel에서 Z 점수를 사용하여 이상값을 찾는 단계별 절차

다음 섹션에서는 다음 섹션에서 이상값을 찾기 위해 효과적이고 까다로운 방법을 사용합니다. Excel의 z 점수. 모든 숫자의 평균과 표준 편차를 계산하여 샘플의 z 점수를 결정할 것입니다. 그런 다음 각 관측치의 이상값을 찾습니다. 이 섹션에서는 이 방법에 대한 광범위한 세부 정보를 제공합니다. 사고력과 엑셀 지식을 향상시키기 위해서는 이 모든 것을 배우고 적용해야 합니다. 여기서는 Microsoft Office 365 버전을 사용하지만, 다른 버전도 사용할 수 있습니다.

1단계: 데이터세트 평균 계산

처음에는 데이터세트 평균을 구하겠습니다. 이는 표준 편차와 z 점수를 결정하는 데 도움이 됩니다. 그녀는 AVERAGE 함수 를 사용하여 관찰의 평균을 결정합니다. 이 함수는 일련의 인수 또는 값 범위를 받아 평균을 반환합니다. 데이터 세트의 평균을 계산하는 단계를 살펴보겠습니다.

  • 먼저 셀 범위를 선택하고 셀 H4 에 다음 수식을 입력합니다.

=AVERAGE(C5:C20)

  • 그런 다음 Enter 를 누릅니다.
  • 결과적으로 모든 데이터의 평균값을 갖게 됩니다.

자세히 알아보기: Excel에서 표준 편차가 있는 이상치를 찾는 방법( with Quick Steps)

2단계: 표준 편차 추정

이제 표준 편차를 추정하겠습니다. STDEV.P 함수 를 사용하여 데이터 세트의 표준 편차를 결정합니다. 이 함수는 일련의 숫자 또는 인수로 사용하는 값 ​​범위의 표준 편차를 반환합니다. 표준 편차를 추정하는 단계를 살펴보겠습니다.

  • 먼저 셀 범위를 선택하고 셀 H5 에 다음 수식을 입력합니다.

=STDEV.P(C5:C20)

  • 그런 다음 Enter 를 누릅니다.
  • 결과적으로 표준편차모든 데이터에 대한 가치.

자세히 알아보기: Excel에서 이상값을 계산하는 방법(5가지 쉬운 방법)

3단계: Z 점수 평가

이제 Z 점수를 평가하겠습니다. 값의 z 점수를 결정하려면 먼저 평균과 값의 차이가 필요한 다음 공식에 따라 표준 편차로 나눕니다. z 점수를 추정하는 단계를 살펴보겠습니다.

  • 먼저 z 점수를 평가하려면 셀 D5 에 다음 수식을 입력해야 합니다.

=(C5-$H$4)/$H$5

  • 그런 다음 Enter 를 누릅니다.
  • 결과적으로 데이터세트의 첫 번째 값에 대한 z 점수를 갖게 됩니다.

  • 다음으로 채우기 핸들 아이콘을 드래그하여 내용을 채웁니다. 수식을 사용하여 열의 나머지 셀.
  • 결과적으로 데이터세트의 모든 항목에 대한 z 점수를 얻게 됩니다.

  • 데이터 세트에서 평균값은 113.875 이고 표준 편차는 100.21 입니다. 이제 $79 의 특정 값을 고려하면 이 값의 z 점수는 -0.347 이며 이는 $79 0.347 표준임을 의미합니다. 평균 또는 평균값 미만의 편차.
  • 또 다른 경우 값이 $500 인 경우 z 점수는 3.85 입니다. 즉, $500 은 평균값보다 3.85 표준 편차가 높다는 의미입니다.

자세히 알아보기: 방법Excel의 회귀 분석에서 이상값 찾기(3가지 쉬운 방법)

4단계: 데이터세트에서 이상값 찾기

이제 데이터세트에서 이상값을 찾아보겠습니다. 위에서 언급한 바와 같이 3 ~ -3 범위 내의 z 점수 값을 이상치로 간주한다. 데이터 세트에서 이상값을 찾는 단계를 살펴보겠습니다. 여기에서는 OR 함수 를 사용하여 데이터 세트의 값에 이상값이 포함되어 있는지 여부를 확인합니다. 범위 내의 값 중 하나라도 조건을 만족하면 결과는 TRUE가 됩니다.

  • 우선 이상값을 찾으려면 셀에 다음 수식을 입력해야 합니다. E5 .

=OR((D53))

  • 그런 다음 Enter 를 누릅니다.
  • 결과적으로 데이터 세트에서 첫 번째 값에 이상값이 포함되어 있는지 여부를 확인할 수 있습니다.

  • 다음으로 드래그 채우기 핸들 아이콘을 사용하여 열의 나머지 셀을 수식으로 채웁니다.
  • 결과적으로 데이터세트의 값에 이상값이 포함되어 있는지 또는 아래에 표시된 것과는 다릅니다.

위 데이터 세트에서 하나의 id의 z 점수만 3보다 큰 것을 볼 수 있습니다. 그래서 하나의 이상치만 얻습니다. .

이제 Scatter 차트를 사용하여 이상값을 표시합니다. 다음 프로세스를 따라야 합니다.

  • 먼저 C5:D20 셀의 범위를 선택합니다.
  • 다음으로 이동합니다. 삽입 탭. 분산형(X, Y) 삽입 또는 거품형 차트 를 선택하고 마지막으로 분산형 을 선택합니다.

  • 결과적으로 다음 차트를 얻게 됩니다.

  • 차트 스타일을 수정하려면 차트 디자인을 선택합니다. 그런 다음 차트 스타일 그룹에서 원하는 스타일 9 옵션을 선택합니다.

  • 결과적으로 다음과 같은 분산형 차트를 얻게 됩니다.

자세히 보기: 방법 Excel에서 이상값 찾기(5가지 유용한 방법)

결론

오늘 세션은 여기까지입니다. 나는 지금부터 Excel에서 z 점수를 사용하여 이상값을 찾을 수 있을 것이라고 굳게 믿습니다. 질문이나 권장 사항이 있는 경우 아래 의견 섹션에서 공유하십시오.

웹 사이트 Exceldemy.com 에서 다양한 Excel 관련 문제 및 솔루션을 확인하는 것을 잊지 마십시오. 새로운 방법을 계속 배우고 계속 성장하세요!

Hugh West는 업계에서 10년 이상의 경험을 가진 고도로 숙련된 Excel 트레이너이자 분석가입니다. 그는 회계 및 재무 학사 학위와 경영학 석사 학위를 보유하고 있습니다. Hugh는 교육에 대한 열정을 가지고 있으며 따라하기 쉽고 이해하기 쉬운 독특한 교수법을 개발했습니다. Excel에 대한 그의 전문 지식은 전 세계 수천 명의 학생과 전문가가 자신의 기술을 향상시키고 경력에서 탁월하도록 도왔습니다. Hugh는 자신의 블로그를 통해 자신의 지식을 전 세계와 공유하고 개인과 기업이 잠재력을 최대한 발휘할 수 있도록 무료 Excel 자습서 및 온라인 교육을 제공합니다.