목차
데이터 세트의 데이터에 대한 통계 계산을 수행하려면 이상값을 식별해야 할 수 있습니다. 다양한 방법으로 Microsoft Excel을 사용하여 거대한 데이터 세트에서 이상값을 발견할 수 있습니다. 이 게시물에서는 5가지 방법을 사용하여 Microsoft Excel에서 이상값을 계산하는 방법을 보여줍니다.
연습 통합 문서 다운로드
여기에서 무료 Excel 통합 문서를 다운로드하여 직접 연습할 수 있습니다. .
이상값 찾기.xlsx
Excel에서 이상값을 계산하는 5가지 유용한 방법
이상값 은 데이터 값입니다. 데이터 세트의 나머지 데이터 값과 크게 다릅니다. 즉, 특이치는 특별한 값입니다. 데이터 집합의 다른 값과 비교하여 예외적으로 높음 이거나 과도하게 낮음 입니다. 이상값 찾기 는 데이터 분석 결과에 영향을 미치기 때문에 통계 계산에서 매우 중요합니다.
예를 들어, 12명의 일일 소득을 보여주는 데이터 세트가 있습니다. 이제 Microsoft Excel을 사용하여 이상값을 계산해야 합니다. 여기에서는 이를 위한 5가지 쉬운 방법을 보여드리겠습니다.
1. Sort & Excel에서 이상값을 계산하는 필터
Sort & Excel의 Filter 명령. 정렬 및 필터 기능을 사용하여 이상값을 계산하려는 경우 다음을 수행할 수 있습니다.아래 단계를 따르십시오.
1단계:
- 먼저 Excel 데이터세트에서 정렬하려는 열 헤더를 선택합니다. 예를 들어 주어진 데이터 세트에서 Daily Income 이라는 이름의 파일 열 머리글에 있습니다(셀 C40 이 선택됨).
2단계:
- 그런 다음 홈 탭을 클릭하고 편집 그룹으로 이동합니다.
3단계:
- 그 다음 편집 그룹 에서 정렬 & Filter 명령을 클릭하고 Custom Sort .
<19를 클릭합니다>
4단계:
- 그러면 정렬 이라는 새 대화 상자가 열립니다. 팝업 대화 상자에서 정렬 기준 <7에서 일일 수입 을 선택합니다> 드롭다운 및 최소에서 최대 순서 드롭다운. 그런 다음 확인 을 클릭합니다.
5단계:
- 마지막으로, 일일 소득 열은 가장 낮은 값이 맨 위에, 가장 큰 값이 맨 아래에 오도록 지정된 방식으로 정렬됩니다. 절차를 실행한 후 데이터 범위의 불규칙성을 찾아 이상값을 결정합니다.
예를 들어 열의 처음 두 값은 상당히 낮고 열의 마지막 두 값은 데이터 세트의 나머지 값보다 상당히 높습니다.위의 결과.
자세히 보기: Excel에서 회귀 분석에서 이상값을 찾는 방법(3가지 쉬운 방법)
2. QUARTILE 함수 적용 Excel에서 이상값 계산
QUARTILE 함수 접근 방식은 Excel에서 이상값을 계산하는 보다 과학적인 방법입니다. 이 기능을 사용하여 데이터 세트를 4개의 동일한 부분으로 나눌 수 있습니다. 다음 값은 QUARTILE 함수 에 의해 반환됩니다.
- 최소 값.
- 1차 사분위수(Q1- 주어진 데이터 세트의 최저 25%).
- 2차 사분위수(Q2-다음 데이터세트의 하위 25%).
- 3번째 사분위수(Q3- 데이터세트의 두 번째로 높은 25%).
- 최대 값.
Excel에서 QUARTILE 함수 의 구문은 다음과 같습니다.
=QUARTILE( array,quart)
구문에는 다음 인수가 포함됩니다.
- a rray : 주어진 셀 범위 사분위수 값을 계산할 데이터 세트입니다.
- 쿼트: 반환할 값을 지정합니다.
QUARTILE 함수 를 사용하여 위 데이터 세트에 대한 이상값을 계산하려면 다음 단계를 따르세요.
1단계:
- 먼저 1st 사분위수( Q1 )를 결정하는 식을 입력하면 아래와 같다.
=QUARTILE($C$5:$C$16,1)
2단계:
- 여기다시 3번째 사분위수( Q3 )를 구하는 공식은 아래와 같다.
=QUARTILE($C$5:$C$16,3)
3단계:
- 셋째, IQR을 결정해야 합니다. 사분위수 범위 (제1사분위수와 제3사분위수에 해당하는 데이터 세트 범위에서 주어진 데이터의 50% 을 나타냄) Q1 (셀 G4 )에서 Q3 (셀 G5 ). 다음 수식을 입력하여 빼기를 계산합니다.
=G5-G4
4단계:
- IQR을 찾은 후 다음으로 상위 을 결정하고 하한 상한 및 하한 제한에는 대부분의 데이터가 포함되기 때문입니다. 데이터 세트. 상한을 계산하기 위해 다음 공식을 작성하십시오.
=G5+(1.5*G6)
5단계:
- 그리고 하한을 계산하기 위해 다음 공식을 적습니다.
=G4-(1.5*G6)
6단계:
- 마지막으로 이전 단계를 마친 후 각 데이터에 대한 이상값을 결정할 수 있습니다. 값. Excel 워크시트에서 셀 D5 .
=OR(C5$G$7)
- 이 공식은 위에서 언급한 범위 제한에 속하지 않는 데이터를 식별하는 데 도움이 됩니다. 처리 후수식은 특정 데이터가 이상치인 경우 TRUE 문 을 표시하고 그렇지 않은 경우 FALSE 를 표시합니다. 셀 C5의 자동완성 도구를 두 번 클릭 하여 수식을 나머지 셀에 복사합니다. 열 C . 따라서 데이터 세트의 모든 이상값 옆에 True 값을 관찰할 수 있습니다.
3. AVERAGE 및 STDEV.P 함수를 결합하여 평균 및 표준 편차에서 이상값을 계산합니다.
A 표준 편차 (또는 σ )는 전체 데이터 세트의 평균값과 관련하여 데이터가 얼마나 분포되어 있는지를 결정하는 메트릭입니다. 표준 편차가 낮으면 데이터가 평균 주위에 그룹화되고 표준 편차가 높으면 데이터가 더 분산됩니다. 평균 및 표준편차 를 사용하여 이상치를 계산하려면 다음 단계를 따르십시오.
1단계:
- 먼저 이 문서의 시작 부분에 표시된 것과 동일한 데이터 세트를 사용한 다음 평균 및 표준 편차를 계산합니다. 평균을 계산하려면 셀 G5 .
=AVERAGE(C5:C16)
2단계:
- 표준 편차를 계산하려면 STDEV .P 함수 셀 G6 .
=STDEV.P(C5:C16)
3단계:
- 다음으로프로세스의 추가 발전을 위한 상한. 셀 G7 에서 다음 수식을 사용하여 하한을 계산합니다.
=G5-(1.25*G6)
4단계:
- 그리고 셀 G8 다음 공식에서 상한을 계산
=G5+(1.5*G6)
5단계:
- 그 후 이상값이 있는지 계산하려면 D5 .
=OR(C5$G$8)
<셀에 다음 수식을 입력합니다. 0>- 따라서 원하는 셀의 특정 데이터가 이상치이고 인 경우 수식은 TRUE 값을 반환합니다. FALSE.
- 두 번 클릭 D5 <7 셀의 자동완성 도구를 > 수식을 열 D 의 나머지 셀에 복사합니다. 따라서 데이터세트에서 나머지 이상값을 모두 찾을 수 있습니다.
자세히 알아보기: Excel에서 표준 편차가 있는 이상값을 찾는 방법(빠른 단계 포함)
4. Z-Score를 삽입하여 Excel에서 이상점 계산
The Z-score 는 이상치 식별. 이 방법은 특정 데이터가 표준 편차와 관련하여 데이터 세트의 평균에서 얼마나 떨어져 있는지 보여줍니다. Excel에서 Z-score 를 사용하여 이상값을 계산하려면 아래 설명된 단계를 볼 수 있습니다.
1단계:
- 먼저 원하는 데이터 세트를 가져옵니다.
단계2:
- 둘째, H5 셀에 다음 수식을 입력하여 평균 주어진 데이터에 대해.
=AVERAGE(C5:C16)
3단계:
- 셋째, 셀 H6 에 주어진 데이터셋의 표준편차 를 다음 공식을 사용하여 계산합니다.
=STDEV.P(C5:C16)
4단계:
- 그 후 , 각 데이터 값에 대해 Z -점수 를 결정해야 합니다. 이렇게 하려면 아래 공식을 사용합니다.
=(C5-$H$5)/$H$6
5단계:
- Z-값 을 모두 계산한 후 Z-값 는 -1.44 에서 13 사이입니다. 따라서 Z-score -1.2 미만 또는 +1.8 이상의 값을 이상치 한계로 고려합니다.
- 다음 수식을 셀 E 5 에 입력합니다.
=OR((D51.8))
- 마지막으로, 수식은 특정 데이터가 이상치인 경우 TRUE 값을 반환하고 FALSE <9를 반환합니다>
- 셀 E5 를 두 번 클릭 하여 자동완성 E 열의 나머지 셀에 수식을 복사하는 도구 채우기 핸들. 따라서 데이터세트에서 나머지 이상값을 모두 찾을 수 있습니다.
자세히 알아보기: Excel에서 Z 점수를 사용하여 이상값을 찾는 방법(Quick 사용)단계)
5. LARGE 함수와 SMALL 함수를 병합하여 Excel에서 Outlier 찾기
LARGE 함수 및 SMALL 함수 Excel 반대 작업이 있습니다. 이를 사용하여 각각 데이터 세트에서 가장 큰 데이터와 가장 작은 데이터 또는 값을 찾습니다. 이 함수는 데이터 세트 내의 모든 데이터를 가져와 가장 작은 수와 가장 큰 수를 찾습니다. 두 번째로 작거나 가장 큰 것, 세 번째로 크거나 가장 작은 것 등을 찾을 수 있습니다.
1단계:
- 먼저 E5 셀에 다음 수식을 LARGE 함수 와 함께 사용합니다.
=LARGE($C$5:$C$16,1)
-
- 따라서 12 값에서 첫 번째로 큰 값인 <6을 볼 수 있습니다> 780 .
2단계:
- 다음 셀 G5 에 다음 수식을 적어 가장 작은 값을 찾습니다.
=SMALL($C$5:$C$16,1)
- 마지막으로 12 값에서 1번째 값을 볼 수 있습니다. 가장 작은 값 110 .
- 필요한 모든 값을 찾으면 데이터 세트에서 이상치를 쉽게 지적할 수 있습니다.
결론
이 기사의 끝입니다. 이 기사가 도움이 되었기를 바랍니다. 이 기사를 읽은 후 Excel에서 방법 중 하나를 사용하여 이상값을 계산할 수 있습니다. 추가 질문이나 권장 사항을 다음과 공유하십시오.아래 댓글 섹션에서 우리에게.