목차
상관 계수 는 통계 분석에서 매우 자주 접하게 되는 것 중 하나입니다. Pearson 상관 계수는 간단하지만 두 변수 간의 선형 상관 관계를 표현하는 효과적인 방법입니다. 데이터 분석 도구인 Excel은 상관 계수를 계산하는 몇 가지 훌륭한 방법을 제공합니다. 이 자습서에서는 Excel에서 Pearson 상관 계수를 계산하는 방법을 보여 드리겠습니다.
연습 워크북 다운로드
이 예제에 사용된 데이터 세트는 참조용으로 아래에 첨부되어 있습니다. 방법을 진행하면서 여기에서 다운로드하고 단계를 직접 시도할 수 있습니다.
Calculate Pearson Correlation Coefficient.xlsx
정의 피어슨 상관 계수?
앞서 언급한 바와 같이 Pearson 상관 계수는 두 변수 간의 선형 상관 관계를 측정한 것입니다. 수학적으로 말하면 공분산과 두 변수의 표준 편차 곱의 비율입니다. 수식에서 두 변수 X와 Y의 Pearson 상관 계수(r)는
이 수식의 특성 때문에 상관 계수는 항상 값이 됩니다. -1에서 1 사이입니다. 경우에 따라 값이 0이 될 수 있으며 이는 변수 간의 상관관계가 없음을 나타냅니다. 다른 극단적인 경우 -1 또는 1 값은 완벽한 음수 또는 양수 선형을 나타냅니다.둘 사이의 상관관계. 따라서 일반적으로 값이 0에 가까울수록 상관관계가 낮습니다. 0에서 멀어질수록 상관관계가 높다.
예를 들어 두 변수인 신발 사이즈와 발 사이즈는 항상 완벽한 양의 상관관계를 갖는다. 다음 데이터 세트를 살펴보십시오.
발 크기가 커질수록 신발 크기가 커짐에 따라 양의 선형 상관 관계를 나타냅니다.
그러나 실제 시나리오의 대부분의 변수는 상관 관계를 나타내지 않습니다. 대부분의 경우 상관 계수는 0에 가깝습니다. 예를 들어, 사람의 IQ로 발 크기를 고려해 봅시다.
결과적으로 그래프는 다음과 같을 것이며 두 변수 사이에 선형 상관관계가 없음을 나타냅니다.
Excel에서 Pearson 상관 계수를 쉽게 계산하는 4가지 방법
Excel에서 Pearson 상관 계수를 계산하는 방법에는 여러 가지가 있습니다. 첫째, 값을 수동으로 계산하고 위에서 설명한 수식의 값을 찾을 수 있습니다. 또한 Excel에는 변수 간의 상관 관계 및 Pearson 상관 관계를 찾는 두 가지 전용 기능이 있습니다. 두 변수 사이의 상관 관계를 찾는 데 사용할 수 있는 추가 도구도 있습니다.
모든 방법을 보여주기 위해 아래에서 동일한 데이터 세트를 사용하겠습니다.
나는 각각의 방법을 그들의각 하위 섹션. 당신에게 적합한 것을 찾기 위해 각각을 따르십시오. 또는 마음에 드는 특정 항목이 있는 경우 위 표에서 찾으십시오.
1. Excel에서 수동으로 Pearson 상관 계수 계산
항상 구식 "손으로" 계산하는 방법이 있습니다. Excel에서 두 변수 사이의 Pearson 상관 계수. 이 방법을 따를 경우 평균, 차이, 제곱, 합의 모든 값을 찾아 수동으로 Pearson 상관 계수를 계산해야 합니다. 수식에서 나이를 X 변수로, BMI를 변수 Y로 간주하고 r 값을 찾습니다. 이 방법에서 AVERAGE , SUM , 및 SQRT 기능을 접하게 됩니다.
자세한 안내는 다음과 같습니다.
단계:
- 먼저 다음 수식을 작성하여 평균 연령을 구합니다. C12 셀을 평균 연령 값으로 선택했습니다.
=AVERAGE(C5:C10)
- 다음 수식을 작성하여 평균 BMI 값을 구합니다.
=AVERAGE(D5:D10)
I 셀 D12 를 선택하여 값을 저장했습니다.
- 이제 X i 를 찾으려면- X̅ , 다음 식을 적는다.
=C5-$C$12
- 이제 Enter 를 누릅니다.
- 그런 다음 셀을 다시 선택합니다. 이제 채우기 핸들 아이콘 을 클릭하고 드래그하여열의 나머지 부분을 채우십시오.
- 유사한 방법으로 Y i 의 값을 찾으십시오. -Y̅ 다음 수식으로 작성.
=D5-$D$12
- 마찬가지로 Enter 키를 누릅니다. 그런 다음 나머지 열을 채우기 핸들 아이콘 으로 채웁니다.
- 이제 (X i -X̅)*(Y22>i -Y̅) 공식을 사용하여:
=F5*G5
- 채우기 핸들 아이콘 을 클릭하고 드래그하여 위와 같이 나머지 열을 채웁니다.
- 이제 알아보세요 (X i -X̅)2 다음 공식을 적어보세요.
=F5*F5
- 채우기 핸들 아이콘을 클릭하고 드래그합니다. 나머지 열을 채웁니다.
- 의 값을 찾으려면(Y i -Y̅)2 다음 수식을 적습니다.
=G5*G5
- 위 그림과 같이 채우기 핸들 아이콘 바를 클릭하고 드래그합니다. 나머지 열의 값을 채웁니다.
- (X i -X̅)*(Y i -Y̅) 다음 식을 적는다. 그런 다음 Enter 를 누릅니다.
=SUM(H5:H10)
- 이 시트에서 (X i -X̅)2 와 (Y i -Y̅)2 의 합을 찾으려면 채우기 핸들 아이콘 을 오른쪽으로 드래그하여같은 식이다.
- 마지막으로 피어슨 계수를 구하려면 다음 식을 적는다. 특정 시트의 셀 참조를 사용했습니다.
=H12/SQRT(I12*J12)
- 이제 키보드에서 Enter 를 누르십시오. 이 시점에서 수동으로 두 변수(연령 및 BMI)의 피어슨 계수를 갖게 됩니다.
자세히 보기: Excel에서 Intraclass Correlation Coefficient 계산하는 방법
2. PEARSON 함수를 이용한 Pearson Correlation Coefficient 계산
Excel에서 Pearson 상관계수를 구하는 기본적인 방법은 비교적 긴 과정이다. . 반대로 피어슨 상관계수를 알아내기 위해 함수를 사용하는 것은 긴 계산을 엑셀에 맡기고 두 변수의 상관계수 값만 알아내는 빠르고 쉬운 과정입니다.
엑셀은 전용 PEARSON 함수 값에서 두 변수의 상관 계수를 찾습니다. 이 함수는 두 개의 배열을 인수로 사용하고 Pearson 상관 계수를 반환합니다.
자세한 안내를 보려면 다음 단계를 따르세요.
단계:
- 먼저 반환 값을 입력할 셀을 선택합니다. 데모를 위해 셀 D12 를 선택했습니다.
- 다음 수식을셀.
=PEARSON(C5:C10,D5:D10)
- 그런 다음 Enter <2를 누릅니다>키보드에서. Pearson 상관 계수를 직접 확인할 수 있습니다.
자세히 알아보기: Excel에서 Spearman 순위 상관 계수를 찾는 방법(2가지 방법)
3. 엑셀에서 CORREL 함수 활용하기
두 변수 사이의 상관계수 값을 알아내는 전용 함수가 따로 있다. CORREL 함수 입니다. 이전 함수와 마찬가지로 이 함수도 두 개의 배열을 인수로 사용하여 둘의 상관 계수 값을 반환하며 이는 Pearson 상관 계수와 동일합니다.
자세한 안내를 보려면 다음 단계를 따르세요.
단계:
- 먼저 값을 저장할 셀을 선택합니다. 이를 위해 D12 셀을 선택했습니다.
- 다음 수식을 셀에 적습니다.
=CORREL(C5:C10,D5:D10)
- 이제 키보드에서 Enter 를 누릅니다. . 따라서 상관 계수의 값을 갖게 됩니다.
더 읽기: Spearman 상관 관계에 대한 P 값 계산 방법 in Excel
4. 추가 기능을 사용하여 Excel에서 Pearson 상관 계수 계산
앞서 설명한 방법 외에도 Excel에는 상관 계수를 찾을 수 있는 추가 기능이 있습니다. 두 변수 사이. 당신은 필요 데이터 분석 도구를 먼저 추가하여 이 방법에서 계수를 찾으십시오. 이 방법은 동시에 두 개 이상의 변수 사이의 상관 계수를 원하는 경우에 특히 유용합니다.
다음 단계에 따라 도구를 추가하고 상관 계수를 찾으십시오.
단계 :
- 먼저 리본의 파일 탭으로 이동하여 옵션 을 선택합니다.
- Excel 옵션 상자가 나타납니다. 추가 기능 탭을 선택합니다.
- 관리 외에 Excel 추가 기능 옵션이 선택되어 있는지 확인합니다.
- 그 후 이동 을 클릭합니다.
- 다음으로 추가 기능 상자에서 나타나는 Analysis Toolpak 을 확인하십시오. 그런 다음 확인 을 클릭합니다. 이제 데이터 분석 도구를 사용할 수 있습니다.
- 이제 데이터 탭으로 이동합니다. 리본에서.
- 그런 다음 분석 그룹에서 데이터 분석 을 선택합니다.
- 다음으로 데이터 분석 상자에서 분석 도구 의 상관 관계 를 선택합니다. 그런 다음 확인 을 클릭합니다.
- 상관 관계 상자에서 입력 범위 을 선택합니다. $C$4:$D$10 .
- 그룹화 기준 필드에서 변수가 열로 그룹화되므로 열 을 선택합니다.
- 그 다음 첫 행의 레이블 을 확인합니다.
- 그런 다음 출력 옵션에서 출력 범위 를 선택합니다. 나 $B$12 여기를 선택했습니다.
- 마지막으로 확인 을 클릭합니다. 변수 사이의 모든 상관 관계 값을 갖게 됩니다.
이 예에서는 변수가 두 개뿐입니다. 따라서 상관 계수는 모든 변수 조합이 포함된 2X2 행렬 로 표시됩니다.
자세히 알아보기: Excel에서 상관 행렬을 만드는 방법( 2 Handy Approaches)
결론
엑셀에서 Pearson 상관 계수를 계산하는 방법에 대한 가이드를 마칩니다. 이 가이드가 유용하고 유익한 정보였기를 바랍니다. 질문이나 제안 사항이 있으면 아래에 알려주십시오. 이와 같은 가이드를 더 보려면 Exceldemy.com 을 방문하세요.