목차
이 기사에서는 Excel 에서 다중 회귀 분석을 수행하는 방법에 대한 몇 가지 기본 방법을 보여줍니다. 이것은 통계 분야에서 매우 중요한 주제입니다. 하나 또는 여러 개의 종속 변수와 관련된 종속 변수를 예측하는 데 도움이 됩니다.
데이터세트에는 일부 자동차에 대한 정보가 있습니다. 이름 , 가격 , 최대 속도 ( 시간당 마일 ), 최대 출력 엔진이 생산할 수 있는 범위 및 연료를 보충하지 않고 이동할 수 있는 최대 범위 거리 그들의 탱크.
실습 워크북 다운로드
다중 회귀 분석.xlsx
다중이란 무엇인가 회귀?
다중 회귀 는 종속 변수 와 여러 독립 변수 간의 관계를 분석할 수 있는 통계 프로세스입니다. 회귀 의 목적은 해당 독립 변수 에 대한 종속 변수 의 특성을 예측하는 것입니다.
다중 회귀 분석을 수행하는 2단계 Excel에서
단계 - 1: 데이터 분석 탭 활성화
데이터 탭 에 데이터 분석 이 포함되어 있지 않습니다. 기본적으로 리본. 이를 활성화하려면 아래 절차를 따르십시오.
- 먼저 파일 >> 옵션
으로 이동합니다.
- 그런 다음 추가 기능 >> Excel 추가 기능을 선택합니다. >> 이동
- 추가에서 Analysis ToolPak 확인 -ins available: 섹션을 클릭하고 확인 을 클릭합니다.
그 후 데이터 분석 리본 이 데이터 탭 에 나타납니다.
단계 - 2: Excel에서 다중 회귀 분석 만들기
여기에서는 다중 회귀 를 분석하는 방법을 보여드리겠습니다.
- 데이터 탭에서 >> 데이터 분석
- 대화 상자 에 회귀 선택이 표시되고 확인 을 클릭합니다.
회귀 대화 상자가 나타납니다.
- 다음에 따라 자동차 가격 을 예측합니다. 최대 속도 , 피크 전력 및 범위 .
- 종속 변수<2의 범위 를 선택합니다> ( 입력 Y 범위 ). 제 경우에는 C4:C14 입니다.
- 그 후 독립 변수 의 범위 를 선택합니다( 입력 X 범위 ). 제 경우에는 D4:F14 입니다.
- Labels 를 확인하고 Output Options<2에서 New Worksheet Ply: 를 선택합니다>. 현재 시트에서 회귀 분석 을 원하는 경우 출력 범위
추가 분석 을 수행하려면 잔차 를 선택할 수 있습니다.
- 그 후에 새 시트 의 회귀 분석 을 참조하십시오. 포맷 분석 편의에 따라.
따라서 엑셀에서 다중회귀분석
유사 읽기
- 엑셀에서 간단한 선형 회귀를 수행하는 방법(4가지 간단한 방법)
- 해석 방법 Excel에서의 회귀 결과(상세 분석)
Excel에서의 다중 회귀 분석에 대한 간략한 설명
회귀 분석 은 특정 매개변수의 여러 값을 남깁니다. . 그 의미를 살펴보겠습니다.
회귀 통계
회귀 통계 부분에는 일부 매개변수의 값이 표시됩니다.
- 다중 R: 변수 간의 선형 관계가 얼마나 강한지를 결정하는 상관 계수 를 나타냅니다. 이 계수 의 값 범위는 (-1, 1)입니다. 관계의 강도는 Multiple R 의 절대값에 비례합니다.
- R Square: 얼마나 잘 연결되는지를 결정하는 또 다른 Coefficient 입니다. 회귀선 이 맞을 것입니다. 또한 회귀선에 몇 개의 점이 있는지도 보여줍니다. 이 예에서 R 2 의 값은 86 로 양호하다. 이는 데이터의 86% 가 다중 회귀선 에 적합함을 의미합니다.
- 조정된 R 제곱: 이것은 조정된 모델의 독립 변수 에 대한 R 제곱 값. 적합하다 다중 회귀 분석 등을 데이터에 적용했습니다. 여기서 조정된 R 제곱 의 값은 79 입니다.
- 표준 오차: 이는 회귀 가 얼마나 완벽한지를 결정합니다. 방정식이 됩니다. 무작위 회귀 분석 을 수행하므로 여기에서 표준 오차 의 값이 상당히 높습니다.
- 관찰: 데이터 세트는 10 입니다.
분산 분석 ( ANOVA )
ANOVA 분석 섹션에서 다른 매개변수 도 볼 수 있습니다.
- df: ' 자유도 '는 df 로 정의된다. 여기서 df 의 값은 3 3 종류의 독립 변수 가 있기 때문입니다.
- SS : SS 는 제곱합을 의미합니다. 정사각형 의 잔차 합계 가 정사각형 의 총합 보다 훨씬 작은 경우 데이터는 에 맞을 것입니다. 회귀선 보다 편리합니다. 여기서 Residual SS 는 Total SS 보다 훨씬 작으므로 데이터가 회귀선 에 더 나은 방식으로 들어갈 수 있다고 추측할 수 있습니다.
- MS: MS2>는 평균 제곱입니다. Regression 및 Residual MS의 값은 각각 78 및 5372210.11 입니다.
- F 및 유의성 F: 이 값은 회귀 분석 의 신뢰도를 결정합니다. Significance F 가 05 보다 작은 경우, 다중 회귀 분석을 사용하기에 적합합니다. 그렇지 않으면 독립 변수 를 변경해야 할 수도 있습니다. 데이터셋에서 Significance F 의 값은 0.01 로 분석에 적합합니다.
회귀 분석 결과
여기서는 회귀 분석 의 결과에 대해 설명하겠습니다.
- 계수 및 기타
이 섹션에서 , 우리는 독립 변수-최대에 대한 계수 의 값을 얻습니다. 속도 , 최대 전력 및 범위 . 각 계수 에 대한 다음 정보도 찾을 수 있습니다: 표준 오차 , t 통계 , P-값 및 기타 매개변수.
2. 잔여 산출물
잔존 가치 는 예상 가격 이 실제 가치와 표준 허용되는 잔차 의 값.
회귀 분석 에 의한 예측이 작동하는 방식은 다음과 같습니다.
독립 변수 에 따라 첫 번째 자동차의 가격 을 예측하려고 합니다. 독립 변수 는 Max. 속도 , 최대 출력 및 범위 값이 시속 110마일 , 600마력 및 130마일 각각. 해당 회귀 계수 는 245.43 , 38.19 및 94.38 입니다. y 절편 값 는 -50885.73 이다. 따라서 예상 가격은 245.43*110+38.19*600+94.38*130-50885.73≈11295 가 됩니다.
이 기사의 데이터 세트에 따르면 자동차의 가격 최대 속도 xmph , 최대 출력 y hp 및 범위 z마일 의 예상 가격은 245.43*x+38.19*y+94.38*z 입니다.
자세히 보기: Excel에서 다중 회귀 결과를 해석하는 방법
Excel에서 그래프를 사용하여 다중 선형 회귀 이해
회귀선 을 시각화하려는 경우 아래 절차를 살펴보겠습니다.
단계:
- 먼저 데이터 탭 >> 데이터 분석 으로 이동
- 데이터 분석 대화 상자가 나타나면 회귀 를 선택합니다.
- 마지막으로 <1을 클릭합니다>확인 .
회귀 의 대화 상자 가 나타납니다.
- 잔차 와 라인 맞춤 플롯 을 선택합니다.
- 확인 을 클릭합니다.
그러면 최대값에 따라 회귀선이 맞는 그래프를 볼 수 있습니다. 분석과 함께 새 시트 의 Speed , Peak Power 및 Range .
여기 아래에서 Max에 따른 선 맞춤 을 나타냅니다. Speed .
그리고 다음 이미지는 Peak Power .
<0에 따른 Line Fit 을 보여줍니다>아래그림은 범위 에 따른 라인 맞춤 을 나타냅니다.
통합 문서를 다운로드하고 플롯 을 참조하십시오. 더 나은 이해를 위해.
자세히 보기: Excel에서 선형 회귀를 수행하는 방법(4가지 간단한 방법)
실습 섹션
여기서는 다중선형회귀 를 직접 분석하실 수 있도록 이 글의 데이터셋을 드립니다.
결론
이 문서는 Excel에서 다중 회귀 분석 을 수행하는 방법을 이해하는 데 도움이 되며 매개변수에 대한 간략한 설명입니다. 이 기사에 대한 아이디어나 피드백이 있으면 의견 상자에 공유하십시오. 이는 향후 기사를 풍부하게 만드는 데 도움이 됩니다.