목차
회귀 분석 은 널리 사용되는 통계 계산입니다. 우리는 종종 우리의 욕망에 따라 이러한 유형의 계산을 수행합니다. Excel에서는 여러 유형의 회귀 분석 을 수행할 수 있습니다. 이 기사에서는 Excel에서 로지스틱 회귀를 수행하는 방법을 보여줍니다. 이 분석에 관심이 있다면 실습 워크북을 다운로드하고 팔로우하세요.
실습 워크북 다운로드
이 기사를 읽는 동안 실습을 위해 이 실습 워크북을 다운로드하세요.
로지스틱 회귀.xlsx
로지스틱 회귀란 무엇입니까?
로지스틱 회귀 분석은 몇 가지 독립적인 기준을 기반으로 종속 변수의 값을 예측하는 데 사용하는 통계 학습 알고리즘입니다. 그것은 사람이 원하는 범주에 따라 큰 데이터 세트에서 결과를 얻는 데 도움이 됩니다. 로지스틱 회귀분석은 주로 세 가지 유형입니다. 로지스틱 회귀: 이진 회귀 분석 모델에서는 두 가지 경우로만 범주를 정의합니다. 예/아니오 또는 양성/음성.
다항 로지스틱 회귀: 다항 로지스틱 분석은 3개 이상의 분류에서 작동합니다. 데이터를 분류하기 위해 세 개 이상의 분류 섹션이 있는 경우 이 회귀 분석 모델을 사용할 수 있습니다.
서수 물류회귀: 이 회귀 분석 모델은 2개 이상의 범주에서 작동합니다. 그러나이 모델에서는 분류하기 위해 미리 결정된 순서가 필요합니다.
Excel에서 로지스틱 회귀를 수행하는 단계별 절차
이 기사에서는 이진 로지스틱 회귀를 수행합니다. 분석. 이러한 유형의 분석은 원하는 변수의 예측 값을 제공합니다. 분석을 수행하기 위해 업계에서 기계 10대의 데이터 세트를 고려합니다. 기계의 가용성은 긍정적이거나 부정적일 수 있습니다. 이진수 1=양수 및 0=음수 와 이러한 값은 열 B 에 표시됩니다. 해당 기계의 수명은 열 C 에 있고 주당 평균 작업 시간은 열 D 에 있습니다. 따라서 데이터 세트는 B5:D14 셀 범위에 있습니다. 값 초기 회귀 솔버 변수는 C16:D18 셀 범위에 있습니다. 전체 분석 절차는 아래에 단계별로 설명되어 있습니다.
1단계: 데이터 세트 입력
이 단계에서는 데이터 세트를 가져옵니다.
- 먼저 데이터셋을 엑셀에 정확하게 입력합니다. 분석을 위해 B5:D14 셀 범위에 데이터 세트를 입력합니다.
- 그런 다음 <1을 입력합니다>Solver Decision Variables' D16:D18 셀 범위에 입력합니다.
- 모든 변수의 값을 0.01 로 가정합니다.
읽기자세히: Excel 데이터 세트에 대한 다중 선형 회귀(2가지 방법)
2단계: 로짓 값 평가
이 단계에서는 다음을 계산할 것입니다. 데이터 세트의 Logit 값입니다. 계산에서 Logit 값을 X 로 정의합니다. Logit 값의 공식은 다음과 같습니다.
여기서 b0, b1, 및 b2 는 회귀입니다. 변수.
- 셀 E5 에 다음 수식을 적습니다. 절대 기호를 사용하여 변수의 셀 값을 고정합니다. 절대 셀 참조 기호를 입력하는 방법을 모르면 여러 가지 방법으로 입력할 수 있습니다.
=$D$16+$D$17*C5+$D$18*D5
- 그런 다음 키보드의 Enter 키를 누릅니다.
- 그 다음, 채우기 핸들 아이콘을 두 번 클릭 하여 E14 셀까지 수식을 복사합니다.
- X 의 모든 값을 얻게 됩니다.
자세히 보기: Excel에서 간단한 선형 회귀를 수행하는 방법(4가지 간단한 방법)
3단계: 각 데이터에 대한 로짓의 지수 결정
여기서 로짓의 지수 값을 계산합니다. 값, 이를 위해 EXP 함수 를 사용할 것입니다:
- X 의 지수 값을 결정하려면 셀에 다음 수식을 적으십시오. F5 :
=EXP(E5)
- 마찬가지로, 채우기 핸들 아이콘을 두 번 클릭 하여 다음과 같은 수식을 복사합니다.이전 단계. X .
4단계: 확률 값 계산
P( X) 는 X 이벤트가 발생할 확률 값입니다. 이벤트 X 의 확률은 다음과 같이 정의할 수 있습니다.
- 이를 계산하려면 G5<2 셀에 다음 수식을 적으십시오>.
=F5/(1+F5)
- Enter <2를 누릅니다>key.
- 이제 채우기 핸들 아이콘을 G15 까지 드래그하여 모든 값에 대한 값을 가져옵니다.
자세히 보기: Excel에서 선형 회귀의 P 값을 계산하는 방법(3가지 방법)
5단계: 로그 합계 평가- 우도 값
다음 단계에서는 로그 우도 값을 평가합니다. 그 다음에는 SUM 함수 를 사용하여 모든 데이터를 추가합니다.
- 로그 우도 값을 계산하려면 데이터 세트에서 LN 기능 을 사용합니다. 셀 H5 에 다음 수식을 작성합니다.
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- 이제 다음을 누릅니다. 키보드의 Enter 키를 누릅니다.
- 그런 다음 핸들 아이콘을 채워 모든 로그 가능도 값을 결정합니다.
- 그 후 셀 H15 에 기록합니다. 다음 공식은 모든 값을 합산합니다.
=SUM(H5:H14)
🔍 공식의 분해
우리는 H5 .
👉
LN(G5): 셀에 대한 이 분류는 -0.384.
👉
<을 반환합니다. 1>LN(1-G5): 이 함수는 -1.144.
👉
(B5*LN(G5))+((1-B5)*를 반환합니다. LN(1-G5)): 이 함수는 -0.384를 반환합니다.
6단계: 최종 분석을 위해 솔버 분석 도구 사용
이제 다음을 수행합니다. 최종 회귀 분석. Solver 명령을 통해 분석을 수행합니다. Data 탭에 표시되지 않으면 Excel 추가 기능 에서 Solver 를 활성화해야 합니다.
- 활성화하려면 파일 > 옵션 .
- 결과적으로 Excel 옵션 이라는 대화 상자가 나타납니다.
- 이 대화 상자에서 추가 기능 옵션을 선택합니다.
- 이제 관리 섹션에서 Excel 추가 기능 옵션을 선택합니다. 이동 을 클릭합니다.
- 추가 기능 이라는 제목의 작은 대화 상자가 나타납니다.
- 그런 다음 Solver Add-in 옵션을 선택하고 확인 을 클릭합니다.
- 그런 다음 Data 탭으로 이동하면 Analysis 그룹
<34에서 Solver 명령을 찾을 수 있습니다>
- 이제 Solver 명령을 클릭합니다.
- Solver Parameters 라는 새 대화 상자가 나타납니다.
- 목표 설정 상자에서 마우스로 $H$15 셀을 선택합니다. 키보드에서 셀 참조를 작성할 수도 있습니다. 당신이 사용하는지 확인 절대 셀 참조 여기에 서명하십시오.
- 다음으로 변수 셀 변경으로 옵션에서 셀 범위를 선택하십시오 $D$16:$D$18 .
- 그런 다음 Make Unconstrained Variables Non-Negative 를 선택 해제하여 이미 선택된 것으로 표시되어 있는 경우 음수 값을 가져옵니다.
- 마지막으로 을 클릭합니다. Solve 버튼.
- 결과적으로 Solver Result 상자가 앞에 나타납니다.
- 이제 Keep Solver Solution 을 선택합니다. 이 상자에는 회귀 분석이 수렴되었는지 발산되었는지도 표시됩니다.
- 확인 을 클릭하여 상자를 닫습니다.
- 마지막으로 D16:D18 셀 범위의 변수 값이 변경되는 것을 볼 수 있습니다. 그 외에도 E, F, G 및 H 열의 값도 이전 단계와 차이를 보이는 것을 볼 수 있습니다.
🔍 Binary Regression Analysis 결과 그림
Excel에서 Binary Logistic Regression 분석이 완료되면 가정한 회귀 변수 값이 새 분석 값으로 대체되고 이 값이 데이터 세트의 올바른 회귀 변수 값인지 확인합니다. 수명이 68 개월이고 평균이 4 인 기계와 같은 특정 데이터의 결과를 고려할 수 있습니다. 주당 교대 없음. P(X) 의 값은 0.67 이다. 우리가 보면작동 상태에 있는 기계의 경우 해당 이벤트의 가능성은 약 67% 입니다.
회귀 변수의 최종 값을 사용하여 별도로 표시할 수도 있습니다.
따라서 작업 절차가 성공적으로 수행되었으며 이진 로지스틱 회귀 분석을 수행할 수 있다고 말할 수 있습니다.
결론
이 기사의 끝 . 이 기사가 도움이 되기를 바라며 Excel에서 로지스틱 회귀를 수행할 수 있기를 바랍니다. 아래 의견 섹션에서 추가 질문이나 권장 사항을 공유해 주세요.
몇 가지 Excel 관련 문제 및 솔루션에 대해 ExcelWIKI 웹 사이트를 확인하는 것을 잊지 마십시오. 새로운 방법을 계속 배우고 계속 성장하세요!