Съдържание
Регресионен анализ е широко използвано статистическо изчисление. Често правим този тип изчисления според желанието си. В Excel можем да извършим множество видове регресионен анализ . В тази статия ще ви покажем как да направите логистична регресия в Excel. Ако и вие искате да научите този анализ, изтеглете работната тетрадка за упражнения и ни последвайте.
Изтегляне на работна тетрадка за практика
Изтеглете тази учебна тетрадка за упражнения, докато четете тази статия.
Logistic Regression.xlsx
Какво представлява логистичната регресия?
Логистичният регресионен анализ е алгоритъм за статистическо обучение, който се използва за прогнозиране на стойността на зависима променлива въз основа на някои независими критерии. Той помага на човек да получи резултат от голям набор от данни въз основа на желаната от него категория. Логистичният регресионен анализ е основно три вида:
- Бинарна логистична регресия
- Многокомпонентна логистична регресия
- Ординална логистична регресия
Бинарна логистична регресия: В модела на двоичния регресионен анализ определяме категорията само чрез два случая: Да/Не или Положителен/Негативен.
Многокомпонентна логистична регресия: Мултиноминалният логистичен анализ работи с три или повече класификации. Ако имаме повече от два класифицирани раздела за категоризиране на нашите данни, тогава можем да използваме този модел на регресионен анализ.
Ординална логистична регресия: Този модел на регресионен анализ работи за повече от две категории. При този модел обаче се нуждаем от предварително определен ред за категоризиране.
Процедура стъпка по стъпка за извършване на логистична регресия в Excel
В тази статия ще извършим двоичен логистичен регресионен анализ. Този вид анализ ни предоставя прогнозна стойност на желаната променлива. За да извършим анализа, разглеждаме набор от данни от 10 машини от даден отрасъл. Наличността на машината може да бъде положителна или отрицателна. Двоичните цифри 1=положителен , и 0=отрицателен , а тези стойности са показани в колона B Възрастта на тези машини е в колона C а средните часове на работа на седмица са в колона D . Така че нашият набор от данни е в диапазона от клетки B5:D14 Стойностите на променливата на началния регресионен решател са в диапазона от клетки C16:D18 Цялата процедура за анализ е обяснена по-долу стъпка по стъпка:
Стъпка 1: Въведете набора си от данни
В тази стъпка ще импортираме набора от данни:
- Първо, въведете точно набора от данни в Excel. За нашия анализ въведохме набора от данни в обхвата от клетки B5:D14 .
- След това въведете своя Решение за решаване Varibles' Въвеждаме ги в диапазона от клетки D16:D18.
- Приемаме, че стойностите на всички променливи са 0.01 .
Прочетете още: Множествена линейна регресия върху набори от данни в Excel (2 метода)
Стъпка 2: Оценка на стойността на Logit
В тази стъпка ще изчислим Логит за нашата съвкупност от данни. Определяме Логит стойност като X в нашето изчисление. Формулата на Логит стойност е:
Тук, b0, b1, и b2 са регресионни променливи.
- Запишете следната формула в клетка E5 . Използвайте знака за абсолютна стойност, за да замразите стойността на променливите в клетката. Ако не знаете как да въведете Абсолютна референция на клетката можете да го въведете по няколко начина.
=$D$16+$D$17*C5+$D$18*D5
- След това натиснете бутона Въведете на клавиатурата.
- След това, кликнете два пъти върху на Дръжка за пълнене за копиране на формулата до клетка E14 .
- Ще получите всички стойности на X .
Прочетете още: Как да направим проста линейна регресия в Excel (4 прости метода)
Стъпка 3: Определяне на експоненциалния коефициент на логаритмичния коефициент за всеки тип данни
Тук ще изчислим експоненциалната стойност на стойността на логита, За тази цел ще използваме функцията EXP :
- За да определите експоненциалната стойност на X , запишете следната формула в клетката F5 :
=EXP(E5)
- По същия начин, кликнете два пъти върху на Дръжка за пълнене икона, за да копирате формулата, както в предишната стъпка. Ще всички експоненциални стойности на X .
Стъпка 4: Изчисляване на стойността на вероятността
P(X) е стойността на вероятността за настъпване на X събитие. Вероятността на събитието X може да се определи като:
- За да го изчислите, запишете следната формула в клетка G5 .
=F5/(1+F5)
- Натиснете бутона Въведете ключ.
- Сега плъзнете Дръжка за пълнене икона до G15 за да получите стойността за всички стойности.
Прочетете още: Как да изчислим стойността P при линейна регресия в Excel (3 начина)
Стъпка 5: Оценяване на сумата на стойността на лог-ликейността
В следващите стъпки ще оценим стойността на Логистична вероятност. След това ще използваме функцията SUM за да добавите всички данни:
- За да изчислите Логистична вероятност стойност, ще използваме LN функция в нашия набор от данни. В клетката H5 , напишете следната формула:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Сега натиснете бутона Въведете на клавиатурата.
- След това, кликнете два пъти върху на Дръжка за пълнене за определяне на всички стойности на логаритмичната вероятност.
- След това в клетка H15 , запишете следната формула за събиране на всички стойности.
=SUM(H5:H14)
🔍 Разбивка на формулата
Извършваме тази разбивка за клетка H5 .
👉
LN(G5): Тази функция връща -0.384.
👉
LN(1-G5): Тази функция връща -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Тази функция връща -0.384.
Стъпка 6: Използване на инструмента за анализ Solver за окончателен анализ
Сега ще проведем окончателния регресионен анализ. Ще извършим анализа чрез Решаващ орган Ако не я виждате в Данни трябва да разрешите Решаващ орган от Добавки за Excel .
- За да го активирате, изберете Файл> Опции .
- В резултат на това се появява диалогов прозорец, наречен Опции за Excel ще се появи.
- В този диалогов прозорец изберете Добавки опция.
- Сега изберете Добавки за Excel опция в Управление на и щракнете върху Отидете на .
- Малък диалогов прозорец със заглавие Добавки ще се появи.
- След това проверете Добавка Solver и щракнете върху ОК .
- След това отидете в Данни и ще намерите Решаващ орган команда в Анализ група.
- Сега щракнете върху Решаващ орган команда.
- Появява се нов диалогов прозорец, озаглавен Параметри на решаващото устройство ще се появи.
- В Поставяне на цел изберете клетката $H$15 Можете също така да напишете препратката към клетката на клавиатурата си. Абсолютна референция на клетката подпишете тук.
- След това в Чрез промяна на променливите клетки изберете обхвата на клетките $D$16:$D$18 .
- След това махнете отметката от Превръщане на променливите без ограничения в неотрицателни за получаване на отрицателните стойности, ако вече е отбелязана като маркирана.
- Накрая щракнете върху Решаване на проблема бутон.
- В резултат на това Резултат от решаването пред вас ще се появи кутия.
- Сега изберете Дръжте решението Solver Това поле ще ви покаже също дали регресионният анализ е конвергентен или дивергентен.
- Кликнете върху OK за да затворите полето.
- Най-накрая ще видите стойностите на променливата в диапазона от клетки D16:D18 Освен това ще видите и стойностите на колоните E, F, G , и H също показват разлики в сравнение с предишните стъпки.
🔍 Илюстрация на резултата от двоичния регресионен анализ
След приключване на бинарния логистичен регресионен анализ в Excel ще видите, че приетата от нас стойност на променливата за регресия е заменена с новата стойност на анализа и тези стойности са правилната стойност на променливата за регресия на нашата съвкупност от данни. Можем да разгледаме резултата от всякакви конкретни данни, като например машината, която има възраст 68 месеци и 4 средна стойност без смяна на седмица. Стойността на P(X) е 0.67 . Това ни показва, че ако търсим машината в работно състояние, възможността за това събитие е около 67% .
Можем да го покажем и отделно, като използваме крайните стойности на регресионната променлива.
Така можем да кажем, че нашата работна процедура работи успешно и можем да направим двоичен логистичен регресионен анализ.
Заключение
Това е краят на тази статия. Надявам се, че тази статия ще ви бъде полезна и ще можете да правите логистична регресия в Excel. Моля, споделете с нас допълнителни запитвания или препоръки в раздела за коментари по-долу.
Не забравяйте да проверите нашия уебсайт ExcelWIKI за няколко проблема и решения, свързани с Excel. Продължавайте да изучавате нови методи и да се развивате!