Змест
Рэгрэсійны аналіз - гэта шырока выкарыстоўваны статыстычны разлік. Мы часта робім гэты тып разліку па сваім жаданні. У Excel мы можам выконваць некалькі тыпаў рэгрэсійнага аналізу . У гэтым артыкуле мы прадэманструем, як зрабіць лагістычную рэгрэсію ў Excel. Калі вы таксама зацікаўлены ў вывучэнні гэтага аналізу, спампуйце практычны сшытак і сачыце за намі.
Спампуйце практычны сшытак
Спампуйце гэты практычны сшытак для практыкі, пакуль вы чытаеце гэты артыкул.
Лагістычная рэгрэсія.xlsx
Што такое лагістычная рэгрэсія?
Лагістычны рэгрэсійны аналіз - гэта алгарытм статыстычнага навучання, які выкарыстоўвае для прагназавання значэння залежнай зменнай на аснове некаторых незалежных крытэраў. Гэта дапамагае чалавеку атрымаць вынік з вялікага набору даных на аснове жаданай катэгорыі. Аналіз лагістычнай рэгрэсіі ў асноўным трох тыпаў:
- Бінарная лагістычная рэгрэсія
- Мультынаміальная лагістычная рэгрэсія
- Парадкавая лагістычная рэгрэсія
Двайковая Лагістычная рэгрэсія: У мадэлі аналізу бінарнай рэгрэсіі мы вызначаем катэгорыю толькі двума выпадкамі. Так/Не або станоўчы/адмоўны.
Мультынамінальная лагістычная рэгрэсія: Мультынамінальны лагістычны аналіз працуе з трыма ці больш класіфікацыямі. Калі ў нас ёсць больш за два класіфікаваных раздзела для класіфікацыі нашых даных, мы можам выкарыстоўваць гэту мадэль рэгрэсійнага аналізу.
Парадкавы лагістычныРэгрэсія: Гэтая мадэль рэгрэсійнага аналізу працуе больш чым для дзвюх катэгорый. Аднак у гэтай мадэлі нам патрэбны загадзя вызначаны парадак для іх класіфікацыі.
Пакрокавая працэдура выканання лагістычнай рэгрэсіі ў Excel
У гэтым артыкуле мы выканаем двайковую лагістычную рэгрэсію аналіз. Гэты тып аналізу дае нам прагназуемае значэнне патрэбнай зменнай. Для правядзення аналізу мы разглядаем набор даных з 10 машын з галіны. Даступнасць машыны можа быць станоўчай або адмоўнай. Двайковыя лічбы 1=дадатны і 0=адмоўны , і гэтыя значэнні паказаны ў слупку B . Узрост гэтых машын указаны ў слупку C , а сярэдняя колькасць гадзін іх працы ў тыдзень - у слупку D . Такім чынам, наш набор даных знаходзіцца ў дыяпазоне ячэек B5:D14 . Значэнні зменнай вырашальніка пачатковай рэгрэсіі знаходзяцца ў дыяпазоне ячэек C16:D18 . Уся працэдура аналізу паэтапна тлумачыцца ніжэй:
Крок 1: Увядзіце свой набор даных
На гэтым этапе мы збіраемся імпартаваць ваш набор даных:
- Перш за ўсё, дакладна ўвядзіце свой набор даных у Excel. Для нашага аналізу мы ўводзім набор даных у дыяпазоне ячэек B5:D14 .
- Затым увядзіце ваш Зменныя рашэння вырашальніка' Мы ўводзім іх у дыяпазон вочак D16:D18.
- Мы прымаем значэнні ўсіх зменных як 0,01 .
ПрачытайцеБольш падрабязна: Множная лінейная рэгрэсія на наборах даных Excel (2 метады)
Крок 2: Ацаніце лагічнае значэнне
На гэтым этапе мы збіраемся вылічыць Значэнне Logit для нашага набору даных. Мы вызначаем значэнне Logit як X у нашым разліку. Формула значэння Logit :
Тут b0, b1, і b2 з'яўляюцца рэгрэсіяй зменныя.
- Запішыце наступную формулу ў ячэйку E5 . Каб замарозіць значэнне зменных у ячэйцы, выкарыстоўвайце знак Абсалют. Калі вы не ведаеце, як увесці знак Абсалютная спасылка на ячэйку , вы можаце ўвесці яго некалькімі спосабамі.
=$D$16+$D$17*C5+$D$18*D5
- Затым націсніце клавішу Enter на клавіятуры.
- Пасля гэтага Двойчы пстрыкніце на значку Маркер запаўнення , каб скапіяваць формулу да ячэйкі E14 .
- Вы атрымаеце ўсе значэнні X .
Чытаць далей: Як выканаць простую лінейную рэгрэсію ў Excel (4 простыя метады)
Крок 3: Вызначэнне экспанентнага лагіта для кожнага данага
Тут мы разлічым экспанентнае значэнне лагіта значэнне, для гэтага мы будзем выкарыстоўваць функцыю EXP :
- Каб вызначыць экспанентнае значэнне X , запішыце наступную формулу ў ячэйку F5 :
=EXP(E5)
- Аналагічным чынам, Двойчы пстрыкніце на значку Маркер запаўнення , каб скапіяваць формулу, якпапярэдні крок. Вы атрымаеце ўсе экспанентныя значэнні X .
Крок 4: Разлічыце значэнне імавернасці
P( X) - значэнне верагоднасці наступлення падзеі X . Верагоднасць падзеі X можна вызначыць як:
- Каб вылічыць яе, запішыце наступную формулу ў ячэйку G5 .
=F5/(1+F5)
- Націсніце Enter клавіша.
- Цяпер перацягніце значок Маркер запаўнення да G15 , каб атрымаць значэнне для ўсіх значэнняў.
Дадатковая інфармацыя: Як разлічыць значэнне P у лінейнай рэгрэсіі ў Excel (3 спосабы)
Крок 5: Ацаніце суму лагары Значэнне імавернасці
На наступных этапах мы збіраемся ацаніць значэнне Лог-імавернасці. Пасля гэтага мы будзем выкарыстоўваць функцыю SUM , каб дадаць усе даныя:
- Каб вылічыць значэнне Лога-верагоднасці , мы збіраемся: выкарыстоўваць функцыю LN у нашым наборы даных. У ячэйку H5 запішыце выкананую наступную формулу:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Цяпер націсніце клавішу Enter на клавіятуры.
- Затым двойчы пстрыкніце на Значок маркера запаўнення для вызначэння ўсіх значэнняў лагарыка верагоднасці.
- Пасля гэтага ў ячэйцы H15 запішыце наступная формула для сумавання ўсіх значэнняў.
=SUM(H5:H14)
🔍 Разбор формулы
Мы робімгэтая разбіўка для ячэйкі H5 .
👉
LN(G5): Гэтая функцыя вяртае -0,384.
👉
LN(1-G5): Гэтая функцыя вяртае -1,144.
👉
(B5*LN(G5))+((1-B5)* LN(1-G5)): Гэтая функцыя вяртае -0,384.
Крок 6: Выкарыстоўвайце інструмент аналізу рашэння для канчатковага аналізу
Цяпер мы правядзем канчатковы рэгрэсійны аналіз. Мы выканаем аналіз з дапамогай каманды Рашальнік . Калі вы не бачыце яго ва ўкладцы Дадзеныя , вам трэба ўключыць Рашальнік з Дадаткаў Excel .
- Каб уключыць яго, абярыце Файл > Параметры .
- У выніку з'явіцца дыялогавае акно з назвай Параметры Excel .
- У гэтым дыялогавым акне абярыце опцыю Надбудовы .
- Цяпер абярыце опцыю Надбудовы Excel у раздзеле Кіраванне і націсніце Перайсці .
- З'явіцца маленькае дыялогавае акно з назвай Надбудовы .
- Затым адзначце опцыю Рашальнік надбудовы і націсніце ОК .
- Пасля гэтага перайдзіце на ўкладку Даныя і вы знойдзеце каманду Рашальнік у групе Аналіз .
- Цяпер націсніце каманду Рашальнік .
- З'явіцца новае дыялогавае акно пад назвай Параметры рашальніка .
- У полі Задаць мэту выберыце мышкай ячэйку $H$15 . Вы таксама можаце напісаць спасылку на ячэйку на клавіятуры. Пераканайцеся, што вы выкарыстоўваецеЗнак Абсалютная спасылка на ячэйку тут.
- Далей у опцыі Змяняючы зменныя ячэйкі выберыце дыяпазон ячэек $D$16:$D$18 .
- Затым зніміце сцяжок з поля Зрабіць неабмежаваныя зменныя неадмоўнымі , каб атрымаць адмоўныя значэнні, калі яны ўжо паказваюцца як адзначаныя.
- Нарэшце, націсніце Рашыць кнопка.
- У выніку перад вамі з'явіцца поле Вынік рашальніка .
- Цяпер выберыце Захоўваць рашэнне рашэння Гэта поле таксама пакажа вам, сыходзіўся або разыходзіўся ваш рэгрэсійны аналіз.
- Націсніце ОК , каб закрыць поле.
- Нарэшце, вы ўбачыце, што значэнні зменнай у дыяпазоне ячэек D16:D18 зменены. Акрамя гэтага, вы таксама ўбачыце значэнні слупкоў E, F, G і H , якія таксама адрозніваюцца ад папярэдніх крокаў.
🔍 Ілюстрацыя выніку бінарнага рэгрэсійнага аналізу
Пасля завяршэння двайковага лагістычнага рэгрэсійнага аналізу ў Excel вы будзеце бачыць, што меркаванае значэнне зменнай рэгрэсіі заменена новым значэннем аналізу, і гэтыя значэнні з'яўляюцца правільным значэннем зменнай рэгрэсіі нашага набору даных. Мы можам разглядаць вынік любых канкрэтных даных, напрыклад узрост машыны 68 месяцаў і 4 сярэд. без змены ў тыдзень. Значэнне P(X) роўна 0,67 . Гэта ілюструе нам, што калі мы паглядзімдля машыны ў працоўным стане верагоднасць гэтай падзеі складае каля 67% .
Мы таксама можам паказаць гэта асобна, выкарыстоўваючы канчатковыя значэнні зменнай рэгрэсіі.
Такім чынам, мы можам сказаць, што наша працоўная працэдура спрацавала паспяхова, і мы можам правесці бінарны лагістычны рэгрэсіўны аналіз.
Выснова
На гэтым артыкул скончаны . Я спадзяюся, што гэты артыкул будзе для вас карысным, і вы зможаце зрабіць лагістычную рэгрэсію ў Excel. Калі ласка, падзяліцеся з намі любымі далейшымі запытамі або рэкамендацыямі ў раздзеле каментарыяў ніжэй.
Не забудзьцеся праверыць наш вэб-сайт ExcelWIKI для некалькіх праблем і рашэнняў, звязаных з Excel. Працягвайце вывучаць новыя метады і расці!