Як зрабіць лагістычную рэгрэсію ў Excel (з хуткімі крокамі)

  • Падзяліцца Гэтым
Hugh West

Рэгрэсійны аналіз - гэта шырока выкарыстоўваны статыстычны разлік. Мы часта робім гэты тып разліку па сваім жаданні. У Excel мы можам выконваць некалькі тыпаў рэгрэсійнага аналізу . У гэтым артыкуле мы прадэманструем, як зрабіць лагістычную рэгрэсію ў Excel. Калі вы таксама зацікаўлены ў вывучэнні гэтага аналізу, спампуйце практычны сшытак і сачыце за намі.

Спампуйце практычны сшытак

Спампуйце гэты практычны сшытак для практыкі, пакуль вы чытаеце гэты артыкул.

Лагістычная рэгрэсія.xlsx

Што такое лагістычная рэгрэсія?

Лагістычны рэгрэсійны аналіз - гэта алгарытм статыстычнага навучання, які выкарыстоўвае для прагназавання значэння залежнай зменнай на аснове некаторых незалежных крытэраў. Гэта дапамагае чалавеку атрымаць вынік з вялікага набору даных на аснове жаданай катэгорыі. Аналіз лагістычнай рэгрэсіі ў асноўным трох тыпаў:

  1. Бінарная лагістычная рэгрэсія
  2. Мультынаміальная лагістычная рэгрэсія
  3. Парадкавая лагістычная рэгрэсія

Двайковая Лагістычная рэгрэсія: У мадэлі аналізу бінарнай рэгрэсіі мы вызначаем катэгорыю толькі двума выпадкамі. Так/Не або станоўчы/адмоўны.

Мультынамінальная лагістычная рэгрэсія: Мультынамінальны лагістычны аналіз працуе з трыма ці больш класіфікацыямі. Калі ў нас ёсць больш за два класіфікаваных раздзела для класіфікацыі нашых даных, мы можам выкарыстоўваць гэту мадэль рэгрэсійнага аналізу.

Парадкавы лагістычныРэгрэсія: Гэтая мадэль рэгрэсійнага аналізу працуе больш чым для дзвюх катэгорый. Аднак у гэтай мадэлі нам патрэбны загадзя вызначаны парадак для іх класіфікацыі.

Пакрокавая працэдура выканання лагістычнай рэгрэсіі ў Excel

У гэтым артыкуле мы выканаем двайковую лагістычную рэгрэсію аналіз. Гэты тып аналізу дае нам прагназуемае значэнне патрэбнай зменнай. Для правядзення аналізу мы разглядаем набор даных з 10 машын з галіны. Даступнасць машыны можа быць станоўчай або адмоўнай. Двайковыя лічбы 1=дадатны і 0=адмоўны , і гэтыя значэнні паказаны ў слупку B . Узрост гэтых машын указаны ў слупку C , а сярэдняя колькасць гадзін іх працы ў тыдзень - у слупку D . Такім чынам, наш набор даных знаходзіцца ў дыяпазоне ячэек B5:D14 . Значэнні зменнай вырашальніка пачатковай рэгрэсіі знаходзяцца ў дыяпазоне ячэек C16:D18 . Уся працэдура аналізу паэтапна тлумачыцца ніжэй:

Крок 1: Увядзіце свой набор даных

На гэтым этапе мы збіраемся імпартаваць ваш набор даных:

  • Перш за ўсё, дакладна ўвядзіце свой набор даных у Excel. Для нашага аналізу мы ўводзім набор даных у дыяпазоне ячэек B5:D14 .

  • Затым увядзіце ваш Зменныя рашэння вырашальніка' Мы ўводзім іх у дыяпазон вочак D16:D18.
  • Мы прымаем значэнні ўсіх зменных як 0,01 .

ПрачытайцеБольш падрабязна: Множная лінейная рэгрэсія на наборах даных Excel (2 метады)

Крок 2: Ацаніце лагічнае значэнне

На гэтым этапе мы збіраемся вылічыць Значэнне Logit для нашага набору даных. Мы вызначаем значэнне Logit як X у нашым разліку. Формула значэння Logit :

Тут b0, b1, і b2 з'яўляюцца рэгрэсіяй зменныя.

  • Запішыце наступную формулу ў ячэйку E5 . Каб замарозіць значэнне зменных у ячэйцы, выкарыстоўвайце знак Абсалют. Калі вы не ведаеце, як увесці знак Абсалютная спасылка на ячэйку , вы можаце ўвесці яго некалькімі спосабамі.

=$D$16+$D$17*C5+$D$18*D5

  • Затым націсніце клавішу Enter на клавіятуры.

  • Пасля гэтага Двойчы пстрыкніце на значку Маркер запаўнення , каб скапіяваць формулу да ячэйкі E14 .

  • Вы атрымаеце ўсе значэнні X .

Чытаць далей: Як выканаць простую лінейную рэгрэсію ў Excel (4 простыя метады)

Крок 3: Вызначэнне экспанентнага лагіта для кожнага данага

Тут мы разлічым экспанентнае значэнне лагіта значэнне, для гэтага мы будзем выкарыстоўваць функцыю EXP :

  • Каб вызначыць экспанентнае значэнне X , запішыце наступную формулу ў ячэйку F5 :

=EXP(E5)

  • Аналагічным чынам, Двойчы пстрыкніце на значку Маркер запаўнення , каб скапіяваць формулу, якпапярэдні крок. Вы атрымаеце ўсе экспанентныя значэнні X .

Крок 4: Разлічыце значэнне імавернасці

P( X) - значэнне верагоднасці наступлення падзеі X . Верагоднасць падзеі X можна вызначыць як:

  • Каб вылічыць яе, запішыце наступную формулу ў ячэйку G5 .

=F5/(1+F5)

  • Націсніце Enter клавіша.
  • Цяпер перацягніце значок Маркер запаўнення да G15 , каб атрымаць значэнне для ўсіх значэнняў.

Дадатковая інфармацыя: Як разлічыць значэнне P у лінейнай рэгрэсіі ў Excel (3 спосабы)

Крок 5: Ацаніце суму лагары Значэнне імавернасці

На наступных этапах мы збіраемся ацаніць значэнне Лог-імавернасці. Пасля гэтага мы будзем выкарыстоўваць функцыю SUM , каб дадаць усе даныя:

  • Каб вылічыць значэнне Лога-верагоднасці , мы збіраемся: выкарыстоўваць функцыю LN у нашым наборы даных. У ячэйку H5 запішыце выкананую наступную формулу:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Цяпер націсніце клавішу Enter на клавіятуры.

  • Затым двойчы пстрыкніце на Значок маркера запаўнення для вызначэння ўсіх значэнняў лагарыка верагоднасці.

  • Пасля гэтага ў ячэйцы H15 запішыце наступная формула для сумавання ўсіх значэнняў.

=SUM(H5:H14)

🔍 Разбор формулы

Мы робімгэтая разбіўка для ячэйкі H5 .

👉 LN(G5): Гэтая функцыя вяртае -0,384.

👉 LN(1-G5): Гэтая функцыя вяртае -1,144.

👉 (B5*LN(G5))+((1-B5)* LN(1-G5)): Гэтая функцыя вяртае -0,384.

Крок 6: Выкарыстоўвайце інструмент аналізу рашэння для канчатковага аналізу

Цяпер мы правядзем канчатковы рэгрэсійны аналіз. Мы выканаем аналіз з дапамогай каманды Рашальнік . Калі вы не бачыце яго ва ўкладцы Дадзеныя , вам трэба ўключыць Рашальнік з Дадаткаў Excel .

  • Каб уключыць яго, абярыце Файл > Параметры .

  • У выніку з'явіцца дыялогавае акно з назвай Параметры Excel .
  • У гэтым дыялогавым акне абярыце опцыю Надбудовы .
  • Цяпер абярыце опцыю Надбудовы Excel у раздзеле Кіраванне і націсніце Перайсці .

  • З'явіцца маленькае дыялогавае акно з назвай Надбудовы .
  • Затым адзначце опцыю Рашальнік надбудовы і націсніце ОК .

  • Пасля гэтага перайдзіце на ўкладку Даныя і вы знойдзеце каманду Рашальнік у групе Аналіз .

  • Цяпер націсніце каманду Рашальнік .
  • З'явіцца новае дыялогавае акно пад назвай Параметры рашальніка .
  • У полі Задаць мэту выберыце мышкай ячэйку $H$15 . Вы таксама можаце напісаць спасылку на ячэйку на клавіятуры. Пераканайцеся, што вы выкарыстоўваецеЗнак Абсалютная спасылка на ячэйку тут.
  • Далей у опцыі Змяняючы зменныя ячэйкі выберыце дыяпазон ячэек $D$16:$D$18 .
  • Затым зніміце сцяжок з поля Зрабіць неабмежаваныя зменныя неадмоўнымі , каб атрымаць адмоўныя значэнні, калі яны ўжо паказваюцца як адзначаныя.
  • Нарэшце, націсніце Рашыць кнопка.

  • У выніку перад вамі з'явіцца поле Вынік рашальніка .
  • Цяпер выберыце Захоўваць рашэнне рашэння Гэта поле таксама пакажа вам, сыходзіўся або разыходзіўся ваш рэгрэсійны аналіз.
  • Націсніце ОК , каб закрыць поле.

  • Нарэшце, вы ўбачыце, што значэнні зменнай у дыяпазоне ячэек D16:D18 зменены. Акрамя гэтага, вы таксама ўбачыце значэнні слупкоў E, F, G і H , якія таксама адрозніваюцца ад папярэдніх крокаў.

🔍 Ілюстрацыя выніку бінарнага рэгрэсійнага аналізу

Пасля завяршэння двайковага лагістычнага рэгрэсійнага аналізу ў Excel вы будзеце бачыць, што меркаванае значэнне зменнай рэгрэсіі заменена новым значэннем аналізу, і гэтыя значэнні з'яўляюцца правільным значэннем зменнай рэгрэсіі нашага набору даных. Мы можам разглядаць вынік любых канкрэтных даных, напрыклад узрост машыны 68 месяцаў і 4 сярэд. без змены ў тыдзень. Значэнне P(X) роўна 0,67 . Гэта ілюструе нам, што калі мы паглядзімдля машыны ў працоўным стане верагоднасць гэтай падзеі складае каля 67% .

Мы таксама можам паказаць гэта асобна, выкарыстоўваючы канчатковыя значэнні зменнай рэгрэсіі.

Такім чынам, мы можам сказаць, што наша працоўная працэдура спрацавала паспяхова, і мы можам правесці бінарны лагістычны рэгрэсіўны аналіз.

Выснова

На гэтым артыкул скончаны . Я спадзяюся, што гэты артыкул будзе для вас карысным, і вы зможаце зрабіць лагістычную рэгрэсію ў Excel. Калі ласка, падзяліцеся з намі любымі далейшымі запытамі або рэкамендацыямі ў раздзеле каментарыяў ніжэй.

Не забудзьцеся праверыць наш вэб-сайт ExcelWIKI для некалькіх праблем і рашэнняў, звязаных з Excel. Працягвайце вывучаць новыя метады і расці!

Х'ю Уэст з'яўляецца вельмі дасведчаным трэнерам і аналітыкам Excel з больш чым 10-гадовым вопытам работы ў галіны. Ён мае ступень бакалаўра ў галіне бухгалтарскага ўліку і фінансаў і ступень магістра дзелавога адміністравання. Х'ю захапляецца навучаннем і распрацаваў унікальны падыход да навучання, які лёгка прытрымлівацца і зразумець. Яго экспертныя веды Excel дапамаглі тысячам студэнтаў і спецыялістаў па ўсім свеце палепшыць свае навыкі і атрымаць поспех у сваёй кар'еры. Праз свой блог Х'ю дзеліцца сваімі ведамі з усім светам, прапаноўваючы бясплатныя падручнікі па Excel і онлайн-трэнінгі, каб дапамагчы прыватным асобам і прадпрыемствам цалкам раскрыць свой патэнцыял.