Як зробити логістичну регресію в Excel (з короткими кроками)

  • Поділитися Цим
Hugh West

Регресійний аналіз це широко використовуваний статистичний розрахунок. Ми часто робимо цей вид розрахунку за нашим бажанням. В Excel ми можемо виконати кілька видів регресійного аналізу У цій статті ми продемонструємо, як зробити логістичну регресію в Excel. Якщо вам також цікаво навчитися цьому аналізу, завантажуйте практичний посібник і слідуйте за нами.

Завантажити Практичний посібник

Поки ви читаєте цю статтю, скачайте цей робочий зошит для практики.

Логістична регресія.xlsx

Що таке логістична регресія?

Логістичний регресійний аналіз - це статистичний алгоритм навчання, який використовується для прогнозування значення залежної змінної на основі деяких незалежних критеріїв. Він допомагає людині отримати результат з великого набору даних на основі потрібної йому категорії. Логістичний регресійний аналіз в основному трьох типів:

  1. Бінарна логістична регресія
  2. Багатофакторна логістична регресія
  3. Порядкова логістична регресія

Бінарна логістична регресія: У моделі бінарного регресійного аналізу ми визначаємо категорію лише двома випадками: "Так/Ні" або "Позитивно/Негативно".

Багатофакторна логістична регресія: Багатофакторний логістичний аналіз працює з трьома і більше класифікаціями. Якщо у нас є більше двох класифікаційних розділів для категоризації наших даних, то ми можемо використовувати цю модель регресійного аналізу.

Порядкова логістична регресія: Ця модель регресійного аналізу працює для більш ніж двох категорій. Однак у цій моделі нам потрібен заздалегідь визначений порядок їх класифікації.

Покрокова процедура побудови логістичної регресії в Excel

У цій статті ми проведемо бінарний логістичний регресійний аналіз. Цей тип аналізу надає нам прогнозне значення шуканої змінної. Для виконання аналізу ми розглянемо набір даних з 10 машин з галузі. Доступність машини може бути позитивною або негативною. Двійкові цифри 1=позитивний і 0=негативно і ці значення наведені в колонці B Вік цих машин вказано в колонці C а середня тривалість їхнього робочого часу на тиждень - у колонці D Отже, наш набір даних знаходиться в діапазоні комірок B5:D14 Значення початкової змінної розв'язувача регресії знаходяться в діапазоні комірок C16:D18 Нижче покроково пояснюється вся процедура аналізу:

Крок 1: Введіть свій набір даних

На цьому кроці ми імпортуємо ваш набір даних:

  • Перш за все, точно введіть ваш набір даних в Excel. Для нашого аналізу ми вводимо набір даних в діапазон комірок B5:D14 .

  • Потім введіть свої Змінні рішення розв'язувача Вводимо їх в діапазон комірок D16:D18.
  • Ми припускаємо, що всі змінні мають такі значення 0.01 .

Читати далі: Множинна лінійна регресія на масивах даних Excel (2 методики)

Крок 2: Оцінка значення логіту

На цьому кроці ми розрахуємо Logit для нашого набору даних. Визначимо значення Logit значення як X в нашому розрахунку. Формула Logit цінність в тому:

Ось, b0, b1, і b2 є змінними регресії.

  • Запишіть у комірку наступну формулу E5 Використовуйте знак абсолютного значення, щоб заморозити значення змінних в комірці. Якщо ви не знаєте, як вводити символ Абсолютне посилання на комірку знак, ви можете ввести його кількома способами.

=$D$16+$D$17*C5+$D$18*D5

  • Потім натисніть кнопку Увійдіть на клавіатурі.

  • Після цього, подвійний клік на Ручка наповнення значок для копіювання формули в комірку E14 .

  • Ви отримаєте всі значення X .

Читати далі: Як зробити просту лінійну регресію в Excel (4 простих способи)

Крок 3: Визначення експоненціального логарифму для кожного з даних

Тут ми обчислимо експоненціальне значення логарифмічної величини, для цього використаємо функція EXP :

  • Визначити експоненціальне значення X запишіть у комірку наступну формулу F5 :

=EXP(E5)

  • Так само, подвійний клік на Ручка наповнення щоб скопіювати формулу, як і в попередньому кроці. Ви отримаєте всі експоненціальні значення X .

Крок 4: Розрахунок значення ймовірності

P(X) значення ймовірності появи події X Імовірність події - ймовірність події X можна визначити так:

  • Для його обчислення необхідно записати в комірку наступну формулу G5 .

=F5/(1+F5)

  • Натисніть кнопку Увійдіть ключ.
  • Тепер перетягніть Ручка наповнення значок до G15 щоб отримати значення для всіх значень.

Читати далі: Як розрахувати значення P в лінійній регресії в Excel (3 способи)

Крок 5: Оцінка суми значень логарифмічної правдоподібності

На наступних етапах ми оцінимо вартість Log-Likelihood. Після цього ми будемо використовувати функція SUM додати всі дані:

  • Для розрахунку Log-Likelihood ймовірність значення, ми будемо використовувати ЛНР функція в нашому наборі даних. У комірці H5 Запишемо наступну формулу:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • Тепер натисніть кнопку Увійдіть клавішу на клавіатурі.

  • Тоді, подвійний клік на Ручка наповнення для визначення всіх значень логістичної ймовірності.

  • Після цього в камері H15 запишіть наступну формулу для підсумовування всіх значень.

=SUM(H5:H14)

🔍 Розбивка формули

Ми робимо таку розбивку по клітинах H5 .

👉 LN(G5): Ця функція повертає -0.384.

👉 LN(1-G5): Ця функція повертає -1.144.

👉 (B5*LN(G5))+((1-B5)*LN(1-G5)): Ця функція повертає -0.384.

Крок 6: Використання інструменту аналізу розв'язувача для остаточного аналізу

Тепер ми проведемо остаточний регресійний аналіз. Ми проведемо аналіз через Розв'язувач Якщо ви не бачите його в Дані ви повинні включити вкладку Розв'язувач від Надбудови для Excel .

  • Щоб увімкнути її, виберіть Файл> Параметри .

  • В результаті на екрані з'явиться діалогове вікно під назвою Параметри Excel з'явиться.
  • У цьому діалоговому вікні виберіть пункт Надбудови варіант.
  • Тепер, обирайте Надбудови для Excel опція в Керувати розділ і натисніть Іди. .

  • З'явиться невелике діалогове вікно під назвою Надбудови з'явиться.
  • Потім перевірте Розв'язуюча надбудова і натисніть ГАРАЗД. .

  • Після цього перейдіть на сторінку Дані і ви знайдете вкладку Розв'язувач командування в Аналіз група.

  • Тепер натисніть на кнопку Розв'язувач командування.
  • З'явиться нове діалогове вікно під назвою Параметри розв'язувача з'явиться.
  • В рамках проекту Поставлена мета виберіть комірку $H$15 Ви також можете ввести посилання на комірку з клавіатури. Переконайтеся, що ви використовуєте клавішу Абсолютне посилання на комірку розпишіться тут.
  • Далі, в рамках Змінюючи змінні комірки опція виділення діапазону комірок $D$16:$D$18 .
  • Потім зніміть галочку з пункту Зробити необмежені змінні невід'ємними для отримання від'ємних значень, якщо він вже відображається як відмічений.
  • Нарешті, натисніть кнопку Розв'язати кнопку.

  • Як наслідок, на сьогоднішній день в Україні діє Результат розв'язку перед вами з'явиться вікно з написом.
  • Тепер, обирайте Keep Solver Solution У цьому вікні також буде показано, чи збігаються або розходяться результати регресійного аналізу.
  • Натисніть ГАРАЗД. щоб закрити коробку.

  • Нарешті, ви побачите значення змінної в діапазоні комірок D16:D18 Крім цього, ви також побачите значення стовпців E, F, G і H також демонструють відмінності від попередніх кроків.

🔍 Ілюстрація результату бінарного регресійного аналізу

Після завершення бінарного логістичного регресійного аналізу в Excel ви побачите, що наше передбачуване значення змінної регресії замінюється новим значенням аналізу, і ці значення є правильним значенням змінної регресії для нашого набору даних. Ми можемо розглянути результат будь-яких конкретних даних, наприклад, машину, яка має вік 68 місяців і 4 в середньому без змін на тиждень. Значення P(X) це 0.67 Це ілюструє нам, що якщо ми шукаємо машину в робочому стані, то ймовірність цієї події становить близько 67% .

Ми також можемо показати його окремо, використовуючи кінцеві значення змінної регресії.

Таким чином, можна сказати, що наша робоча процедура спрацювала успішно і ми можемо робити бінарний логістичний регресійний аналіз.

Висновок

На цьому я закінчую статтю, сподіваюся, що вона буде корисною для вас і ви зможете робити логістичну регресію в Excel. Будь ласка, поділіться з нами будь-якими додатковими питаннями або рекомендаціями в розділі коментарів нижче.

Не забувайте слідкувати за новинами на нашому сайті ExcelWIKI для декількох проблем і рішень, пов'язаних з Excel. Вивчайте нові методи і продовжуйте розвиватися!

Г’ю Вест — досвідчений тренер і аналітик Excel із понад 10-річним досвідом роботи в галузі. Він має ступінь бакалавра з бухгалтерського обліку та фінансів і ступінь магістра з ділового адміністрування. Г’ю має пристрасть до викладання та розробив унікальний підхід до викладання, який легко зрозуміти та дотримуватися. Його експертне знання Excel допомогло тисячам студентів і професіоналів у всьому світі вдосконалити свої навички та досягти успіху в кар’єрі. У своєму блозі Г’ю ділиться своїми знаннями зі світом, пропонуючи безкоштовні навчальні посібники з Excel та онлайн-навчання, щоб допомогти окремим особам і компаніям повністю розкрити свій потенціал.