Зміст
Регресійний аналіз це широко використовуваний статистичний розрахунок. Ми часто робимо цей вид розрахунку за нашим бажанням. В Excel ми можемо виконати кілька видів регресійного аналізу У цій статті ми продемонструємо, як зробити логістичну регресію в Excel. Якщо вам також цікаво навчитися цьому аналізу, завантажуйте практичний посібник і слідуйте за нами.
Завантажити Практичний посібник
Поки ви читаєте цю статтю, скачайте цей робочий зошит для практики.
Логістична регресія.xlsx
Що таке логістична регресія?
Логістичний регресійний аналіз - це статистичний алгоритм навчання, який використовується для прогнозування значення залежної змінної на основі деяких незалежних критеріїв. Він допомагає людині отримати результат з великого набору даних на основі потрібної йому категорії. Логістичний регресійний аналіз в основному трьох типів:
- Бінарна логістична регресія
- Багатофакторна логістична регресія
- Порядкова логістична регресія
Бінарна логістична регресія: У моделі бінарного регресійного аналізу ми визначаємо категорію лише двома випадками: "Так/Ні" або "Позитивно/Негативно".
Багатофакторна логістична регресія: Багатофакторний логістичний аналіз працює з трьома і більше класифікаціями. Якщо у нас є більше двох класифікаційних розділів для категоризації наших даних, то ми можемо використовувати цю модель регресійного аналізу.
Порядкова логістична регресія: Ця модель регресійного аналізу працює для більш ніж двох категорій. Однак у цій моделі нам потрібен заздалегідь визначений порядок їх класифікації.
Покрокова процедура побудови логістичної регресії в Excel
У цій статті ми проведемо бінарний логістичний регресійний аналіз. Цей тип аналізу надає нам прогнозне значення шуканої змінної. Для виконання аналізу ми розглянемо набір даних з 10 машин з галузі. Доступність машини може бути позитивною або негативною. Двійкові цифри 1=позитивний і 0=негативно і ці значення наведені в колонці B Вік цих машин вказано в колонці C а середня тривалість їхнього робочого часу на тиждень - у колонці D Отже, наш набір даних знаходиться в діапазоні комірок B5:D14 Значення початкової змінної розв'язувача регресії знаходяться в діапазоні комірок C16:D18 Нижче покроково пояснюється вся процедура аналізу:
Крок 1: Введіть свій набір даних
На цьому кроці ми імпортуємо ваш набір даних:
- Перш за все, точно введіть ваш набір даних в Excel. Для нашого аналізу ми вводимо набір даних в діапазон комірок B5:D14 .
- Потім введіть свої Змінні рішення розв'язувача Вводимо їх в діапазон комірок D16:D18.
- Ми припускаємо, що всі змінні мають такі значення 0.01 .
Читати далі: Множинна лінійна регресія на масивах даних Excel (2 методики)
Крок 2: Оцінка значення логіту
На цьому кроці ми розрахуємо Logit для нашого набору даних. Визначимо значення Logit значення як X в нашому розрахунку. Формула Logit цінність в тому:
Ось, b0, b1, і b2 є змінними регресії.
- Запишіть у комірку наступну формулу E5 Використовуйте знак абсолютного значення, щоб заморозити значення змінних в комірці. Якщо ви не знаєте, як вводити символ Абсолютне посилання на комірку знак, ви можете ввести його кількома способами.
=$D$16+$D$17*C5+$D$18*D5
- Потім натисніть кнопку Увійдіть на клавіатурі.
- Після цього, подвійний клік на Ручка наповнення значок для копіювання формули в комірку E14 .
- Ви отримаєте всі значення X .
Читати далі: Як зробити просту лінійну регресію в Excel (4 простих способи)
Крок 3: Визначення експоненціального логарифму для кожного з даних
Тут ми обчислимо експоненціальне значення логарифмічної величини, для цього використаємо функція EXP :
- Визначити експоненціальне значення X запишіть у комірку наступну формулу F5 :
=EXP(E5)
- Так само, подвійний клік на Ручка наповнення щоб скопіювати формулу, як і в попередньому кроці. Ви отримаєте всі експоненціальні значення X .
Крок 4: Розрахунок значення ймовірності
P(X) значення ймовірності появи події X Імовірність події - ймовірність події X можна визначити так:
- Для його обчислення необхідно записати в комірку наступну формулу G5 .
=F5/(1+F5)
- Натисніть кнопку Увійдіть ключ.
- Тепер перетягніть Ручка наповнення значок до G15 щоб отримати значення для всіх значень.
Читати далі: Як розрахувати значення P в лінійній регресії в Excel (3 способи)
Крок 5: Оцінка суми значень логарифмічної правдоподібності
На наступних етапах ми оцінимо вартість Log-Likelihood. Після цього ми будемо використовувати функція SUM додати всі дані:
- Для розрахунку Log-Likelihood ймовірність значення, ми будемо використовувати ЛНР функція в нашому наборі даних. У комірці H5 Запишемо наступну формулу:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Тепер натисніть кнопку Увійдіть клавішу на клавіатурі.
- Тоді, подвійний клік на Ручка наповнення для визначення всіх значень логістичної ймовірності.
- Після цього в камері H15 запишіть наступну формулу для підсумовування всіх значень.
=SUM(H5:H14)
🔍 Розбивка формули
Ми робимо таку розбивку по клітинах H5 .
👉
LN(G5): Ця функція повертає -0.384.
👉
LN(1-G5): Ця функція повертає -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Ця функція повертає -0.384.
Крок 6: Використання інструменту аналізу розв'язувача для остаточного аналізу
Тепер ми проведемо остаточний регресійний аналіз. Ми проведемо аналіз через Розв'язувач Якщо ви не бачите його в Дані ви повинні включити вкладку Розв'язувач від Надбудови для Excel .
- Щоб увімкнути її, виберіть Файл> Параметри .
- В результаті на екрані з'явиться діалогове вікно під назвою Параметри Excel з'явиться.
- У цьому діалоговому вікні виберіть пункт Надбудови варіант.
- Тепер, обирайте Надбудови для Excel опція в Керувати розділ і натисніть Іди. .
- З'явиться невелике діалогове вікно під назвою Надбудови з'явиться.
- Потім перевірте Розв'язуюча надбудова і натисніть ГАРАЗД. .
- Після цього перейдіть на сторінку Дані і ви знайдете вкладку Розв'язувач командування в Аналіз група.
- Тепер натисніть на кнопку Розв'язувач командування.
- З'явиться нове діалогове вікно під назвою Параметри розв'язувача з'явиться.
- В рамках проекту Поставлена мета виберіть комірку $H$15 Ви також можете ввести посилання на комірку з клавіатури. Переконайтеся, що ви використовуєте клавішу Абсолютне посилання на комірку розпишіться тут.
- Далі, в рамках Змінюючи змінні комірки опція виділення діапазону комірок $D$16:$D$18 .
- Потім зніміть галочку з пункту Зробити необмежені змінні невід'ємними для отримання від'ємних значень, якщо він вже відображається як відмічений.
- Нарешті, натисніть кнопку Розв'язати кнопку.
- Як наслідок, на сьогоднішній день в Україні діє Результат розв'язку перед вами з'явиться вікно з написом.
- Тепер, обирайте Keep Solver Solution У цьому вікні також буде показано, чи збігаються або розходяться результати регресійного аналізу.
- Натисніть ГАРАЗД. щоб закрити коробку.
- Нарешті, ви побачите значення змінної в діапазоні комірок D16:D18 Крім цього, ви також побачите значення стовпців E, F, G і H також демонструють відмінності від попередніх кроків.
🔍 Ілюстрація результату бінарного регресійного аналізу
Після завершення бінарного логістичного регресійного аналізу в Excel ви побачите, що наше передбачуване значення змінної регресії замінюється новим значенням аналізу, і ці значення є правильним значенням змінної регресії для нашого набору даних. Ми можемо розглянути результат будь-яких конкретних даних, наприклад, машину, яка має вік 68 місяців і 4 в середньому без змін на тиждень. Значення P(X) це 0.67 Це ілюструє нам, що якщо ми шукаємо машину в робочому стані, то ймовірність цієї події становить близько 67% .
Ми також можемо показати його окремо, використовуючи кінцеві значення змінної регресії.
Таким чином, можна сказати, що наша робоча процедура спрацювала успішно і ми можемо робити бінарний логістичний регресійний аналіз.
Висновок
На цьому я закінчую статтю, сподіваюся, що вона буде корисною для вас і ви зможете робити логістичну регресію в Excel. Будь ласка, поділіться з нами будь-якими додатковими питаннями або рекомендаціями в розділі коментарів нижче.
Не забувайте слідкувати за новинами на нашому сайті ExcelWIKI для декількох проблем і рішень, пов'язаних з Excel. Вивчайте нові методи і продовжуйте розвиватися!