Оглавление
Регрессионный анализ это широко используемый статистический расчет. Мы часто выполняем этот тип расчета по своему желанию. В Excel мы можем выполнить несколько видов регрессионного анализа В этой статье мы покажем, как выполнить логистическую регрессию в Excel. Если вам также интересно научиться этому анализу, скачайте рабочую тетрадь и следуйте за нами.
Скачать Практическое пособие
Скачайте эту рабочую тетрадь для практики, пока вы читаете эту статью.
Логистическая регрессия.xlsx
Что такое логистическая регрессия?
Логистический регрессионный анализ - это алгоритм статистического обучения, который используется для прогнозирования значения зависимой переменной на основе некоторых независимых критериев. Он помогает человеку получить результат из большого набора данных на основе желаемой категории. Логистический регрессионный анализ в основном бывает трех типов:
- Бинарная логистическая регрессия
- Мультиномиальная логистическая регрессия
- Ординарная логистическая регрессия
Бинарная логистическая регрессия: В модели бинарного регрессионного анализа мы определяем категорию только в двух случаях. Да/Нет или Положительный/Отрицательный.
Мультиномиальная логистическая регрессия: Мультиноминальный логистический анализ работает с тремя и более классификациями. Если у нас есть более двух классификационных разделов для категоризации наших данных, то мы можем использовать эту модель регрессионного анализа.
Ординарная логистическая регрессия: Эта модель регрессионного анализа работает для более чем двух категорий. Однако в этой модели нам нужен заранее определенный порядок для распределения их по категориям.
Пошаговая процедура выполнения логистической регрессии в Excel
В этой статье мы проведем бинарный логистический регрессионный анализ. Этот тип анализа позволяет получить прогнозное значение искомой переменной. Для проведения анализа мы рассмотрим набор данных из 10 машин из одной отрасли. Доступность машины может быть положительной или отрицательной. Бинарные цифры 1=положительный и 0=отрицательный , и эти значения показаны в столбце B Возраст этих машин указан в колонке C а средние часы их работы в неделю - в колонке D Итак, наш набор данных находится в диапазоне ячеек B5:D14 Значения исходной переменной решателя регрессии находятся в диапазоне ячеек C16:D18 Вся процедура анализа пошагово описана ниже:
Шаг 1: Введите свой набор данных
В этом шаге мы собираемся импортировать ваш набор данных:
- Прежде всего, точно введите набор данных в Excel. Для нашего анализа мы ввели набор данных в диапазон ячеек B5:D14 .
- Затем введите свои Решатель Решение Вариблс' Мы вводим их в диапазон ячеек D16:D18.
- Мы принимаем значения всех переменных как 0.01 .
Читать далее: Множественная линейная регрессия на наборах данных Excel (2 метода)
Шаг 2: Оценить значение логита
В этом шаге мы собираемся вычислить Логит значение для нашего набора данных. Мы определяем Логит значение как X в нашем расчете. Формула Логит значение имеет:
Вот, b0, b1, и b2 являются переменными регрессии.
- Запишите следующую формулу в ячейке E5 Используйте знак Absolute, чтобы заморозить значение переменных в ячейке. Если вы не знаете, как ввести Абсолютная ссылка на ячейку знак, его можно ввести несколькими способами.
=$D$16+$D$17*C5+$D$18*D5
- Затем нажмите кнопку Войти на клавиатуре.
- После этого, дважды щелкните на Наполнительная рукоятка значок , чтобы скопировать формулу в ячейку E14 .
- Вы получите все значения X .
Читать далее: Как сделать простую линейную регрессию в Excel (4 простых метода)
Шаг 3: Определите экспоненциал логита для каждых данных
Здесь мы рассчитаем экспоненциальное значение величины logit, Для этого мы будем использовать функция EXP :
- Для определения экспоненциального значения X , запишите следующую формулу в ячейке F5 :
=EXP(E5)
- Аналогично, дважды щелкните на Наполнительная рукоятка скопируйте формулу, как в предыдущем шаге. Вы получите все значения экспоненты X .
Шаг 4: Вычислить значение вероятности
P(X) значение вероятности возникновения X событие. Вероятность события X можно определить как:
- Чтобы рассчитать его, запишите в ячейке следующую формулу G5 .
=F5/(1+F5)
- Нажмите кнопку Войти ключ.
- Теперь перетащите Наполнительная рукоятка значок до G15 чтобы получить значение для всех значений.
Читать далее: Как рассчитать значение P в линейной регрессии в Excel (3 способа)
Шаг 5: Оценить значение суммы лог-вероятностей
В следующих шагах мы собираемся оценить значение Лог-вероятность. После этого мы будем использовать функция SUM чтобы добавить все данные:
- Для расчета Лог-вероятность значение, мы будем использовать ЛН функция в нашем наборе данных. В клетке H5 , запишите следующую формулу:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Теперь нажмите кнопку Войти клавишу на клавиатуре.
- Тогда, дважды щелкните на Наполнительная рукоятка значок для определения всех значений логарифмического правдоподобия.
- После этого в ячейке H15 , запишите следующую формулу для суммирования всех значений.
=SUM(H5:H14)
🔍 Разбивка формулы
Мы делаем эту разбивку для клеток H5 .
👉
LN(G5): Эта функция возвращает -0.384.
👉
LN(1-G5): Эта функция возвращает -1.144.
👉
(B5*LN(G5))+((1-B5)*LN(1-G5)): Эта функция возвращает -0.384.
Шаг 6: Используйте инструмент анализа Solver для окончательного анализа
Теперь проведем окончательный регрессионный анализ. Мы проведем анализ с помощью функции Решатель команду. Если вы не видите ее в Данные на вкладке "Вкладка" необходимо включить Решатель из Надстройки Excel .
- Чтобы включить его, выберите Файл> Опции .
- В результате появляется диалоговое окно под названием Параметры Excel появится.
- В этом диалоговом окне выберите Дополнения вариант.
- Теперь выберите Надстройки Excel опция в Управляйте раздел и нажмите кнопку Перейти .
- Появится небольшое диалоговое окно с заголовком Дополнения появится.
- Затем проверьте Надстройка решателя и нажмите кнопку OK .
- После этого перейдите к Данные вкладку, и вы найдете Решатель команда в Анализ группа.
- Теперь нажмите кнопку Решатель командование.
- Появится новое диалоговое окно под названием Параметры решателя появится.
- В Поставить цель выберите ячейку $H$15 с помощью мыши. Вы также можете написать ссылку на ячейку на клавиатуре. Убедитесь, что вы используете Абсолютная ссылка на ячейку подпишите здесь.
- Далее, в Изменяя переменные ячейки выберите диапазон ячеек $D$16:$D$18 .
- Затем снимите флажок Сделать переменные без ограничений неотрицательными чтобы получить отрицательные значения, если они уже отображаются как проверенные.
- Наконец, нажмите кнопку Решить кнопка.
- В результате Результат работы решателя перед вами появится окно.
- Теперь выберите Сохранить решение Это поле также покажет вам, сходится или расходится ваш регрессионный анализ.
- Нажмите OK чтобы закрыть окно.
- Наконец, вы увидите значения переменной в диапазоне ячеек D16:D18 Кроме этого, вы также увидите значения столбцов E, F, G и H также показывают отличия от предыдущих этапов.
🔍 Иллюстрация результата анализа бинарной регрессии
После завершения анализа бинарной логистической регрессии в Excel вы увидите, что наше предполагаемое значение переменной регрессии заменено новым значением анализа, и эти значения являются правильным значением переменной регрессии нашего набора данных. Мы можем рассмотреть результат для любых конкретных данных, например, для машины, возраст которой составляет 68 месяцы и 4 в среднем без смены в неделю. Значение P(X) это 0.67 Это показывает нам, что если мы ищем машину в рабочем состоянии, то вероятность этого события составляет около 67% .
Мы также можем показать его отдельно, используя конечные значения переменной регрессии.
Таким образом, мы можем сказать, что наша рабочая процедура сработала успешно, и мы можем провести бинарный логистический регрессионный анализ.
Заключение
Я надеюсь, что эта статья будет вам полезна, и вы сможете выполнять логистическую регрессию в Excel. Пожалуйста, поделитесь с нами любыми вопросами или рекомендациями в разделе комментариев ниже.
Не забудьте заглянуть на наш сайт ExcelWIKI для решения нескольких проблем, связанных с Excel. Продолжайте изучать новые методы и развивайтесь!