Как рассчитать значение P в линейной регрессии в Excel (3 способа)

  • Поделись Этим
Hugh West

Если вы ищете способы вычисления P-value или значение вероятности в линейной регрессии в Excel, тогда вы находитесь в правильном месте. P-value используется для определения вероятности результатов гипотетических испытаний. Мы можем анализировать результаты на основе 2 гипотез;. Нулевая гипотеза и Альтернативная гипотеза . Использование P-value мы можем определить, подтверждает ли результат нулевую гипотезу или альтернативную гипотезу.

Итак, приступим к основной статье.

Скачать рабочую тетрадь

P value.xlsx

3 способа вычисления значения P в линейной регрессии в Excel

Здесь у нас есть прогнозируемые значения продаж и фактические значения продаж некоторых продуктов компании. Мы сравним эти значения продаж и определим значение вероятности, а затем мы определим, если P нулевая гипотеза предполагает отсутствие различий между двумя типами значений продаж, а альтернативная гипотеза будет рассматривать различия между этими двумя наборами значений.

Мы использовали Microsoft Office 365 версию здесь, вы можете использовать любые другие версии в зависимости от вашего удобства.

Метод-1: Использование 't-Test Analysis Tool' для расчета значения P

Здесь мы будем использовать пакет инструментов анализа, содержащий инструмент анализа t-Test для определения P-value для этих двух наборов данных о продажах.

Шаги :

Если вы не активировали инструмент анализа данных, то сначала включите этот пакет.

➤ Нажмите на Файл вкладка.

➤ Выберите Опции .

После этого Параметры Excel появится диалоговое окно.

➤ Выберите Дополнения на левой панели.

➤ Выберите Excel Дополнения опция в Управляйте поле и затем нажмите Перейти .

После этого Дополнения появится диалоговое окно.

➤ Проверьте Пакет инструментов анализа и нажмите кнопку OK .

➤ Теперь перейдите в Данные Вкладка>> Анализ Группа>> Анализ данных Вариант.

Затем Анализ данных появится мастер.

➤ Выберите опцию t-тест: парная двухвыборочная выборка для средних значений из различных вариантов Инструменты анализа .

После этого t-тест: парная двухвыборочная выборка для средних значений откроется диалоговое окно.

➤ As Вход мы должны предоставить два диапазона переменных; $C$4:$C$11 для Переменная 1 Диапазон и $D$4:$D$11 для Переменная 2 Диапазон , как Выходной диапазон мы выбрали $E$4 .

➤ Вы можете изменить значение для Альфа с сайта 0.05 (автоматически генерируется) в 0.01 поскольку назначенное значение для этой константы обычно 0.05 или 0.01 .

➤ Наконец, нажмите OK .

После этого вы получите P-value для двух случаев; однохвостовое значение составляет 0.00059568 и двуххвостовое значение 0.0011913 Мы видим, что однохвостая P-value в два раза меньше двуххвостого P-value . Поскольку двуххвостка P-value учитывает как увеличение, так и уменьшение оценок, в то время как однохвостовая P-value рассматривает только один из этих случаев.

Более того, мы видим, что для значения альфа 0.05 мы получаем P значения меньше 0.05 что означает, что он пренебрегает нулевой гипотезой, и поэтому данные являются высокозначимыми.

Читать далее: Как интерпретировать результаты линейной регрессии в Excel (с простыми шагами)

Метод-2: Использование функции T.TEST для вычисления значения P в линейной регрессии в Excel

В этом разделе мы будем использовать Функция T.TEST для определения Значения P для хвостов 1 и 2 .

Шаги :

Мы начнем с определения P-value для хвоста 1 или в одном направлении.

➤ Введите следующую формулу в ячейку F5 .

=T.TEST(C4:C11,D4:D11,1,1)

Вот, C4:C11 диапазон Прогнозируемые продажи , D4:D11 диапазон Фактические продажи , 1 является хвостовым значением, а последнее 1 для Парный тип.

После нажатия ENTER , мы получаем P-value 0.00059568 для хвоста 1 .

➤ Примените следующую формулу в ячейке F6 для определения P-value для хвоста 2 или в обоих направлениях.

=T.TEST(C4:C11,D4:D11,2,1)

Вот, C4:C11 диапазон Прогнозируемые продажи , D4:D11 диапазон Фактические продажи , 2 является хвостовым значением, а последнее 1 для Парный тип.

Читать далее: Множественная линейная регрессия на наборах данных Excel (2 метода)

Метод-3: Использование функций CORREL, T.DIST.2T для вычисления значения P в линейной регрессии

Мы определим P-value для корреляции здесь с помощью КОРРЕЛ , T.DIST.2T функции.

Для этого мы создали несколько столбцов с заголовками Итого Пункт , Корреляция. Фактор , t Значение и P-значение и мы ввели значение для общего количества товаров, которое также равно 8 .

Шаги :

➤ Во-первых, мы определяем Коррел.фактор введя следующую формулу в ячейку C14 .

=CORREL(C4:C11,D4:D11)

Вот, C4:C11 диапазон Прогнозируемые продажи и D4:D11 диапазон Фактические продажи .

➤ Для определения значение t введите следующую формулу в ячейку D14 .

=(C14*SQRT(B14-2))/SQRT(1-C14*C14)

Вот, C14 коэффициент корреляции, и B14 общее количество продуктов.

  • SQRT(B14-2) становится

    SQRT(8-2) → SQRT(6) дает квадратный корень из 6 .

    Выход → 2.4494897

  • C14*SQRT(B14-2) становится

    0.452421561*2.4494897

    Выход → 1.10820197

  • 1-C14*C14 становится

    1-0.452421561*0.452421561

    Выход → 0.79531473

  • SQRT(1-C14*C14) становится

    SQRT(0.79531473) → возвращает квадратный корень из 0.79531473 .

    Выход → 0.891804199

  • (C14*SQRT(B14-2))/SQRT(1-C14*C14) становится

    (1.10820197)/0.891804199

    Выход → 1.242651665

➤ Наконец, с помощью следующей функции мы определим P-value для корреляции.

=T.DIST.2T(D14,B14-2)

Вот, D14 это значение t , B14-2 или 8-2 или 6 степень свободы и T.DIST.2T вернет P-value для корреляции с двуххвостовым распределением.

Читать далее: Как провести множественный регрессионный анализ в Excel (с простыми шагами)

О чем следует помнить

⦿ Как правило, мы используем два распространенных варианта Альфа значения; 0.05 и 0.01 .

⦿ Есть две гипотезы, нулевая гипотеза и альтернативная гипотеза, нулевая гипотеза учитывает отсутствие разницы между двумя наборами данных, а другая учитывает разницу между двумя наборами данных.

⦿ Когда P-value меньше, чем 0.05 отрицает нулевую гипотезу, а для значений, превышающих 0.05 он подтверждает нулевую гипотезу. Оценивая P-value мы можем прийти к следующим выводам.

P<0.05 → высокозначимые данные

P=0.05 → важные данные

P=0.05-0.1 → незначительно значимые данные

P>0.1 → незначительные данные

Практическая секция

Для самостоятельного выполнения практики мы предоставили Практика раздел, как показано ниже, в листе с именем Практика Пожалуйста, сделайте это сами.

Заключение

В этой статье мы постарались рассказать о способах расчета P-value в линейной регрессии в Excel. Если у вас есть какие-либо предложения или вопросы, не стесняйтесь поделиться ими в разделе комментариев.

Хью Уэст — опытный тренер и аналитик Excel с более чем 10-летним опытом работы в отрасли. Он имеет степень бакалавра в области бухгалтерского учета и финансов и степень магистра делового администрирования. Хью страстно любит преподавать и разработал уникальный подход к обучению, которому легко следовать и который легко понять. Его экспертные знания Excel помогли тысячам студентов и специалистов по всему миру улучшить свои навыки и преуспеть в своей карьере. В своем блоге Хью делится своими знаниями со всем миром, предлагая бесплатные учебные пособия по Excel и онлайн-обучение, чтобы помочь отдельным лицам и компаниям полностью раскрыть свой потенциал.