Obsah
Pokud hledáte způsoby, jak vypočítat P-hodnota nebo hodnota pravděpodobnosti v lineární regrese v aplikaci Excel, pak jste na správném místě. P-hodnota slouží k určení pravděpodobnosti výsledků hypotetických testů. Výsledky můžeme analyzovat na základě 2 hypotéz; tzv. Nulová hypotéza a Alternativní hypotéza . Pomocí P-hodnota můžeme určit, zda výsledek potvrzuje nulovou nebo alternativní hypotézu.
Začněme tedy hlavním článkem.
Stáhnout pracovní sešit
P value.xlsx3 způsoby výpočtu hodnoty P při lineární regresi v aplikaci Excel
Zde máme několik předpokládaných hodnot prodejů a skutečných hodnot prodejů některých výrobků společnosti. Tyto hodnoty prodejů porovnáme a určíme hodnotu pravděpodobnosti a poté zjistíme, zda P podporuje nulovou nebo alternativní hypotézu. Nulová hypotéza počítá s tím, že mezi oběma typy hodnot prodeje není žádný rozdíl, a alternativní hypotéza bude uvažovat rozdíly mezi těmito dvěma soubory hodnot.
Použili jsme Microsoft Office 365 zde, můžete použít jakoukoli jinou verzi podle toho, jak vám to vyhovuje.
Metoda 1: Použití nástroje "t-test" pro výpočet hodnoty P
Zde použijeme analytický balíček obsahující nástroj pro analýzu t-testu, abychom určili P-hodnota pro tyto dva soubory údajů o prodeji.
Kroky :
Pokud jste nástroj pro analýzu dat neaktivovali, nejprve tento balíček nástrojů povolte.
➤ Klikněte na Soubor tab.
➤ Vyberte Možnosti .
Poté se Možnosti aplikace Excel zobrazí se dialogové okno.
➤ Vyberte Doplňky na levém panelu.
➤ Vyberte Excel Doplňky možnost v Správa a pak stiskněte tlačítko Přejít na .
Poté se Doplňky Zobrazí se dialogové okno.
➤ Zkontrolujte Analýza ToolPak a stiskněte tlačítko OK .
➤ Nyní přejděte na Data Karta>> Analýza Skupina>> Analýza dat Možnost.
Poté se Analýza dat zobrazí se průvodce.
➤ Vyberte možnost t-test: párový dvouvýběrový test pro střední hodnoty z různých možností Nástroje pro analýzu .
Poté se t-test: párový dvouvýběrový test pro střední hodnoty otevře se dialogové okno.
➤ Jako Vstup musíme zadat dva rozsahy proměnných; $C$4:$C$11 pro Proměnná 1 Rozsah a $D$4:$D$11 pro Proměnná 2 Rozsah , jako Výstupní rozsah jsme vybrali $E$4 .
➤ Můžete změnit hodnotu pro Alpha z 0.05 (automaticky generované) na 0.01 protože určená hodnota této konstanty je obecně 0.05 nebo 0.01 .
➤ Nakonec stiskněte OK .
Poté získáte P-hodnota pro dva případy; jednoocasová hodnota je 0.00059568 a dvouocasová hodnota je 0.0011913 . Vidíme, že jednoocasý P-hodnota je poloviční než dvojnásobek P-hodnota . Protože dvouocasý P-hodnota bere v úvahu jak zvýšení, tak snížení známek, zatímco jednoocasová metoda P-hodnota se zabývá pouze jedním z těchto případů.
Navíc vidíme, že pro hodnotu Alfa 0.05 dostáváme P hodnoty menší než 0.05 což znamená, že zanedbává nulovou hypotézu, a proto jsou data vysoce významná.
Přečtěte si více: Jak interpretovat výsledky lineární regrese v aplikaci Excel (ve snadných krocích)
Metoda 2: Použití funkce T.TEST k výpočtu hodnoty P v lineární regresi v aplikaci Excel
V této části budeme používat Funkce T.TEST k určení Hodnoty P pro ocasy 1 a 2 .
Kroky :
Začneme určením P-hodnota pro ocas 1 nebo v jednom směru.
➤ Do buňky zadejte následující vzorec F5 .
=T.TEST(C4:C11,D4:D11,1,1)Zde, C4:C11 je rozsah Předpokládaný prodej , D4:D11 je rozsah Skutečný prodej , 1 je ocasní hodnota a poslední 1 je určen pro Párování typ.
Po stisknutí ENTER , dostáváme P-hodnota 0.00059568 pro ocas 1 .
➤ Použijte následující vzorec v buňce F6 k určení P-hodnota pro ocas 2 nebo v obou směrech.
=T.TEST(C4:C11,D4:D11,2,1)
Zde, C4:C11 je rozsah Předpokládaný prodej , D4:D11 je rozsah Skutečný prodej , 2 je ocasní hodnota a poslední 1 je určen pro Párování typ.
Přečtěte si více: Vícenásobná lineární regrese na souborech dat aplikace Excel (2 metody)
Metoda-3: Použití funkcí CORREL, T.DIST.2T pro výpočet hodnoty P v lineární regresi
Určíme P-hodnota pro korelaci zde pomocí CORREL , T.DIST.2T funkce.
Za tímto účelem jsme vytvořili několik sloupců se záhlavími. Celkem Položka , Korelační faktor , t Hodnota a Hodnota P a zadali jsme také hodnotu pro celkový počet položek, což je 8 .
Kroky :
➤ Za prvé, určujeme Korelační faktor zadáním následujícího vzorce do buňky C14 .
=CORREL(C4:C11,D4:D11)
Zde, C4:C11 je rozsah Předpokládaný prodej a D4:D11 je rozsah Skutečný prodej .
➤ Určení hodnota t zadejte do buňky následující vzorec D14 .
=(C14*SQRT(B14-2))/SQRT(1-C14*C14)
Zde, C14 je korelační faktor a B14 je celkový počet produktů.
- SQRT(B14-2) se stává
SQRT(8-2) → SQRT(6) udává druhou odmocninu z 6 .
Výstup → 2.4494897
- C14*SQRT(B14-2) se stává
0.452421561*2.4494897
Výstup → 1.10820197
- 1-C14*C14 se stává
1-0.452421561*0.452421561
Výstup → 0.79531473
- SQRT(1-C14*C14) se stává
SQRT(0,79531473) → vrací druhou odmocninu z 0.79531473 .
Výstup → 0.891804199
- (C14*SQRT(B14-2))/SQRT(1-C14*C14) se stává
(1.10820197)/0.891804199
Výstup → 1.242651665
➤ Nakonec pomocí následující funkce určíme. P-hodnota pro korelaci.
=T.DIST.2T(D14,B14-2)
Zde, D14 je hodnota t , B14-2 nebo 8-2 nebo 6 je stupeň volnosti a T.DIST.2T vrátí P-hodnota pro korelaci s dvouvýběrovým rozdělením.
Přečtěte si více: Jak provést vícenásobnou regresní analýzu v aplikaci Excel (ve snadných krocích)
Na co nezapomenout
⦿ Obecně používáme dva běžné způsoby. Alpha hodnoty; 0.05 a 0.01 .
⦿ Existují dvě hypotézy, nulová a alternativní, přičemž nulová hypotéza neuvažuje žádný rozdíl mezi dvěma soubory dat a druhá bere v úvahu rozdíl mezi dvěma soubory dat.
⦿ Když P-hodnota je menší než 0.05 popírá nulovou hypotézu a pro hodnoty větší než 0.05 potvrzuje nulovou hypotézu. Posouzením P-hodnota můžeme dojít k následujícím závěrům.
P<0,05 → velmi významné údajeP=0.05 → významné údaje
P=0.05-0.1 → okrajově významné údaje
P>0,1 → nevýznamné údaje
Praktická část
Pro samostatné cvičení jsme připravili Cvičení sekce jako níže v listu s názvem Cvičení . Udělejte to prosím sami.
Závěr
V tomto článku jsme se snažili popsat způsoby, jak vypočítat P-hodnota na adrese lineární regrese v aplikaci Excel. Doufám, že pro vás bude užitečný. Pokud máte nějaké návrhy nebo dotazy, neváhejte se o ně podělit v sekci komentářů.