Kā interpretēt regresijas rezultātus programmā Excel (Detalizēta analīze)

  • Dalīties Ar Šo
Hugh West

Regresijas analīze ir gandrīz visās statistikas programmatūrās, piemēram. SPSS , R, Regresiju var izmantot, lai iegūtu kopainu par mainīgo lielumu savstarpējām attiecībām. Lineāro regresiju var diezgan ātri veikt programmā Excel, izmantojot funkciju Datu analīze rīks. Šajā rakstā tiks parādīts, kā jūs varat interpretēt regresijas rezultātus programmā Excel.

Lejupielādēt Practice Workbook

Lejupielādējiet šo prakses darba burtnīcu zemāk.

Interpretēt regresijas rezultātus.xlsx

Kas ir regresija?

Regresijas analīzi bieži izmanto datu analīzē, lai noteiktu saistību starp vairākiem mainīgajiem. Regresijas analīze ļauj izvēlēties, kas notiek ar atkarīgo mainīgo, ja mainās viens no neatkarīgajiem mainīgajiem. Tā arī ļauj matemātiski noskaidrot, kuriem neatkarīgajiem mainīgajiem ir ietekme.

Vienkāršā lineārā regresija atšķiras no a daudzkārtēja lineārā regresija statistikā. Izmantojot lineāru funkciju, vienkāršu lineārās regresijas analīze saistību starp mainīgajiem un vienu neatkarīgo mainīgo. Vairākkārtēja lineārā regresija ir tad, ja mainīgo lielumu noteikšanai tiek izmantoti divi vai vairāki paskaidrojošie faktori. Nelineārās regresijas izmantošana atkarīgā mainīgā vietā tiek raksturota kā nelineāra funkcija, jo datu sakarības nav lineāras. Šajā rakstā galvenā uzmanība tiks pievērsta. daudzkārtēja lineārā regresija lai parādītu, kā jūs varat interpretēt regresijas rezultātus programmā Excel.

Reģresijas veikšanas soļi programmā Excel

Regresijas nolūkos analīzes vajadzībām izmantosim turpmāk norādīto datu kopu. Šeit neatkarīgais mainīgais lielums būs Cena slejā un Pārdots slejā. neatkarīga slejā būs Pieprasījums sleja.

Soļi

  • Mums jādodas uz Dati un noklikšķiniet uz cilnes Datu analīze veikt regresiju .

  • Atvērsies jauns logs; atlasiet atkarīgā mainīgā un neatkarīgā mainīgā datu diapazonu.
  • Pēc tam atzīmējiet Etiķetes lodziņš un Uzticēšanās kaste.
  • Pēc tam noklikšķiniet uz izejas šūnu diapazona rūtiņas, lai atlasītu izejas šūnu adresi.
  • Pēc tam atzīmējiet Atlikums lai aprēķinātu atlikumus.
  • Pēc tam atzīmējiet Atlikums zemes gabali un Line Fit Plots lodziņi
  • Noklikšķiniet uz LABI pēc tam.

  • Noklikšķinot uz LABI, analīzes galvenie izejas parametri būs norādītajās šūnās.

  • Pēc tam jūs saņemsiet arī dažus parametrus, piemēram. Nozīme vērtība utt. ANOVA ( Noviržu analīze ) tabula.
  • Šeit, df apzīmē brīvības pakāpi, kas saistīta ar dispersijas avotu.
  • SS apzīmē kvadrātu summu. Jūsu modelis labāk atspoguļos datus, ja Atlikums SS ir mazāks nekā Kopā SS.
  • MS nozīmē kvadrāts.
  • F apzīmē F -nulles hipotēzes pārbaude.
  • Nozīme F apzīmē P -vērtība F .

  • Tad tabulā iegūsiet arī mainīgā lieluma koeficientus, nozīmīguma vērtību utt.

  • Pēc tam zem koeficientu tabulas tiks izveidota galīgā tabula, kurā būs norādīta katra ieraksta atlikusī vērtība.

  • Tālāk jūs iegūsiet Pieprasījums pret Cena regresijas diagramma ar tendences līniju.

  • Pēc tam jūs saņemat Pieprasījums pret Pārdots regresijas diagramma ar tendences līniju.

  • Ir vēl viena diagramma, kurā parādīts katra ieraksta atlieku sadalījums no Pārdots mainīgs.

  • Ir vēl viena diagramma, kurā parādīts katra ieraksta atlieku sadalījums no Cena mainīgs.

Tālāk mēs parādīsim, kā šos regresijas rezultātus interpretēt programmā Excel.

Lasīt vairāk: Kā veikt loģistisko regresiju programmā Excel (ar ātriem soļiem)

Kā interpretēt regresijas rezultātus programmā Excel

Nākamais, kas jādara pēc regresijas analīzes veikšanas, un jāinterpretē rezultāti. Tālāk ir aprakstīti un sīkāk aprakstīti rezultāti.

Vairākkārtēja R-kvadrāta regresijas vērtības analīze

Portāls R-kvadrāts skaitlis norāda, cik cieši ir saistīti datu kopas elementi un cik labi regresijas līnija atbilst datiem. Mēs izmantosim daudzkārtēju lineāro regresijas analīzi, kurā noteiksim divu vai vairāku mainīgo ietekmi uz galveno faktoru. Tas attiecas uz to, kā mainās atkarīgais mainīgais, mainoties vienam no neatkarīgajiem mainīgajiem. Šī koeficienta diapazons ir no-1 līdz 1. Šeit,

  • 1 nozīmē ciešas pozitīvas attiecības
  • 0 nozīmē, ka starp mainīgajiem nav nekādu attiecību. Citiem vārdiem sakot, datu punkti ir nejauši.
  • -1 nozīmē apgrieztu vai negatīvu saistību starp mainīgajiem.

Iepriekš parādītajos izvades rezultātos daudzkārtējā R vērtība dotajām datu kopām ir o,7578( aptuveni ), kas norāda uz spēcīgām attiecībām starp mainīgajiem lielumiem.

R kvadrāts

R kvadrāts vērtība izskaidro, kā atkarīgo mainīgo atbildes reakcija mainās atkarībā no neatkarīgā mainīgā. Mūsu gadījumā šī vērtība ir 0,574 (aptuveni), ko var interpretēt kā samērā labu saistību starp mainīgajiem.

Koriģētais R-kvadrāts

Šī ir tikai alternatīva versija R kvadrāts vērtība. Tas vienkārši samaisa prediktors mainīgie, prognozējot atbilde Tas tiek aprēķināts kā

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)].

Šeit, R^2 : The R^2 vērtība, ko ieguvām no datu kopas.

n : novērojumu skaits.

K : prognozējošo mainīgo skaits.

Šīs vērtības nozīmīgums rodas, veicot regresijas analīzi starp diviem prediktors mainīgie lielumi. Ja ir vairāk nekā viens prediktors mainīgais datu kopā, tad R kvadrāta vērtība būs paaugstināta, kas ir ļoti nevēlami. Koriģētā R kvadrāts vērtība koriģē šo inflāciju un sniedz precīzu priekšstatu par mainīgajiem lielumiem.

Standarta kļūda

Vēl viena atbilstības metrika, kas norāda regresijas analīzes precizitāti; jo zemāka ir šī vērtība, jo pārliecinošāka var būt regresijas analīze.

Standarta kļūda ir empīriska metrika, kas atspoguļo vidējo attālumu, kādā punkti novirzās no tendences līnijas. Turpretim, R2 ir atkarīgā mainīgā mainīgā variācijas proporcija. Šajā gadījumā vērtība Standarta kļūda ir 288,9 ( aptuveni ), kas norāda, ka mūsu datu punkti vidēji atpaliek 288,9 no tendences līnijas.

Novērojumi

Norādiet novērojumu vai ierakstu skaitu.

Noteikt nozīmīgo mainīgo lielumu

Portāls Nozīmīguma vērtība Citiem vārdiem sakot, tas norāda mūsu analīzes ticamību (statistiski pamatotību). Citiem vārdiem sakot, tas apzīmē varbūtību, ka mūsu datu kopa ir nepareiza. Šai vērtībai jābūt mazākai par 5 %. Bet šajā gadījumā mūsu nozīmīguma vērtība ir 0,00117, kas nozīmē 0,1 %, kas ir krietni zem 5 %. Tātad mūsu analīze ir kārtībā. Pretējā gadījumā, iespējams, mums būtu jāizvēlas citi mainīgie mūsu analīzei.

P-vērtība regresijas analīzē

Cieši saistīts ar nozīmīgu vērtību, t. i. P-vērtība apzīmē varbūtību, ka koeficienta vērtība ir nepareiza. P vērtība apzīmē nulles hipotēzes saistību ar mainīgajiem.

Ja jūsu p-vērtība < Nozīme skaits, ir pietiekami daudz pierādījumu, lai noraidītu nulles vērtības hipotēzi. Tas nozīmē, ka starp mainīgajiem pastāv nenulles korelācija.

Bet, ja p-vērtība > Nozīme vērtība, nebūs pietiekamu pierādījumu, lai noraidītu nulles hipotēzi. Tas nozīmē, ka starp mainīgajiem lielumiem nevarētu būt korelācijas.

Jebkurā gadījumā P-vērtība mainīgo lielumu Cena =0,000948 <0,00117 (nozīmīguma vērtība),

Tātad šeit nav nulles hipotēzes, un ir pietiekami daudz pierādījumu, lai konstatētu korelāciju starp mainīgajiem.

No otras puses, mainīgajam lielumam Pārdots , (P vērtība) 0,0038515 <0,0011723 (nozīmīguma vērtība)

Tātad šeit varētu būt nulles hipotēze, un nav pietiekami daudz pierādījumu, lai apgalvotu, ka starp mainīgajiem ir nenulles korelācija.

Vairumā gadījumu šī P vērtība nosaka, vai mainīgais būs vai nebūs datu kopā. Pārdots mainīgo lielumu, lai saglabātu datu kopas robustumu.

Regresijas vienādojums

Tā kā lineāro regresijas analīzi veicam programmā Excel, arī tendences līnijai jābūt lineārai. Vispārīgā forma ir šāda:

Y=mX+C.

Šeit, Y ir atkarīgais mainīgais lielums.

X šeit ir neatkarīgais mainīgais, kas nozīmē, ka mēs noteiksim, kā mainīgā x izmaiņas ietekmē mainīgo Y.

C būs tikai līnijas Y ass krustpunkta vērtība.

Šajā gadījumā C intercepcijas vērtība ir vienāda ar 9502,109853.

Un m vērtība abiem mainīgajiem ir -809,265 un 0,424818.

Tādējādi mēs iegūstam galīgo vienādojumu diviem atsevišķiem mainīgajiem lielumiem.

Pirmais no tiem ir:

Y=-809.265771X+9502.12

Otrā mainīgā vienādojums ir šāds:

Y=0,4248X+9502,12

Koeficienti

Iegūtie koeficienti ir šādi. m1=-809.2655 un m2=04248 . Un pārtvērējs, C= 9502.12 .

  • Pirmkārt, interceptora vērtība norāda, ka pieprasījums būs 9502, ja cena ir nulle.
  • Un vērtības m Cenas koeficienta vērtība ir -809,265, kas norāda, ka cenas palielinājums par vienību samazinās pieprasījumu par aptuveni 809 vienībām.
  • Otrajam mainīgajam lielumam, pārdotajai vienībai, m vērtība ir 0,424. Tas nozīmē, ka izmaiņas uz pārdotās preces vienību radīs 0424 reizes lielāku produkta vienības pieaugumu.

Atlikumi

Portāls Atlikums starpība starp sākotnējo un no regresijas līnijas aprēķināto ierakstu ir starpība. Atlikumi norāda, cik tālu faktiskā vērtība ir no līnijas. Piemēram, aprēķinātais ieraksts no regresijas analīzes pirmajam ierakstam ir 9497. Un pirmā sākotnējā vērtība ir 9500. Tātad atlikums ir aptuveni 2,109.

T-statistika Vērtība

T-statiskā vērtība ir koeficienta dalījums ar standarta vērtību. Jo augstāka ir šī vērtība, jo lielāku ticamību norāda koeficients.

Šai vērtībai ir vēl viena nozīme, kas nepieciešama, lai aprēķina P-vērtību.

95% ticamības intervāls

Šeit mainīgā lieluma ticamība, ko sākumā iestatījām kā 95. Tomēr tā var mainīties.

  • Šeit aprēķinātā koeficienta vērtība apakšējiem 95 % ir 8496,84, bet augšējiem 95 % - 10507,37,
  • Tas nozīmē, ka, lai gan mūsu galvenais koeficients ir aptuveni 9502,1, pastāv liela varbūtība, ka 95 % gadījumu tā vērtība var būt mazāka par 8496 un 5 % gadījumu tā var pārsniegt 10507,37.

Lasīt vairāk:

Lietas, kas jāatceras

Regresijas analīzes metode tikai novērtē saikni starp pētāmajiem mainīgajiem lielumiem. Tā nenoteic cēloņsakarību. Citos veidos ņem vērā tikai korelācijas aspektu. Ja kāda darbība kaut ko izraisa, tā kļūst par cēloņsakarību. Ja kāda mainīgā lieluma izmaiņas rada pārmaiņas, to var uzskatīt par cēloņsakarību.

Regresijas analīzi ļoti apgrūtina novirzes. Pirms analīzes veikšanas ir jānovērš visu veidu novirzes. Lai analizētu un interpretētu regresijas analīzes rezultātus programmā Excel, jāņem vērā šie punkti.

Secinājums

Rezumējot, uz jautājumu "kā interpretēt regresijas rezultātus programmā Excel" tiek sniegta atbilde, detalizēti analizējot un vēlāk interpretējot to. Analīze tiek veikta, izmantojot programmu. Datu analīze rīks Dati cilne.

Šai problēmai ir pieejama lejupielādējama darba burtnīca, kurā varat praktizēties regresijas analīzē un to interpretēt.

Jūtieties brīvi uzdot jebkādus jautājumus vai atsauksmes, izmantojot komentāru sadaļu. Jebkurš ieteikums, lai uzlabotu Exceldemy kopiena būs augsti vērtējama.

Hjū Vests ir ļoti pieredzējis Excel treneris un analītiķis ar vairāk nekā 10 gadu pieredzi šajā nozarē. Viņam ir bakalaura grāds grāmatvedībā un finansēs un maģistra grāds uzņēmējdarbības vadībā. Hjū aizraujas ar mācīšanu, un viņš ir izstrādājis unikālu mācīšanas pieeju, kas ir viegli izpildāma un saprotama. Viņa ekspertu zināšanas programmā Excel ir palīdzējušas tūkstošiem studentu un profesionāļu visā pasaulē uzlabot savas prasmes un izcelties karjerā. Izmantojot savu emuāru, Hjū dalās savās zināšanās ar pasauli, piedāvājot bezmaksas Excel apmācības un tiešsaistes apmācību, lai palīdzētu personām un uzņēmumiem pilnībā izmantot savu potenciālu.