Hoe om regressieresultate in Excel te interpreteer (gedetailleerde ontleding)

  • Deel Dit
Hugh West

Regressie-analise is in byna elke tipe statistiese sagteware soos SPSS , R, en om nie van Excel te praat nie. Regressie kan ons die groot prentjie gee oor verwantskappe tussen veranderlikes. Lineêre regressie kan redelik vinnig in Excel gedoen word deur die Data-analise -instrument te gebruik. Hierdie artikel sal wys hoe jy regressie-resultate in Excel kan interpreteer.

Laai Oefenwerkboek af

Laai hierdie oefenwerkboek hieronder af.

Interpreteer regressieresultate.xlsx

Wat is regressie?

Regressie-analise word dikwels in data-analise gebruik om die assosiasies tussen veelvuldige veranderlikes te bepaal. Regressie-analise laat jou toe om te kies wat met die afhanklike veranderlike gebeur as een van die onafhanklike veranderlikes verander. Dit laat jou ook wiskundig uitvind watter onafhanklike veranderlikes 'n invloed het.

Eenvoudige lineêre regressie verskil van 'n meervoudige lineêre regressie in statistiek. Deur 'n lineêre funksie te gebruik, ontleed eenvoudige lineêre regressie die assosiasie tussen die veranderlikes en een onafhanklike veranderlike. Meervoudige lineêre regressie is wanneer twee of meer verklarende faktore gebruik word om die veranderlikes te bepaal. Die gebruik van nie-lineêre regressie in plaas van die afhanklike veranderlike word beskryf as 'n nie-lineêre funksie aangesien die dataverwantskappe nie lineêr is nie. Hierdie artikel sal konsentreer op meervoudige lineêreregressie om te demonstreer hoe jy regressieresultate in Excel kan interpreteer.

Stappe om regressie in Excel te doen

Vir regressiedoeleindes sal ons die onderstaande datastel gebruik vir analise doeleindes. Hier sal die onafhanklike veranderlike die Prys -kolom en Verkoop -kolom wees. Die onafhanklike -kolom sal die Vraag -kolom wees.

Stappe

  • Ons moet na die Data -oortjie gaan en op die Data-analise klik om regressie te doen .

  • Daar sal 'n nuwe venster wees; kies die afhanklike veranderlike en onafhanklike veranderlike datareeks.
  • Merk dan die Etikette blokkie en Confidence blokkie.
  • Klik dan op die uitsetselreeks boks om die uitsetseladres te kies
  • Volgende, merk op die Residueel om die residue te bereken.
  • Daarna, merk die Residueel plotte en Line Fit Plots-kassies
  • Klik OK hierna.

  • Nadat jy geklik het OK, die primêre uitvoerparameters van die analise sal by die gespesifiseerde selle wees.

  • Dan sal jy ook 'n paar parameters kry soos Betekenis waarde ens in die ANOVA ( Analise van Variansie ) tabel.
  • Hier dui df die mate van vryheid wat verband hou met die bron van variansie.
  • SS dui die som van vierkante aan. Jou model sal die data beter weerspieël as die Residueel SS is kleiner as die Totale SS.
  • MS beteken vierkant.
  • F dui die F -toets vir die nulhipotese aan.
  • Betekenis F dui die P -waarde van F aan.

  • Dan sal jy ook die veranderlike se koëffisiënte, betekeniswaarde, ens in 'n tabel kry.

  • Dan sal jy 'n finale tabel onder die koëffisiënttabel kry wat die reswaarde vir elke inskrywing bevat.

  • Volgende sal jy die Vraag teen Prys regressiegrafiek kry, met 'n tendenslyn.

  • Nadat dit, jy kry die Vraag vs Verkoop -regressiegrafiek met 'n tendenslyn.

  • Daar is nog 'n grafiek wat die verspreiding van residue van elke inskrywing van die Verkoop veranderlike toon.

  • Daar is nog 'n grafiek wat die verspreiding van residue toon van elke inskrywing van die Prys veranderlike.

Volgende wys ons jou hoe jy n interpreteer hierdie regressieresultate in Excel.

Lees meer: Hoe om logistiese regressie in Excel te doen (met vinnige stappe)

Hoe om te interpreteer Regressie-resultate in Excel

Die volgende ding wat jy moet doen nadat jy die regressie-analise gedoen het en dit interpreteer. Die uitkomste word hieronder beskryf en uitgebrei.

Meervoudige R-kwadraat-regressiewaarde-analise

Die R-kwadraat -nommer dui aan hoe nou die datastel se elemente verwant is en hoe goed die regressielyn by die data pas. Ons gaan die meervoudige lineêre regressie-analise gebruik, waarin ons die impak van twee of meer veranderlikes op die hooffaktor gaan bepaal. Dit verwys na hoe die afhanklike veranderlike verander soos een van die onafhanklike veranderlikes verander. Die omvang van hierdie koëffisiënt is van -1 tot 1. Hier beteken

  • 1 'n noue positiewe verwantskap
  • 0 beteken dat daar geen verwantskappe tussen veranderlikes is nie. Met ander woorde, die datapunte is ewekansig.
  • -1 beteken inverse of negatiewe verwantskap tussen veranderlikes.

In die uitsetresultate wat hierbo getoon word, is die veelvuldige R-waarde van die gegewe datastelle is o.7578( ongeveer ), wat sterk verbande tussen die veranderlikes aandui.

R kwadraat

R kwadraat waarde verduidelik hoe die respons van afhanklike veranderlikes op die onafhanklike veranderlike verskil. In ons geval is die waarde 0,574 (ongeveer), wat geïnterpreteer kan word as 'n redelike goeie verhouding tussen die veranderlikes.

Aangepaste R-kwadraat

Dit is bloot 'n alternatiewe weergawe van die R-kwadraat -waarde. Dit skommel eenvoudig die voorspeller veranderlikes terwyl die respons veranderlike voorspel word. Dit word bereken as

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

Hier, R^2 : Die R^2 waarde wat ons gekry het vandie datastel.

n : die aantal waarnemings.

K : die aantal voorspellerveranderlikes.

Die betekenisvolheid van hierdie waarde ontstaan ​​terwyl regressie-analise tussen twee voorspeller veranderlikes gedoen word. As daar meer as een voorspeller -veranderlike in die datastel is, sal die R-kwadraatwaarde opgeblaas word, wat hoogs ongewens is. Die aangepaste R-kwadraat -waarde pas hierdie inflasie aan en gee 'n akkurate prentjie van die veranderlikes.

Standaardfout

Nog 'n goeie maatstaf wat die akkuraatheid van jou regressie-analise aandui; hoe laer die waarde, hoe sekerder kan jy wees in jou regressie-analise.

Standaardfout is 'n empiriese metriek wat die gemiddelde afstand verteenwoordig wat die punte van die tendenslyn afwyk. In teenstelling hiermee verteenwoordig R2 die proporsie van afhanklike veranderlike variasie. In hierdie geval is die waarde van Standaardfout 288.9 ( ongeveer ), wat aandui dat ons datapunte gemiddeld 288.9 vanaf die neiginglyn daal.

Waarnemings

Dui die aantal waarnemings of inskrywings aan.

Bepaal beduidende veranderlike

Die Betekeniswaarde dui op die betroubaarheid (statisties gesond) van ons ontleding. Met ander woorde, dit dui op die waarskynlikheid dat ons datastel verkeerd is. Hierdie waarde moet onder 5% wees. Maar in hierdie geval is ons betekeniswaarde  0,00117,wat neerkom op 0,1%, wat ver onder die 5% is. So ons ontleding is ok. Andersins sal ons dalk verskillende veranderlikes vir ons analise moet kies.

P-waarde in regressie-analise

Nuwe gekoppel aan 'n beduidende waarde, die P- waarde dui die waarskynlikheid aan dat die koëffisiëntwaarde verkeerd is. P-waarde dui die assosiasie van die nulhipotese met die veranderlikes aan.

As jou p-waarde < die Betekenis getal, is daar genoeg bewyse om die nulwaardehipotese te verwerp. Dit beteken daar is 'n nie-nul korrelasie tussen die veranderlikes.

Maar as die p-waarde > Betekeniswaarde waarde, sal daar onvoldoende bewyse wees om die nulhipotese. Dit dui aan dat daar geen korrelasie tussen die veranderlikes kon wees nie.

In of geval, die P-waarde van veranderlike Prys =0,000948 < 0,00117 (betekeniswaarde),

Daar is dus geen nulhipotese hier aan die gang nie, en daar is genoeg bewyse om 'n korrelasie tussen veranderlikes te verklaar.

Aan die ander kant, vir die veranderlike Verkoop , die (P-waarde) 0,0038515 < 0,0011723 (Betekeniswaarde)

Daar kan dus 'n nulhipotese hier aan die gang wees, en daar is nie genoeg bewyse om 'n nie-nul korrelasie tussen veranderlikes te verklaar nie.

In die meeste gevalle is hierdie P -waarde bepaal of 'n veranderlike in die datastel sal wees of nie. Ons moet byvoorbeeld die Verkoop verwyderveranderlike om die robuustheid van die datastel te behou.

Regressievergelyking

Soos ons die lineêre regressie-analise in Excel bepaal, moet die tendenslyn ook lineêr wees. Die algemene vorm is:

Y=mX+C.

Hier is Y die afhanklike veranderlike.

En X is die onafhanklike veranderlike hier, wat beteken dat ons die effek van die verandering van veranderlike x op veranderlike Y sal bepaal.

C sal net die waarde wees van die Y-as snypunt van die lyn.

In hierdie geval is die waarde van die C -afsnit gelyk aan 9502.109853

En die waarde van m vir die twee veranderlikes is -809.265 en 0.424818.

Dus, ons het die finale vergelyking vir die twee afsonderlike veranderlikes.

Die eerste een is:

Y=-809.265771X+9502.12

En die vergelyking vir die tweede veranderlike is:

Y=0.4248X+9502.12

Koëffisiënte

Die koëffisiënte wat ons gekry het is m1=-809.2655 en m2=04248 . En onderskepper, C= 9502.12 .

  • Eerstens dui die onderskepperwaarde aan dat die vraag 9502 sal wees wanneer die prys nul is.
  • En die waardes van m dui die tempo aan waarteen vraag verander per eenheid van prysverandering. Die pryskoëffisiëntwaarde is -809.265, wat aandui dat 'n styging per eenheid in prys die vraag met ongeveer 809 eenhede sal laat daal.
  • Vir die tweede veranderlike, Verkoop, is die m-waarde 0.424. Dit dui aan dat die verandering per eenheid verkoop itemsal lei tot 'n 0424-tyd eenheid verhoging van die produk.

Residuele

Die Residuele verskil tussen die oorspronklike en die berekende inskrywing vanaf die regressielyn is die verskil. Residue dui aan hoe ver die werklike waarde van die lyn is. Byvoorbeeld, die berekende inskrywing van die regressie-analise vir die eerste inskrywing is 9497. En die eerste oorspronklike waarde is 9500. Die res is dus ongeveer 2.109.

T-Statistics Value

T-statiese waarde is die deling van koëffisiënt deur die standaardwaarde. Hoe hoër die waarde is, hoe beter dui die betroubaarheid van die koëffisiënt aan.

Daar is nog 'n betekenis van hierdie waarde, wat vereis word om die P-waarde te bereken.

Die 95% vertrouensinterval

Hier is die vertroue van die veranderlike wat ons aan die begin as 95 gestel het. Dit kan egter verander.

  • Hier word die koëffisiëntwaarde van die onderste 95% bereken as 8496.84 beteken die boonste 95% word bereken as 10507.37,
  • Dit beteken dat terwyl ons hoofkoëffisiënt is ongeveer, 9502.1. daar is 'n groot kans dat die waarde onder 8496 kan wees vir 95% van gevalle en 'n 5% kans dat dit meer as 10507.37 is

Lees Meer:

Dinge om te onthou

Die regressie-analisemetode assesseer slegs die verwantskap tussen veranderlikes wat ondersoek word. Dit stel nie oorsaaklikheid vas nie. Op ander maniere, net die aspekvan korrelasie oorweeg. Wanneer een of ander daad iets veroorsaak, het dit oorsaaklikheid geword. Wanneer 'n verandering van een veranderlike veranderinge skep, kan dit as oorsaaklikheid beskou word.

Regressie-analise belemmer swaar deur uitskieters. Alle soorte uitskieters moet verwyder word voordat ontleding gedoen word. Om regressie-analise-resultate in Excel te ontleed en te interpreteer, moet jy hierdie punte in ag neem.

Gevolgtrekking

Om dit op te som, word die vraag "hoe om regressie-resultate in Excel te interpreteer" breedvoerig beantwoord. dit te ontleed en later te interpreteer. Die ontleding word gedoen deur die Data-analise -instrument in die Data -oortjie.

Vir hierdie probleem is 'n werkboek beskikbaar vir aflaai waar jy regressie-analise kan oefen en interpreteer dit.

Vra gerus enige vrae of terugvoer deur die kommentaarafdeling. Enige voorstel vir die verbetering van die Exceldemy -gemeenskap sal hoogs waardeer wees.

Hugh West is 'n hoogs ervare Excel-afrigter en ontleder met meer as 10 jaar ondervinding in die bedryf. Hy het 'n Baccalaureusgraad in Rekeningkunde en Finansies en 'n Meestersgraad in Besigheidsadministrasie. Hugh het 'n passie vir onderrig en het 'n unieke onderrigbenadering ontwikkel wat maklik is om te volg en te verstaan. Sy kundige kennis van Excel het duisende studente en professionele persone wêreldwyd gehelp om hul vaardighede te verbeter en uit te blink in hul loopbane. Deur sy blog deel Hugh sy kennis met die wêreld, en bied gratis Excel-tutoriale en aanlyn opleiding aan om individue en besighede te help om hul volle potensiaal te bereik.