Hogyan értelmezzük a regressziós eredményeket Excelben (részletes elemzés)

  • Ossza Meg Ezt
Hugh West

A regresszióelemzés szinte minden típusú statisztikai szoftverben megtalálható, mint például a SPSS , R, A regresszió segítségével átfogó képet kaphatunk a változók közötti kapcsolatokról. A lineáris regresszió elég gyorsan elvégezhető az Excelben a Adatelemzés Ez a cikk megmutatja, hogyan lehet a regressziós eredmények értelmezése Excelben.

Gyakorlati munkafüzet letöltése

Töltse le ezt a gyakorlati munkafüzetet az alábbiakban.

Regressziós eredmények értelmezése.xlsx

Mi a regresszió?

A regresszióelemzést gyakran használják az adatelemzésben több változó közötti összefüggések meghatározására. A regresszióelemzés lehetővé teszi, hogy kiválassza, mi történik a függő változóval, ha az egyik független változó változik. Azt is lehetővé teszi, hogy matematikailag kiderítse, mely független változóknak van hatása.

Egyszerű lineáris regresszió különbözik a többszörös lineáris regresszió a statisztikában. Egy lineáris függvény segítségével, egyszerű lineáris regressziós elemzések a változók és egy független változó közötti összefüggés. Többszörös lineáris regresszió az, amikor két vagy több magyarázó tényezőt használnak a változók meghatározására. A nemlineáris regresszió használata helyett a függő változót nemlineáris függvénynek nevezzük, mivel az adatok összefüggései nem lineárisak. Ez a cikk a következőkre koncentrál többszörös lineáris regresszió hogy bemutassa, hogyan lehet a regressziós eredmények értelmezése Excelben.

Lépések a regresszió elvégzéséhez az Excelben

A regresszióhoz az alábbi adatkészletet fogjuk használni az elemzéshez. Itt a független változó a következő lesz Ár oszlop és Eladva oszlop. független oszlop lesz a Kereslet oszlop.

Lépések

  • El kell mennünk a Adatok fülre, és kattintson a Adatelemzés regressziót végezni .

  • Egy új ablak jelenik meg; válassza ki a függő változó és a független változó adattartományát.
  • Ezután jelölje be a Címkék doboz és Bizalom doboz.
  • Ezután kattintson a kimeneti cellatartomány mezőre a kimeneti cella címének kiválasztásához.
  • Ezután jelölje be a Maradék a maradékok kiszámításához.
  • Ezután jelölje be a Maradék telkek és Line Fit Plots dobozok
  • Kattintson a címre. OK ezután.

  • Miután rákattintott RENDBEN, az elemzés elsődleges kimeneti paraméterei a megadott cellákban lesznek.

  • Ezután kap néhány paramétert is, mint például Jelentőség érték stb. a ANOVA ( Eltéréselemzés ) táblázat.
  • Tessék, df a varianciaforrással kapcsolatos szabadságfokot jelöli.
  • SS A modellje jobban tükrözi az adatokat, ha a négyzetek összege Maradék SS kisebb, mint a SS összesen.
  • MS négyzetet jelent.
  • F jelöli a F -vizsgálat a nullhipotézisre.
  • Jelentőség F jelöli a P -értékét F .

  • Ekkor a változó együtthatóit, szignifikanciaértékét stb. is megkapja egy táblázatban.

  • Ezután az együtthatótáblázat alatt egy végső táblázatot kap, amely tartalmazza az egyes bejegyzések maradékértékét.

  • Ezután megkapja a Kereslet vs Ár regressziós diagram, trendvonallal.

  • Ezután megkapja a Kereslet vs Eladva regressziós diagram egy trendvonallal.

  • Van egy másik diagram, amely a maradékok eloszlását mutatja az egyes bejegyzések a Eladva változó.

  • Van egy másik diagram, amely a maradékok eloszlását mutatja az egyes bejegyzések a Ár változó.

Ezután megmutatjuk, hogyan értelmezheti ezeket a regressziós eredményeket az Excelben.

Bővebben: Hogyan kell elvégezni a logisztikus regressziót Excelben (gyors lépésekkel)

Hogyan értelmezzük a regressziós eredményeket Excelben

A következő dolog, amit a regresszióelemzés elvégzése és értelmezése után meg kell tennie. Az eredményeket az alábbiakban ismertetjük és részletezzük.

Többszörös R-négyzet regressziós értékelemzés

A R-négyzet szám jelzi, hogy az adathalmaz elemei milyen szoros kapcsolatban állnak egymással, és hogy a regressziós egyenes mennyire illeszkedik az adatokhoz. A többszörös lineáris regresszióelemzést fogjuk használni, amelyben két vagy több változó hatását fogjuk meghatározni a fő tényezőre. Ez arra vonatkozik, hogy a függő változó hogyan változik, ha az egyik független változó változik. Ennek az együtthatónak a tartománya a következő értékek között van-1-től 1-ig. Itt,

  • 1 szoros pozitív kapcsolatot jelent
  • A 0 azt jelenti, hogy a változók között nincs kapcsolat. Más szóval az adatpontok véletlenszerűek.
  • A -1 fordított vagy negatív kapcsolatot jelent a változók között.

A fenti kimeneti eredményekben az adott adatsorok többszörös R-értéke o.7578( kb. ), ami a változók közötti szoros kapcsolatra utal.

R négyzet

R négyzet érték azt magyarázza, hogy a függő változók válasza hogyan változik a független változóra. Esetünkben az érték 0,574(kb.), ami úgy értelmezhető, hogy a változók közötti kapcsolat meglehetősen rendben van.

Korrigált R-négyzet

Ez csupán egy alternatív változata a R négyzet Ez egyszerűen megkeveri a prediktor változókat, miközben előrejelzi a válasz változó. A számítás a következőképpen történik

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Tessék, R^2 : A R^2 értéket kaptunk az adatkészletből.

n : a megfigyelések száma.

K : a prediktorváltozók száma.

Ennek az értéknek a jelentősége akkor merül fel, amikor regressziós elemzést végeznek két prediktor változók. Ha egynél több prediktor változót az adathalmazban, akkor az R négyzet értéke fel fog nőni, ami rendkívül nem kívánatos. A korrigált R négyzet érték korrigálja ezt az inflációt, és pontos képet ad a változókról.

Standard hiba

Egy másik illeszkedési jósági mérőszám, amely a regresszióelemzés pontosságát jelzi; minél alacsonyabb az értéke, annál biztosabb lehet a regresszióelemzésben.

Standard hiba egy empirikus metrika, amely a pontok átlagos távolságát mutatja a trendvonaltól. Ezzel szemben, R2 a függő változó változásának arányát jelöli. Ebben az esetben a Standard hiba 288,9 ( kb. ), ami azt jelzi, hogy adatpontjaink átlagosan 288,9 %-kal esnek el a trendvonaltól.

Megfigyelések

Jelölje a megfigyelések vagy bejegyzések számát.

A szignifikáns változó meghatározása

A Jelentőségi érték az elemzésünk megbízhatóságát (statisztikai szempontból megalapozott) jelzi. Más szóval, azt a valószínűséget jelzi, hogy az adathalmazunk téves. Ennek az értéknek 5% alatt kell lennie. De ebben az esetben a szignifikancia értékünk 0,00117, ami 0,1%-ot jelent, ami jóval az 5% alatt van. Tehát az elemzésünk rendben van. Ellenkező esetben lehet, hogy más változókat kell választanunk az elemzésünkhöz.

P-érték a regressziós elemzésben

Szorosan kapcsolódik egy jelentős értékhez, a P-érték jelöli annak valószínűségét, hogy az együttható értéke téves. A P-érték a nullhipotézis és a változók közötti összefüggést jelöli.

Ha a p-érték <a Jelentőség számmal, elegendő bizonyíték áll rendelkezésre a nullérték-hipotézis elutasításához. Ez azt jelenti, hogy a változók között nem nulla korreláció áll fenn.

De ha a p-érték > Jelentőség értéket, nem lesz elegendő bizonyíték a nullhipotézis elutasításához. Ez azt jelenti, hogy a változók között nem lehet összefüggés.

Ebben az esetben a P-érték változó Ár =0,000948 <0,00117 (szignifikanciaérték),

Tehát itt nem nullhipotézisről van szó, és elegendő bizonyíték áll rendelkezésre ahhoz, hogy a változók közötti összefüggést kimondjuk.

Másrészt a Eladva , a (P-érték) 0.0038515 <0.0011723 (szignifikanciaérték)

Tehát lehet, hogy itt egy nullhipotézis áll fenn, és nincs elég bizonyíték ahhoz, hogy a változók között nem nulla korrelációt állapítsunk meg.

A legtöbb esetben ez a P-érték határozza meg, hogy egy változó benne lesz-e az adathalmazban vagy sem. Például, el kell távolítanunk a Eladva változót az adatállomány robusztusságának megőrzése érdekében.

Regressziós egyenlet

Mivel a lineáris regresszióelemzést Excelben határozzuk meg, a trendvonalnak is lineárisnak kell lennie. Az általános forma a következő:

Y=mX+C.

Tessék, Y a függő változó.

Az X pedig itt a független változó, ami azt jelenti, hogy az x változó változásának hatását fogjuk meghatározni az Y változóra.

C csak a vonal Y-tengely metszéspontjának értéke lesz.

Ebben az esetben a C metszéspont értéke 9502,109853.

A két változó m értéke pedig -809,265 és 0,424818.

Megvan tehát a végső egyenlet a két különálló változóra.

Az első:

Y=-809.265771X+9502.12

A második változóra vonatkozó egyenlet pedig a következő:

Y=0.4248X+9502.12

Együtthatók

A kapott együtthatók a következők m1=-809.2655 és m2=04248 És az elfogó, C= 9502.12 .

  • Először is, az elkapó érték azt jelzi, hogy a kereslet 9502 lesz, ha az ár nulla.
  • És a m az árváltozás egységnyi árváltozására jutó keresletváltozási arányt jelöli. Az árkoefficiens értéke -809,265, ami azt jelzi, hogy az egységnyi áremelkedés nagyjából 809 egységgel csökkenti a keresletet.
  • A második változó, az Eladott termék esetében az m érték 0,424. Ez azt jelenti, hogy az egységnyi eladott tételre jutó változás a termék 0424-szeres egységnyi növekedését eredményezi.

Maradékok

A Maradék az eredeti és a regressziós egyenesből számított bejegyzés közötti különbség. Maradékok jelzi, hogy a tényleges érték milyen messze van a vonaltól. Például a regresszióelemzésből számított bejegyzés az első bejegyzéshez 9497. Az első eredeti érték pedig 9500. Tehát a maradék 2,109 körül van.

T-statisztika Érték

A T-statikus érték az együtthatónak a standard értékkel való osztása. Minél magasabb az érték, annál jobb megbízhatóságot jelez az együttható.

Van egy másik jelentősége is ennek az értéknek, amely ahhoz szükséges, hogy kiszámítja a P-értéket.

A 95%-os konfidenciaintervallum

Itt a változó megbízhatóságát az elején 95-re állítottuk be. Ez azonban változhat.

  • Itt az alsó 95%-os együttható értéke 8496,84, a felső 95%-os együttható értéke 10507,37,
  • Ez azt jelenti, hogy míg a fő együttható 9502,1 körül van, nagy az esélye annak, hogy az esetek 95%-ában az érték 8496 alatt van, és 5% esélye van annak, hogy 10507,37 fölött van.

Bővebben:

Emlékezetes dolgok

A regresszióelemzés módszere kizárólag a vizsgált változók közötti kapcsolatot értékeli. Nem állapít meg ok-okozati összefüggést. Más módon csak a korreláció szempontját veszi figyelembe. Ha valamilyen cselekedet okoz valamit, az ok-okozati összefüggéssé válik. Ha egy változó megváltoztatása változást hoz létre, az ok-okozati összefüggésnek tekinthető.

A regresszióelemzést erősen akadályozzák a kiugró értékek. Az elemzés előtt mindenféle kiugró értéket el kell távolítani. A regresszióelemzés eredményeinek Excelben történő elemzéséhez és értelmezéséhez ezeket a pontokat figyelembe kell vennie.

Következtetés

Összefoglalva, a "hogyan értelmezzük a regressziós eredményeket Excelben" kérdésre a válasz a részletes elemzés és a későbbi értelmezés. Az elemzés az alábbi módon történik Adatelemzés eszköz a Adatok tab.

Ehhez a feladathoz letölthető egy munkafüzet, amelyben gyakorolhatja a regresszióelemzést és annak értelmezését.

Nyugodtan tegyen fel bármilyen kérdést vagy visszajelzést a megjegyzés rovatban. Bármilyen javaslat a jobbítás a Exceldemy közösség nagyra értékelendő.

Hugh West nagy tapasztalattal rendelkező Excel-oktató és elemző, több mint 10 éves tapasztalattal az iparágban. Számvitel és pénzügy szakos alapdiplomát, valamint üzleti adminisztrációból mesterképzést szerzett. Hugh szenvedélye a tanítás, és egyedülálló tanítási megközelítést dolgozott ki, amely könnyen követhető és érthető. Az Excelben szerzett szakértői tudása világszerte több ezer diáknak és szakembernek segített abban, hogy készségeiket és karrierjüket kiválóan teljesítsék. Hugh blogján keresztül megosztja tudását a világgal, ingyenes Excel-oktatóanyagokat és online képzéseket kínálva, hogy segítse az egyéneket és a vállalkozásokat teljes potenciáljuk kibontakoztatásában.