Kaip interpretuoti regresijos rezultatus programoje "Excel" (išsami analizė)

Turinys

Regresinė analizė atliekama beveik visose statistinės programinės įrangos rūšyse, pvz. SPSS , R, Regresija gali padėti susidaryti bendrą vaizdą apie kintamųjų ryšius. Tiesinę regresiją galima gana greitai atlikti "Excel" programoje naudojant Duomenų analizė Šis straipsnis parodys, kaip galite interpretuoti regresijos rezultatus "Excel" programoje.

Atsisiųsti praktikos sąsiuvinį

Atsisiųskite šį pratybų sąsiuvinį žemiau.

Interpretuoti regresijos rezultatus.xlsx

Kas yra regresija?

Regresinė analizė dažnai naudojama duomenų analizėje siekiant nustatyti kelių kintamųjų sąsajas. Regresinė analizė leidžia pasirinkti, kas atsitiks su priklausomu kintamuoju, jei pasikeis vienas iš nepriklausomų kintamųjų. Ji taip pat leidžia matematiškai išsiaiškinti, kurie nepriklausomi kintamieji turi įtakos.

Paprastoji tiesinė regresija skiriasi nuo a daugialypė tiesinė regresija statistikoje. Naudojant tiesinę funkciją, paprastą tiesinė regresinė analizė kintamųjų ryšį su vienu nepriklausomu kintamuoju. Daugialypė tiesinė regresija kai kintamiesiems nustatyti naudojami du ar daugiau aiškinamųjų veiksnių. Naudojant netiesinę regresiją vietoj priklausomo kintamojo apibūdinama netiesinė funkcija, nes duomenų ryšiai nėra tiesiniai. Šiame straipsnyje daugiausia dėmesio bus skiriama daugialypė tiesinė regresija parodyti, kaip galite interpretuoti regresijos rezultatus "Excel" programoje.

Regresijos atlikimo "Excel" programoje žingsniai

Regresijos tikslais analizei naudosime toliau pateiktą duomenų rinkinį. Čia nepriklausomas kintamasis bus Kaina stulpelyje ir Parduodama stulpelis. nepriklausomas stulpelyje bus Paklausa stulpelis.

Žingsniai

Turime eiti į Duomenys skirtuką ir spustelėkite Duomenų analizė atlikti regresiją .

Atsidarys naujas langas; jame pasirinkite priklausomo kintamojo ir nepriklausomo kintamojo duomenų intervalą.
Tada pažymėkite Etiketės langelis ir Pasitikėjimas dėžutė.
Tada spustelėkite išvesties ląstelės diapazono langelį, kad pasirinktumėte išvesties ląstelės adresą.
Tada pažymėkite Likutis apskaičiuoti liekanas.
Po to pažymėkite Likutis sklypai ir Linijos atitikimo sklypai langeliai
Spustelėkite GERAI po to.

Paspaudę GERAI, pagrindiniai analizės išvesties parametrai bus nurodytose ląstelėse.

Tada taip pat gausite kai kuriuos parametrus, pvz. Reikšmė vertė ir t. t. ANOVA ( Skirtumų analizė ) lentelė.
Čia, df žymi laisvės laipsnį, susijusį su dispersijos šaltiniu.
SS reiškia kvadratų sumą. Jūsų modelis geriau atspindės duomenis, jei Likutis SS yra mažesnis už Iš viso SS.
MS reiškia kvadratą.
F žymi F -nulinės hipotezės patikrinimas.
Reikšmė F žymi P -vertė F .

Tada lentelėje taip pat gausite kintamojo koeficientus, reikšmingumo vertę ir kt.

Tada po koeficientų lentele gausite galutinę lentelę, kurioje bus pateikta kiekvieno įrašo likutinė vertė.

Toliau gausite Paklausa prieš Kaina regresijos diagrama su tendencijos linija.

Po to gausite Paklausa prieš Parduodama regresijos diagrama su tendencijos linija.

Yra dar viena diagrama, kurioje parodytas kiekvieno įrašo liekanų pasiskirstymas iš Parduodama kintamas.

Yra dar viena diagrama, kurioje parodytas kiekvieno įrašo liekanų pasiskirstymas iš Kaina kintamas.

Toliau parodysime, kaip šiuos regresijos rezultatus galite interpretuoti "Excel" programoje.

Skaityti daugiau: Kaip atlikti logistinę regresiją programoje "Excel" (greiti žingsniai)

Kaip interpretuoti regresijos rezultatus programoje "Excel

Kitas dalykas, kurį reikia padaryti atlikus regresinę analizę, ir juos interpretuoti. Toliau aprašomi ir išsamiai aptariami rezultatai.

Daugialypės R kvadrato regresijos vertės analizė

Svetainė R kvadratas skaičius rodo, kaip glaudžiai susiję duomenų rinkinio elementai ir kaip gerai regresijos tiesė atitinka duomenis. Naudosime daugialypės tiesinės regresijos analizę, kurios metu nustatysime dviejų ar daugiau kintamųjų įtaką pagrindiniam veiksniui. Tai reiškia, kaip keičiasi priklausomas kintamasis, pasikeitus vienam iš nepriklausomų kintamųjų. Šio koeficiento intervalas yra nuonuo -1 iki 1. Čia,

1 reiškia glaudžius teigiamus santykius
0 reiškia, kad tarp kintamųjų nėra jokių ryšių. Kitaip tariant, duomenų taškai yra atsitiktiniai.
-1 reiškia atvirkštinį arba neigiamą ryšį tarp kintamųjų.

Pirmiau pateiktuose išvesties rezultatuose pateiktų duomenų rinkinių kartotinė R vertė yra o,7578( maždaug ), o tai rodo stiprius kintamųjų ryšius.

R kvadratas

R kvadratas reikšmė paaiškina, kaip priklauso priklausomų kintamųjų atsakas į nepriklausomą kintamąjį. Mūsų atveju reikšmė yra 0,574 (apytiksliai), o tai galima interpretuoti kaip pakankamai gerą ryšį tarp kintamųjų.

Pakoreguotas R kvadratas

Tai tik alternatyvi versija R kvadratas reikšmė. Tai paprasčiausiai išmaišo prognozuojamasis rodiklis kintamieji prognozuojant atsakymas kintamasis. Jis apskaičiuojamas kaip

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Čia, R^2 : The R^2 vertę, kurią gavome iš duomenų rinkinio.

n : stebėjimų skaičius.

K : predikcinių kintamųjų skaičius.

Šios vertės reikšmė atsiranda atliekant regresinę analizę tarp dviejų prognozuojamasis rodiklis kintamieji. Jei yra daugiau nei vienas prognozuojamasis rodiklis kintamasis duomenų rinkinyje, tuomet R kvadrato vertė bus padidinta, o tai yra labai nepageidautina. Pakoreguota R kvadratas vertė pakoreguoja šią infliaciją ir pateikia tikslų kintamųjų vaizdą.

Standartinė paklaida

Kitas tinkamumo rodiklis, rodantis regresinės analizės tikslumą; kuo mažesnė reikšmė, tuo patikimesnė regresinė analizė.

Standartinė paklaida yra empirinė metrika, rodanti vidutinį atstumą, kuriuo taškai nukrypsta nuo trendo linijos. Priešingai, R2 rodo priklausomo kintamojo variacijos dalį. Šiuo atveju vertė Standartinė paklaida yra 288,9 ( maždaug ), o tai reiškia, kad mūsų duomenų taškai vidutiniškai nukrenta 288,9 nuo trendo linijos.

Pastebėjimai

Nurodykite stebėjimų arba įrašų skaičių.

Nustatyti reikšmingą kintamąjį

Svetainė Reikšmingumo vertė rodo mūsų analizės patikimumą (statistiškai pagrįstą). Kitaip tariant, jis reiškia tikimybę, kad mūsų duomenų rinkinys yra klaidingas. Ši reikšmė turėtų būti mažesnė nei 5 %. Tačiau šiuo atveju mūsų reikšmingumo reikšmė yra 0,00117, o tai reiškia 0,1 %, t. y. gerokai mažiau nei 5 %. Taigi mūsų analizė yra tinkama. Priešingu atveju gali tekti analizei pasirinkti kitus kintamuosius.

Regresinės analizės P vertė

Glaudžiai susijęs su reikšminga verte, pvz. P-vertė žymi tikimybę, kad koeficiento reikšmė yra klaidinga. P reikšmė žymi nulinės hipotezės ryšį su kintamaisiais.

Taip pat žr: "Excel" duomenų lentelės pavyzdys (6 kriterijai)

Jei jūsų p-vertė < Reikšmė skaičius, yra pakankamai įrodymų nulinės reikšmės hipotezei atmesti. Tai reiškia, kad tarp kintamųjų yra nenulinė koreliacija.

Bet jei p-vertė > Reikšmė reikšmę, bus nepakankamai įrodymų nulinei hipotezei atmesti. Tai reiškia, kad koreliacijos tarp kintamųjų negali būti.

Tokiu atveju P-vertė kintamojo Kaina =0,000948 <0,00117 (reikšmingumo reikšmė),

Taigi čia nėra nulinės hipotezės ir yra pakankamai įrodymų, kad būtų galima teigti, jog tarp kintamųjų yra ryšys.

Kita vertus, kintamajam Parduodama , (P vertė) 0,0038515 <0,0011723 (Reikšmingumo reikšmė)

Taigi čia gali būti nulinė hipotezė ir nėra pakankamai įrodymų, kad būtų galima teigti, jog tarp kintamųjų yra nenulinė koreliacija.

Daugeliu atvejų ši P vertė lemia, ar kintamasis bus įtrauktas į duomenų rinkinį, ar ne. Parduodama kintamasis, kad būtų išsaugotas duomenų rinkinio patikimumas.

Regresijos lygtis

Kadangi "Excel" programoje nustatome tiesinę regresinę analizę, tendencijos linija taip pat turėtų būti tiesinė. Bendroji forma yra tokia:

Y=mX+C.

Čia, Y yra priklausomas kintamasis.

Čia X yra nepriklausomas kintamasis, t. y. nustatysime kintamojo x pokyčio poveikį kintamajam Y.

C bus tik linijos Y ašies susikirtimo vertė.

Šiuo atveju C intercepcijos vertė yra lygi 9502,109853

Šių dviejų kintamųjų m reikšmė yra -809,265 ir 0,424818.

Taigi turime galutinę lygtį dviem atskiriems kintamiesiems.

Pirmasis yra:

Y=-809.265771X+9502.12

Antrojo kintamojo lygtis yra tokia:

Y=0,4248X+9502,12

Koeficientai

Taip pat žr: Kaip pašalinti pasikartojančias eilutes pagal vieną stulpelį programoje "Excel

Gauti koeficientai yra tokie m1=-809.2655 ir m2=04248 . Ir perėmėjas, C= 9502.12 .

Pirma, interceptoriaus reikšmė rodo, kad paklausa bus 9502, kai kaina lygi nuliui.
Ir vertės m Kainos koeficiento reikšmė yra -809,265, o tai reiškia, kad kainos padidėjimas vienam vienetui sumažins paklausą maždaug 809 vienetais.
Antrojo kintamojo, parduoto produkto, m reikšmė yra 0,424. Tai reiškia, kad dėl parduoto produkto vieneto pokyčio produktas padidės 0424 kartus.

Likučiai

Svetainė Likutis pradinio ir pagal regresijos liniją apskaičiuoto įrašo skirtumas yra skirtumas. Likučiai rodo, kaip toli nuo tiesės yra tikroji reikšmė. Pavyzdžiui, apskaičiuotas regresinės analizės pirmojo įrašo įrašas yra 9497. O pirmoji pradinė reikšmė yra 9500. Taigi liekana yra maždaug 2,109.

T-statistika Vertė

T-statistika - tai koeficiento padalijimas iš standartinės reikšmės. Kuo didesnė reikšmė, tuo didesnį patikimumą rodo koeficientas.

Yra dar viena šios reikšmės reikšmė, kuri reikalinga, kad apskaičiuoti P vertę.

95 % pasikliautinasis intervalas

Čia kintamojo patikimumas, kurį pradžioje nustatėme kaip 95. Tačiau jis gali keistis.

Apskaičiuota, kad apatinių 95 % koeficiento vertė yra 8496,84, o viršutinių 95 % - 10507,37,
Tai reiškia, kad nors mūsų pagrindinis koeficientas yra maždaug 9502,1, yra didelė tikimybė, kad 95 % atvejų jis gali būti mažesnis nei 8496, o 5 % atvejų - didesnis nei 10507,37.

Skaityti daugiau:

Dalykai, kuriuos reikia prisiminti

✎ Regresinės analizės metodu vertinamas tik ryšys tarp tiriamų kintamųjų. Jis nenustato priežastinio ryšio. Kitaip tariant, atsižvelgiama tik į koreliacijos aspektą. Kai koks nors veiksmas ką nors sukelia, tai tampa priežastiniu ryšiu. Kai vieno kintamojo pakeitimas sukelia pokyčius, tai gali būti laikoma priežastiniu ryšiu.

✎ Regresinei analizei labai trukdo išskirtys. Prieš atliekant analizę reikia pašalinti visų rūšių išskirtis. Norėdami analizuoti ir interpretuoti regresinės analizės rezultatus "Excel" programoje, turite atsižvelgti į šiuos dalykus.

Išvada

Apibendrinant galima teigti, kad į klausimą "kaip interpretuoti regresijos rezultatus "Excel" programoje" atsakoma išsamiai juos analizuojant ir vėliau interpretuojant. Analizė atliekama naudojant Duomenų analizė įrankis Duomenys skirtukas.

Šiam uždaviniui spręsti galima atsisiųsti sąsiuvinį, kuriame galima praktiškai atlikti regresinę analizę ir ją interpretuoti.

Drąsiai užduokite bet kokius klausimus ar atsiliepimus per komentarų skyrių. Bet koks pasiūlymas dėl geresnio Exceldemy bendruomenė bus labai vertinama.

Ankstesnis įrašas Unikalios vertės "Excel" programoje COUNTIFS (3 paprasti būdai)

Kitas įrašas Kaip "Excel" programoje sukurti dvigubą stulpelinę diagramą (paprastais žingsniais)

Hugh West

Hugh Westas yra labai patyręs Excel treneris ir analitikas, turintis daugiau nei 10 metų patirtį šioje srityje. Jis yra įgijęs apskaitos ir finansų bakalauro bei verslo administravimo magistro laipsnius. Hugh turi aistrą mokymui ir sukūrė unikalų mokymo metodą, kurį lengva sekti ir suprasti. Jo ekspertinės žinios apie „Excel“ padėjo tūkstančiams studentų ir specialistų visame pasaulyje tobulinti savo įgūdžius ir tobulėti savo karjeroje. Savo tinklaraštyje Hugh dalijasi savo žiniomis su pasauliu, siūlydamas nemokamus „Excel“ vadovėlius ir internetinius mokymus, kad padėtų asmenims ir įmonėms išnaudoti visą savo potencialą.

#EXEL.WIKI