Regressiotulosten tulkinta Excelissä (yksityiskohtainen analyysi)

Sisällysluettelo

Regressioanalyysi on lähes kaikissa tilastollisissa ohjelmistoissa, kuten esimerkiksi SPSS , R, ja puhumattakaan Excelistä. Regressio voi antaa meille kokonaiskuvan muuttujien välisistä suhteista. Lineaarinen regressio voidaan tehdä melko nopeasti Excelissä käyttämällä komentoa Tietojen analysointi Tämä artikkeli näyttää, miten voit tulkita regressiotuloksia Excelissä.

Lataa harjoituskirja

Lataa tämä harjoituskirja alta.

Tulkitse regressiotuloksia.xlsx

Mitä on regressio?

Regressioanalyysia käytetään usein data-analyysissä useiden muuttujien välisten yhteyksien määrittämiseen. Regressioanalyysin avulla voit valita, mitä tapahtuu riippuvalle muuttujalle, jos jokin riippumattomista muuttujista muuttuu. Sen avulla voit myös selvittää matemaattisesti, mitkä riippumattomat muuttujat vaikuttavat.

Yksinkertainen lineaarinen regressio eroaa a moninkertainen lineaarinen regressio käyttämällä lineaarista funktiota, yksinkertaista lineaariset regressioanalyysit muuttujien ja yhden riippumattoman muuttujan välinen yhteys. Moninkertainen lineaarinen regressio on silloin, kun muuttujien määrittämiseen käytetään kahta tai useampaa selittävää tekijää. Epälineaarisen regression käyttämistä riippuvaisen muuttujan sijasta kuvataan epälineaariseksi funktioksi, koska tietojen väliset suhteet eivät ole lineaarisia. Tässä artikkelissa keskitytään siihen, että moninkertainen lineaarinen regressio osoittaa, miten voit tulkita regressiotuloksia Excelissä.

Excelin regression tekemisen vaiheet

Regressiotarkoituksiin käytämme analyysissä alla olevaa aineistoa. Tässä riippumaton muuttuja on seuraava Hinta sarake ja Myyty sarake. itsenäinen sarake on Kysyntä sarake.

Askeleet

Meidän on mentävä Tiedot välilehteä ja napsauta Tietojen analysointi tehdä regressio .

Näyttöön avautuu uusi ikkuna; valitse riippuvaisen muuttujan ja riippumattoman muuttujan data-alue.
Rastita sitten Tarrat laatikko ja Luottamus laatikko.
Napsauta sitten tulostussolualue-ruutua valitaksesi tulostussolun osoitteen.
Seuraavaksi rasti ruutuun Jäännös jäännösten laskemiseksi.
Tämän jälkeen rasti ruutuun Jäännös tontit ja Line Fit Plots -laatikot
Klikkaa OK tämän jälkeen.

Kun olet napsauttanut SELVÄ, analyysin ensisijaiset lähtöparametrit ovat määritellyissä soluissa.

Sitten saat myös joitakin parametreja, kuten Merkitys arvo jne. ANOVA ( Varianssianalyysi ) taulukko.
Tässä, df tarkoittaa varianssin lähteeseen liittyvää vapausastetta.
SS Malli kuvastaa paremmin aineistoa, jos neliöiden summa on Jäännös SS on pienempi kuin SS yhteensä.
MS tarkoittaa neliötä.
F tarkoittaa F -testi nollahypoteesille.
Merkitys F tarkoittaa P -arvo F .

Silloin saat myös muuttujan kertoimet, merkitsevyysarvon jne. taulukkoon.

Tämän jälkeen saat kertoimitaulukon alapuolelle lopullisen taulukon, joka sisältää kunkin merkinnän jäännösarvon.

Seuraavaksi saat Kysyntä vs Hinta regressiokaavio, jossa on trendiviiva.

Tämän jälkeen saat Kysyntä vs Myyty regressiokaavio, jossa on trendiviiva.

On toinen kaavio, jossa esitetään kunkin merkinnän jäännösjakauma, joka on peräisin Myyty muuttuja.

On toinen kaavio, jossa esitetään kunkin merkinnän jäännösjakauma, joka on peräisin Hinta muuttuja.

Seuraavaksi näytämme, miten voit tulkita näitä regressiotuloksia Excelissä.

Katso myös: Kuinka valita solu VBA: lla Excelissä (6 hyödyllisiä tapoja)

Lue lisää: Miten tehdä logistinen regressio Excelissä (nopeilla vaiheilla)

Regressiotulosten tulkinta Excelissä

Seuraavaksi sinun on tehtävä regressioanalyysin tekemisen jälkeen ja tulkittava niitä. Tuloksia kuvataan ja käsitellään tarkemmin jäljempänä.

Moninkertainen R-ruutu regressioarvon analyysi

The R- neliö luku kertoo, kuinka läheisesti aineiston elementit liittyvät toisiinsa ja kuinka hyvin regressiosuora vastaa aineistoa. Käytämme moninkertaista lineaarista regressioanalyysia, jossa selvitämme kahden tai useamman muuttujan vaikutusta päätekijään. Tällä tarkoitetaan sitä, miten riippuvainen muuttuja muuttuu, kun yksi riippumattomista muuttujista muuttuu. Tämän kertoimen vaihteluväli on välillä-1-1. Tässä,

1 tarkoittaa läheistä myönteistä suhdetta
0 tarkoittaa, että muuttujien välillä ei ole yhteyksiä, toisin sanoen datapisteet ovat satunnaisia.
-1 tarkoittaa muuttujien välistä käänteistä tai negatiivista suhdetta.

Edellä esitetyissä tulostuloksissa annettujen aineistojen R-kertymäarvo on o.7578( noin ), mikä osoittaa, että muuttujien välillä on vahva yhteys.

R neliö

R neliö arvo selittää, miten riippuvaisten muuttujien vaste vaihtelee riippumattoman muuttujan mukaan. Meidän tapauksessamme arvo on 0,574 (noin), mikä voidaan tulkita muuttujien välisen suhteen olevan kohtuullisen hyvä.

Oikaistu R-ruutu

Tämä on vain vaihtoehtoinen versio R neliö Tämä yksinkertaisesti sekoittaa ennustaja muuttujia ennustettaessa vastaus muuttuja. Se lasketaan seuraavasti

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Tässä, R^2 : The R^2 arvo, jonka saimme tietokokonaisuudesta.

n : havaintojen lukumäärä.

K : ennustemuuttujien lukumäärä.

Tämän arvon merkitys ilmenee, kun tehdään regressioanalyysiä kahden seuraavan arvon välillä ennustaja muuttujia. Jos on useampi kuin yksi ennustaja muuttujaa aineistossa, niin R-neliöarvo kasvaa, mikä on erittäin epätoivottavaa. Oikaistu R neliö arvo korjaa tämän inflaation ja antaa tarkan kuvan muuttujista.

Keskivirhe

Toinen hyvyysmittari, joka osoittaa regressioanalyysin tarkkuuden; mitä pienempi arvo, sitä varmempi voit olla regressioanalyysissäsi.

Keskivirhe on empiirinen metriikka, joka kuvaa pisteiden keskimääräistä etäisyyttä trendiviivasta. Sitä vastoin, R2 edustaa riippuvaisen muuttujan vaihtelun osuutta. Tässä tapauksessa arvon Keskivirhe on 288,9 ( noin ), mikä tarkoittaa, että datapisteemme putoavat keskimäärin 288,9 pisteen päähän trendiviivasta.

Havainnot

Ilmoita havaintojen tai merkintöjen lukumäärä.

Merkitsevän muuttujan määrittäminen

The Merkitysarvo ilmaisee analyysimme luotettavuuden (tilastollisesti luotettava). Toisin sanoen se ilmaisee todennäköisyyden, että aineistomme on väärässä. Tämän arvon pitäisi olla alle 5 %. Mutta tässä tapauksessa merkitsevyysarvomme on 0,00117, mikä tarkoittaa 0,1 %, joka on selvästi alle 5 %:n. Analyysimme on siis kunnossa. Muussa tapauksessa meidän on ehkä valittava analyyseihimme eri muuttujat.

P-arvo regressioanalyysissä

Merkittävään arvoon läheisesti liittyvä P-arvo tarkoittaa todennäköisyyttä, että kertoimen arvo on väärä. P-arvo tarkoittaa nollahypoteesin yhteyttä muuttujiin.

Jos p-arvo < Merkitys luku, on riittävästi todisteita nollahypoteesin hylkäämiseksi. Tämä tarkoittaa, että muuttujien välillä on nollasta poikkeava korrelaatio.

Mutta jos p-arvo > Merkitys arvo, ei ole riittävästi todisteita nollahypoteesin hylkäämiseksi. Tämä tarkoittaa, että muuttujien välillä ei voi olla korrelaatiota.

Tai tapauksessa P-arvo muuttujan Hinta =0,000948 <0,00117 (merkitsevyysarvo),

Tässä ei siis ole kyse nollahypoteesista, ja on riittävästi todisteita, jotta muuttujien välillä voidaan todeta olevan korrelaatio.

Toisaalta muuttujan Myyty , (P-arvo) 0.0038515 <0.0011723 (merkitsevyysarvo)

Tässä voi siis olla kyse nollahypoteesista, eikä ole riittävästi todisteita, joiden perusteella voitaisiin todeta, että muuttujien välinen korrelaatio ei ole nolla.

Useimmissa tapauksissa tämä P-arvo määrittää, onko muuttuja mukana tietokannassa vai ei. Myyty muuttuja, jotta tietokokonaisuuden kestävyys säilyisi.

Regressioyhtälö

Kun määrittelemme lineaarisen regressioanalyysin Excelissä, myös trendiviivan pitäisi olla lineaarinen. Yleinen muoto on:

Y=mX+C.

Tässä, Y on riippuvainen muuttuja.

X on tässä riippumaton muuttuja, mikä tarkoittaa, että määritämme muuttujan x muutoksen vaikutuksen muuttujaan Y.

C on vain viivan Y-akselin leikkauspisteen arvo.

Tässä tapauksessa C-välin arvo on 9502,109853.

Näiden kahden muuttujan m-arvo on -809,265 ja 0,424818.

Meillä on siis lopullinen yhtälö kahdelle erilliselle muuttujalle.

Katso myös: Päivämäärän muuntaminen kuukaudeksi ja vuodeksi Excelissä (4 tapaa)

Ensimmäinen on:

Y=-809.265771X+9502.12

Ja toisen muuttujan yhtälö on:

Y=0.4248X+9502.12

Kertoimet

Saamamme kertoimet ovat m1=-809.2655 ja m2=04248 . ja sieppari, C= 9502.12 .

Ensiksi väliarvo osoittaa, että kysyntä on 9502, kun hinta on nolla.
Ja arvot m Hintakertoimen arvo on -809,265, mikä tarkoittaa, että yksikkökohtainen hinnannousu vähentää kysyntää noin 809 yksikköä.
Toisen muuttujan, Myyty, m-arvo on 0,424. Tämä tarkoittaa, että muutos myytyä yksikköä kohden johtaa tuotteen 0424- kertaiseen yksikkökohtaiseen kasvuun.

Jäännökset

The Jäännös alkuperäisen ja regressiosuorasta lasketun tulon välinen ero on ero. Jäännökset osoittavat, kuinka kaukana todellinen arvo on viivasta. Esimerkiksi ensimmäisen merkinnän regressioanalyysin laskennallinen merkintä on 9497. Ja ensimmäinen alkuperäinen arvo on 9500. Jäännös on siis noin 2,109.

T-tilastot Arvo

T-statistiikka-arvo on kertoimen jako vakioarvolla. Mitä suurempi arvo on, sitä paremmasta luotettavuudesta kerroin kertoo.

Tällä arvolla on toinenkin merkitys, jota tarvitaan, jotta laske P-arvo.

95 prosentin luottamusväli

Tässä muuttujan luotettavuudeksi asetetaan alussa 95. Se voi kuitenkin muuttua.

Tässä tapauksessa alemman 95 prosentin kertoimen arvoksi lasketaan 8496,84, mikä tarkoittaa, että ylemmän 95 prosentin kertoimen arvoksi lasketaan 10507,37,
Tämä tarkoittaa sitä, että vaikka pääkerroin on noin 9502,1, on suuri mahdollisuus, että arvo on alle 8496 95 prosentissa tapauksista ja 5 prosentin mahdollisuus, että se on yli 10507,37.

Lue lisää:

Muistettavat asiat

✎ Regressioanalyysimenetelmällä arvioidaan ainoastaan tutkittavien muuttujien välistä suhdetta. Se ei totea syy-yhteyttä. Muilla tavoin tarkastellaan ainoastaan korrelaation näkökulmaa. Kun jokin teko aiheuttaa jotain, siitä tulee syy-yhteyttä. Kun yhden muuttujan muuttaminen aiheuttaa muutoksia, sitä voidaan pitää syy-yhteytenä.

✎ Regressioanalyysiä haittaavat suuresti poikkeamat. Kaikenlaiset poikkeamat on poistettava ennen analyysin tekemistä. Jos haluat analysoida ja tulkita regressioanalyysin tuloksia Excelissä, sinun on otettava huomioon nämä seikat.

Päätelmä

Yhteenvetona voidaan todeta, että kysymykseen "miten regressiotuloksia tulkitaan Excelissä" vastataan analysoimalla ne yksityiskohtaisesti ja myöhemmin tulkitsemalla niitä. Analyysi tehdään käyttämällä apuna Tietojen analysointi työkalu Tiedot välilehti.

Tätä ongelmaa varten on ladattavissa työkirja, jossa voit harjoitella regressioanalyysia ja tulkita sitä.

Voit vapaasti esittää kysymyksiä tai palautetta kommenttiosion kautta. Kaikki ehdotukset parempaan Exceldemy yhteisö on erittäin kiitollinen.

Edellinen viesti COUNTIFS Yksilölliset arvot Excelissä (3 helppoa tapaa)

Seuraava postaus Kuinka tehdä kaksinkertainen pylväsdiagrammi Excelissä (helpoilla ohjeilla)

Hugh West

Hugh West on erittäin kokenut Excel-kouluttaja ja analyytikko, jolla on yli 10 vuoden kokemus alalta. Hän on koulutukseltaan laskentatoimen ja rahoituksen kandidaatti sekä kauppatieteiden maisteri. Hughilla on intohimo opettamiseen, ja hän on kehittänyt ainutlaatuisen opetusmenetelmän, jota on helppo seurata ja ymmärtää. Hänen asiantuntemuksensa Excelistä on auttanut tuhansia opiskelijoita ja ammattilaisia maailmanlaajuisesti parantamaan taitojaan ja menestymään urallaan. Blogissaan Hugh jakaa tietämyksensä maailman kanssa tarjoamalla ilmaisia Excel-opetusohjelmia ja verkkokoulutusta auttaakseen yksilöitä ja yrityksiä saavuttamaan täyden potentiaalinsa.

#EXEL.WIKI