Sisällysluettelo
Yksinkertainen regressio analyysia käytetään yleisesti kahden muuttujan välisen suhteen arvioimiseen, esimerkiksi satojen ja sateiden välisen suhteen tai leivän maun ja uunin lämpötilan välisen suhteen. Useimmiten meidän on kuitenkin tutkittava riippuvaisen muuttujan ja kahden tai useamman riippumattoman muuttujan välistä suhdetta. Esimerkiksi kiinteistönvälittäjä voi haluta tietää, ettäonko ja miten esimerkiksi talon koko, makuuhuoneiden lukumäärä ja naapuruston keskitulot liittyvät siihen hintaan, jolla talo myydään. Tällainen ongelma voidaan ratkaista soveltamalla seuraavia menetelmiä moninkertainen regressioanalyysi. Tässä artikkelissa on yhteenveto siitä, miten moninkertainen regressioanalyysi tehdään Excelin avulla.
Ongelma
Oletetaan, että otamme 5 satunnaisesti valittua myyjää ja keräämme alla olevan taulukon mukaiset tiedot. Onko koulutuksella tai motivaatiolla vaikutusta vuosittaiseen myyntiin vai ei?
Korkein suoritettu kouluvuosi | Motivaatio Higginsin motivaatioasteikolla mitattuna | Vuosittainen myynti dollareina |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45 | $429,000 |
16 | 50 | $435,000 |
18 | 65 | $433,000 |
Yhtälö
Yleisesti ottaen, moninkertainen regressioanalyysi oletetaan, että riippuvaisen muuttujan (y) ja riippumattomien muuttujien (x1, x2, x3 ... xn) välillä on lineaarinen suhde. Tällainen lineaarinen suhde voidaan kuvata seuraavan kaavan avulla:
Y = vakio + β1*x1 + β2*x2+...+ βn*xn
Seuraavassa on vakioiden ja kertoimien selitykset:
Y | Ennustettu arvo Y |
Jatkuva | Y-suuntaviiva |
β1 | Y:n muutos jokaista x1:n 1 inkrementin muutosta kohti. |
β2 | Y:n muutos jokaista x2:n 1 askeleen muutosta kohti. |
... | ... |
βn | Y:n muutos jokaista xn:n 1 askeleen muutosta kohti. |
Vakio ja β1, β2... βn voidaan laskea käytettävissä olevien otostietojen perusteella. Kun olet saanut vakion, β1, β2... βn arvot, voit käyttää niitä ennusteiden tekemiseen.
Ongelmaamme liittyy vain kaksi tekijää, joista olemme kiinnostuneita. Yhtälö on siis seuraava:
Vuotuinen myynti = vakio + β1*(korkein suoritettu kouluvuosi) + β2*(motivaatio Higginsin motivaatioasteikolla mitattuna).
Aseta malli
Vuosimyynti, korkein suoritettu kouluvuosi ja Motivaatio merkittiin sarakkeeseen A, sarakkeeseen B ja sarakkeeseen C, kuten kuviossa 1 esitetään. Riippuvainen muuttuja (vuosimyynti) kannattaa aina merkitä ennen riippumattomia muuttujia.
Kuva 1
Lataa Analysis ToolPak
Excel tarjoaa meille Data Analysis -ominaisuuden, joka voi palauttaa vakioiden ja kertoimien arvot. Mutta ennen tämän ominaisuuden käyttämistä sinun on ladattava Analysis ToolPak. Voit asentaa sen seuraavasti.
Napsauta Tiedosto tab -> Vaihtoehdot ja napsauta sitten Lisäosat osoitteessa Excel-vaihtoehdot Valitse valintaikkuna. Napsauta Mene painiketta alareunassa Excel-vaihtoehdot valintaikkuna avautuu Lisäosat valintaikkunassa. Lisäosat valintaikkunassa, valitse Analyysi TookPak valintaruutu ja napsauta sitten Ok .
Jos nyt klikkaat Tiedot välilehdellä näet Tietojen analysointi ilmestyy Analyysi ryhmä (oikea paneeli).
Kuva 2 [klikkaa kuvaa saadaksesi täyden näkymän].
Moninkertainen regressioanalyysi
Klikkaa Tietojen analysointi vuonna Analyysi ryhmässä Tiedot välilehti. Valitse Regressio Pyydettäessä Tietojen analysointi Voit myös tehdä muita tilastollinen analyysi kuten t-testi, ANOVA ja niin edelleen.
Kuva 3.1
A Regressio valintaikkuna tulee näkyviin sen jälkeen, kun olet valinnut Regressio . Täytä kuvan 3.2 mukainen valintaikkuna.
Input Y Range sisältää riippuvaisen muuttujan ja tiedot, kun taas Input X Range sisältää riippumattomat muuttujat ja tiedot. Tässä yhteydessä on muistutettava, että riippumattomien muuttujien on oltava vierekkäisissä sarakkeissa. Riippumattomien muuttujien enimmäismäärä on 15.
Koska alue A1: C1 sisältää muuttujien merkintöjä, Labels-valintaruutu olisi valittava. Suosittelen itse asiassa merkintöjen sisällyttämistä joka kerta, kun täytät Input Y Range- ja Input X Range -alueet. Nämä merkinnät ovat hyödyllisiä, kun tarkastelet Excelin palauttamia yhteenvetoraportteja.
Kuva 3.2
Valitsemalla Residuaalit-valintaruudun voit antaa Excelille mahdollisuuden luetella kunkin havainnon residuaalit. Katso kuviota 1. Havaintoja on yhteensä 5, ja saat 5 residuaalia. Residuaali on jotain, joka jää jäljelle, kun ennustettu arvo vähennetään havaitusta arvosta. Vakioitu residuaali on residuaali jaettuna sen keskihajonnalla.
Voit myös valita valintaruudun Residual Plot, jolloin Excel voi palauttaa jäännösdiagrammit. Jäännösdiagrammien määrä on yhtä suuri kuin riippumattomien muuttujien määrä. Jäännösdiagrammi on kuvaaja, jossa jäännökset näkyvät Y-akselilla ja riippumattomat muuttujat x-akselilla. Jäännösdiagrammissa x-akselin ympärille sattumanvaraisesti hajallaan olevat pisteet merkitsevät, että lineaarinen regressio Esimerkiksi kuvassa 3.3 esitetään kolme tyypillistä jäännöskuvion mallia. Vain vasemmanpuoleinen kuvio osoittaa, että se sopii hyvin lineaariseen malliin. Kaksi muuta mallia viittaavat siihen, että epälineaarinen malli sopii paremmin.
Kuva 3.3
Excel palauttaa sovitetun viivapiirroksen, jos valitset valintaruudun Line Fit Plots (Sovitetut viivapiirrokset). Sovitettu viivapiirros voi esittää yhden riippuvan muuttujan ja yhden riippumattoman muuttujan välistä suhdetta. Toisin sanoen Excel palauttaa sinulle saman määrän sovitettuja viivapiirroksia kuin riippumattoman muuttujan suhde. Saat esimerkiksi 2 sovitettua viivapiirrosta ongelmaamme.
Tulokset
Kun olet napsauttanut Ok-painiketta, Excel palauttaa alla olevan yhteenvetoraportin. Vihreällä ja keltaisella korostetut solut ovat tärkein osa, johon sinun on kiinnitettävä huomiota.
Kuva 3.4
Mitä korkeampi R-neliö (solu F5), sitä tiiviimpi suhde on riippuvaisten muuttujien ja riippumattomien muuttujien välillä. Kolmannessa taulukossa olevat kertoimet (alue F17: F19) antoivat vakioiden ja kertoimien arvot. Yhtälön pitäisi olla: Vuosimyynti = 1589,2 + 19928,3*(korkein suoritettu kouluvuosi) + 11,9*(motivaatio Higginsin motivaatioasteikolla mitattuna).
Jotta näet, ovatko tulokset luotettavia, sinun on kuitenkin tarkistettava myös keltaisella korostetut p-arvot. Vain jos p-arvo solussa J12 on alle 0,05, koko regressioyhtälö on luotettava. Mutta sinun on tarkistettava myös p-arvot alueella I17: I19, jotta näet, ovatko vakio ja riippumattomat muuttujat käyttökelpoisia riippuvaisen muuttujan ennustamisessa. Ongelmamme kannalta on parempi, että hylkäämmemotivaatio riippumattomia muuttujia tarkasteltaessa.
Lue lisää: Kuinka laskea P-arvo lineaarisessa regressiossa Excelissä (3 tapaa)
Poista motivaatio riippumattomista muuttujista
Poistettuani Motivaation riippumattomana muuttujana sovelsin samaa lähestymistapaa ja tein yksinkertaisen regressioanalyysin. Näet, että kaikki arvot ovat nyt alle 0,05. Lopullisen yhtälön pitäisi olla:
Vuosimyynti = 1167,8 + 19993,3*(korkein suoritettu kouluvuosi).
Kuva 3.5 [klikkaa kuvaa saadaksesi täyden näkymän].
Huomautus
Kuva 4
Add-Ins-työkalun lisäksi voit myös käyttää LINEST-funktiota moninkertaisen regressioanalyysin tekemiseen. LINEST-funktio on matriisifunktio, joka voi palauttaa tuloksen joko yhdessä solussa tai solualueella. Valitse ensin alue A8:B12 ja kirjoita sitten kaava "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" tämän alueen ensimmäiseen soluun (A8). Kun painat näppäinyhdistelmää CTRL + SHIFT +ENTER, Excel palauttaa tulokset muodossaVertaamalla sitä kuvioon 3.4 voitte nähdä, että 19993.3 on korkeimman suoritetun kouluvuoden kerroin, kun taas 1167.8 on vakio. Suosittelen joka tapauksessa käyttämään Add-Ins-työkalua. Se on paljon helpompaa.
Lue lisää...
Käänteinen What-If-analyysi Excelissä
Kuinka käyttää jokerimerkkejä Excelissä?
Lataa työtiedosto
Lataa toimiva tiedosto alla olevasta linkistä.
Moninkertainen-regressio-analyysi.xlsx