Talaan ng nilalaman
Ang pagsusuri ng regression ay nasa halos lahat ng uri ng statistical software tulad ng SPSS , R, at hindi pa banggitin ang Excel. Ang regression ay maaaring magbigay sa atin ng malaking larawan tungkol sa mga ugnayan sa pagitan ng mga variable. Ang linear regression ay maaaring gawin nang mabilis sa Excel gamit ang Data Analysis tool. Ipapakita ng artikulong ito kung paano mo mabibigyang kahulugan ang mga resulta ng regression sa Excel.
I-download ang Practice Workbook
I-download ang workbook ng pagsasanay na ito sa ibaba.
I-interpret ang Mga Resulta ng Regression.xlsx
Ano ang Regression?
Ang pagsusuri ng regression ay kadalasang ginagamit sa pagsusuri ng data upang matukoy ang mga ugnayan sa maraming variable. Binibigyang-daan ka ng pagsusuri ng regression na piliin kung ano ang mangyayari sa dependent variable kung magbabago ang isa sa mga independent variable. Hinahayaan ka rin nitong malaman sa matematika kung aling mga independent variable ang may impluwensya.
Ang simpleng linear regression ay naiiba sa isang multiple linear regression sa mga istatistika. Gamit ang isang linear function, ang simpleng linear regression ay sinusuri ang kaugnayan sa pagitan ng mga variable at isang independent variable. Ang Multiple linear regression ay kapag dalawa o higit pang mga paliwanag na salik ang ginagamit upang matukoy ang mga variable. Ang paggamit ng nonlinear regression sa halip na ang dependent variable ay inilarawan bilang isang nonlinear function dahil ang mga relasyon ng data ay hindi linear. Ang artikulong ito ay tututuon sa multiple linearregression para ipakita kung paano mo mabibigyang kahulugan ang mga resulta ng regression sa Excel.
Mga Hakbang sa Gawin ang Regression sa Excel
Para sa mga layunin ng regression, gagamitin namin ang dataset sa ibaba para sa mga layunin ng pagsusuri. Dito ang independent variable ay ang column na Presyo at column na Nabenta . Ang column na independent ang magiging column na Demand .
Mga Hakbang
- Kailangan nating pumunta sa tab na Data at mag-click sa Pagsusuri ng Data para gawin ang regression .
- Magkakaroon ng bagong window; piliin ang dependent variable at independent variable na hanay ng data.
- Pagkatapos ay lagyan ng check ang Labels box at Confidence box.
- Pagkatapos ay mag-click sa output cell range box para piliin ang output cell address
- Susunod, lagyan ng tsek ang Residual upang kalkulahin ang mga residual.
- Pagkatapos nito, lagyan ng check ang Residual na mga plot at Line Fit Plots boxes
- I-click ang OK pagkatapos nito.
- Pagkatapos i-click OK, mapupunta ang mga pangunahing parameter ng output ng pagsusuri sa mga tinukoy na cell.
- Pagkatapos ay makakakuha ka rin ng ilang parameter gaya ng Significance value atbp sa ANOVA ( Analysis of Variance ) table.
- Dito, ang df ay tumutukoy sa antas ng kalayaan na nauugnay sa pinagmulan ng pagkakaiba.
- SS ay tumutukoy sa kabuuan ng mga parisukat. Ipapakita ng iyong modelo ang data nang mas mahusay kung ang Ang natitirang SS ay mas maliit kaysa sa Kabuuang SS.
- MS ay nangangahulugang parisukat.
- F nagsasaad ng F -test para sa null hypothesis.
- Significance F ay nagsasaad ng P -value ng F .
- Pagkatapos ay makukuha mo rin ang mga koepisyent ng variable, halaga ng kahalagahan, atbp sa isang talahanayan.
- Pagkatapos ay makakakuha ka ng panghuling talahanayan sa ibaba ng coefficient table na naglalaman ng natitirang halaga para sa bawat entry.
- Susunod, makukuha mo ang Demand vs Price regression chart, na may trendline.
- Pagkatapos ito, makukuha mo ang Demand vs Sold regression chart na may trendline.
- May isa pa chart na nagpapakita ng distribusyon ng mga residual ng bawat entry mula sa Sold variable.
- May isa pang chart na nagpapakita ng distribution ng residual ng bawat entry mula sa Presyo variable.
Susunod, ipapakita namin sa iyo kung paano mo n bigyang-kahulugan ang mga resulta ng regression na ito sa Excel.
Magbasa Pa: Paano Gawin ang Logistic Regression sa Excel (na may Mabilis na Mga Hakbang)
Paano Mag-interpret Mga Resulta ng Regression sa Excel
Ang susunod na kailangan mong gawin pagkatapos gawin ang pagsusuri ng regression at bigyang-kahulugan ang mga ito. Ang mga kinalabasan ay inilalarawan at inilarawan sa ibaba.
Pagsusuri ng Halaga ng Maramihang R-Squared Regression
AngIpinapahiwatig ng numero ng R-squared kung gaano kalapit ang pagkakaugnay ng mga elemento ng dataset at kung gaano kahusay tumutugma ang linya ng regression sa data. Gagamitin natin ang multiple linear regression analysis, kung saan tutukuyin natin ang epekto ng dalawa o higit pang variable sa pangunahing salik. Ito ay tumutukoy sa kung paano nagbabago ang dependent variable habang nagbabago ang isa sa mga independent variable. Ang hanay ng coefficient na ito ay mula -1 hanggang 1. Dito,
- 1 ay nangangahulugang malapit na positibong relasyon
- 0 ay nangangahulugang walang mga ugnayan sa mga variable. Sa madaling salita, random ang mga punto ng data.
- -1 ay nangangahulugang kabaligtaran o negatibong relasyon sa mga variable.
Sa mga resulta ng output na ipinapakita sa itaas, ang maramihang R-value ng ibinigay ang mga set ng data ay o.7578( tinatayang ), na nagsasaad ng malakas na ugnayan sa pagitan ng mga variable.
R Squared
R squared ang value ay nagpapaliwanag kung paano nag-iiba ang tugon ng mga dependent variable sa independent variable. Sa aming kaso, ang value ay 0.574(approx), na maaaring bigyang-kahulugan bilang isang makatwirang okay na relasyon sa pagitan ng mga variable.
Adjusted R-Squared
Ito ay para lang isang kahaliling bersyon ng halaga ng R squared . Sina-shuffle lang nito ang predictor mga variable habang hinuhulaan ang tugon variable. Kinakalkula ito bilang
R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]
Dito, R^2 : Ang R^2 value na nakuha namin mula saang dataset.
n : ang bilang ng mga obserbasyon.
K : ang bilang ng mga variable ng predictor.
Ang kahalagahan ng halagang ito ay lumalabas habang ginagawa ang pagsusuri ng regression sa pagitan ng dalawang predictor variable. Kung mayroong higit sa isang predictor na variable sa dataset, ang R squared value ay papalakihin, na lubhang hindi kanais-nais. Inaayos ng na-adjust na R squared value ang inflation na ito at nagbibigay ng tumpak na larawan ng mga variable.
Standard Error
Isa pang sukatan ng goodness-of-fit na nagpapahiwatig ng katumpakan ng iyong pagsusuri ng regression; mas mababa ang value, mas sigurado ka sa iyong pagsusuri ng regression.
Standard Error ay isang empirical metric na kumakatawan sa average na distansya na ang mga puntos ay lumilihis mula sa trendline. Sa kabaligtaran, ang R2 ay kumakatawan sa proporsyon ng dependent variable variation. Sa kasong ito, ang value ng Standard Error ay 288.9 ( approx ), na nagsasaad na ang aming mga data point, sa average, ay bumaba ng 288.9 mula sa trendline.
Mga Obserbasyon
Isaad ang bilang ng mga obserbasyon o entry.
Tukuyin ang Makabuluhang Variable
Ang Significance value ay nagpapahiwatig ng pagiging mapagkakatiwalaan (statistics sound) ng aming pagsusuri. Sa madaling salita, tinutukoy nito ang posibilidad na mali ang aming dataset. Ang halagang ito ay dapat na mas mababa sa 5%. Ngunit sa kasong ito, ang aming halaga ng kahalagahan ay 0.00117,na isinasalin sa 0.1%, na mas mababa sa 5%. So ok naman yung analysis namin. Kung hindi, maaaring kailanganin nating pumili ng iba't ibang variable para sa ating pagsusuri.
P-value sa Regression Analysis
Malapit na naka-link sa isang makabuluhang value, ang P- ang value ay nagsasaad ng posibilidad na mali ang coefficient value. Ang P-value ay nagsasaad ng kaugnayan ng null hypothesis sa mga variable.
Kung ang iyong p-value < ang Significance number, mayroong sapat na ebidensya para tanggihan ang null value hypothesis. Nangangahulugan ito na mayroong di-zero na ugnayan sa pagitan ng mga variable.
Ngunit kung ang p-value > Significance value, magkakaroon ng hindi sapat na katibayan upang i-dismiss ang null hypothesis. Iyon ay nagsasaad na maaaring walang ugnayan sa pagitan ng mga variable.
Sa o kaso, ang P-value ng variable Presyo =0.000948 < 0.00117 (significance value),
Kaya walang null hypothesis na nangyayari dito, at may sapat na ebidensya para magdeklara ng ugnayan sa pagitan ng mga variable.
Sa kabilang banda, para sa variable Nabenta , ang (P-value) 0.0038515 < 0.0011723 (Significance value)
Kaya maaaring mayroong null hypothesis na nangyayari dito, at walang sapat na ebidensya para magdeklara ng non-zero na ugnayan sa pagitan ng mga variable.
Sa karamihan ng mga kaso, itong P Tinutukoy ng -value kung ang isang variable ay nasa dataset o wala. Halimbawa, dapat nating alisin ang Sold variable upang mapanatili ang katatagan ng dataset.
Regression Equation
Habang tinutukoy namin ang linear regression analysis sa Excel, ang trend line ay dapat ding linear. Ang pangkalahatang anyo ay:
Y=mX+C.
Dito, Y ang dependent variable.
At Ang X ay ang independiyenteng variable dito, ibig sabihin ay tutukuyin natin ang epekto ng pagbabago ng variable x sa variable Y.
C ay magiging halaga lamang ng Y-axis intersection ng linya.
Sa kasong ito, ang halaga ng C intercept ay katumbas ng 9502.109853
At ang halaga ng m para sa dalawang variable ay -809.265 at 0.424818.
Kaya, mayroon kaming panghuling equation para sa dalawang magkahiwalay na variable.
Ang una ay:
Y=-809.265771X+9502.12At ang equation para sa pangalawang variable ay:
Y=0.4248X+9502.12Coefficients
Ang mga coefficient na nakuha namin ay m1=-809.2655 at m2=04248 . At interceptor, C= 9502.12 .
- Una, ang halaga ng interceptor ay nagpapahiwatig na ang demand ay magiging 9502 kapag ang presyo ay zero.
- At ang mga halaga ng Ang m ay tumutukoy sa rate kung saan nagbabago ang demand sa bawat yunit ng pagbabago ng presyo. Ang halaga ng koepisyent ng presyo ay -809.265, na nagsasaad na ang pagtaas ng presyo sa bawat yunit ay magpapababa sa demand ng humigit-kumulang 809 na mga yunit.
- Para sa pangalawang variable, Nabenta, ang halaga ng m ay 0.424. Ito ay nagsasaad na ang pagbabago sa bawat yunit na ibinebenta ay itemay magreresulta sa 0424 na beses na pagtaas ng unit ng produkto.
Mga Nalalabi
Ang Nalalabi pagkakaiba sa pagitan ng orihinal at ng kinakalkula entry mula sa regression line ay ang pagkakaiba. Ipinapahiwatig ng Residuals kung gaano kalayo ang aktwal na value mula sa linya. Halimbawa, ang nakalkulang entry mula sa pagsusuri ng regression para sa unang entry ay 9497. At ang unang orihinal na halaga ay 9500. Kaya ang nalalabi ay nasa paligid ng 2.109.
T-Statistics Value
Ang halaga ng T-static ay ang paghahati ng koepisyent ayon sa karaniwang halaga. Kung mas mataas ang value, mas maganda ang reliability ng coefficient na ipinapahiwatig.
May isa pang kahalagahan ng value na ito, na kinakailangan upang kalkulahin ang P-value.
Ang 95% Confidence Interval
Dito ang kumpiyansa ng variable na itinakda namin bilang 95 sa simula. Gayunpaman, maaari itong magbago.
- Dito, ang coefficient value ng mas mababang 95% ay kinakalkula bilang 8496.84 ay nangangahulugan na ang itaas na 95% ay kinakalkula bilang 10507.37,
- Ito ay nangangahulugan na habang ang ating ang pangunahing koepisyent ay humigit-kumulang, 9502.1. may mataas na posibilidad na ang halaga ay maaaring mas mababa sa 8496 para sa 95% ng mga kaso at isang 5% na pagkakataon na ito ay higit sa 10507.37
Magbasa Nang Higit Pa:
Mga Dapat Tandaan
✎ Ang paraan ng pagsusuri ng regression ay tinatasa lamang ang kaugnayan ng mga variable na sinusuri. Hindi ito nagtatatag ng sanhi. Sa ibang paraan, ang aspeto lamangng ugnayan isinasaalang-alang. Kapag ang ilang kilos ay nagdudulot ng isang bagay, ito ay nagiging sanhi. Kapag ang isang pagbabago ng isang variable ay lumilikha ng mga pagbabago, maaari itong ituring na sanhi.
✎ Ang pagsusuri ng regression ay lubhang humahadlang sa mga outlier. Dapat alisin ang lahat ng uri ng outlier bago gawin ang pagsusuri. Upang pag-aralan at bigyang-kahulugan ang mga resulta ng pagsusuri ng regression sa Excel, kailangan mong isaalang-alang ang mga puntong ito.
Konklusyon
Sa kabuuan, ang tanong na "paano ipaliwanag ang mga resulta ng regression sa Excel" ay sinasagot ng detalyadong pagsusuri at pagbibigay-kahulugan dito. Ginagawa ang pagsusuri sa pamamagitan ng tool na Pagsusuri ng Data sa tab na Data .
Para sa problemang ito, may available na workbook para sa pag-download kung saan maaari kang magsagawa ng pagsusuri ng regression at bigyang-kahulugan ito.
Huwag mag-atubiling magtanong o puna sa pamamagitan ng seksyon ng komento. Ang anumang mungkahi para sa pagpapabuti ng komunidad ng Exceldemy ay lubos na mapapahalagahan.