सामग्री सारणी
रिग्रेशन विश्लेषण जवळजवळ प्रत्येक प्रकारच्या सांख्यिकीय सॉफ्टवेअरमध्ये आहे जसे की SPSS , R, आणि Excel चा उल्लेख करू नका. प्रतिगमन आपल्याला व्हेरिएबल्समधील संबंधांबद्दल मोठे चित्र देऊ शकते. डेटा विश्लेषण टूल वापरून एक्सेलमध्ये रेखीय प्रतिगमन खूप लवकर केले जाऊ शकते. हा लेख दर्शवेल की तुम्ही एक्सेलमधील प्रतिगमन परिणामांचा अर्थ कसा लावू शकता.
सराव वर्कबुक डाउनलोड करा
खाली हे सराव वर्कबुक डाउनलोड करा.
रिग्रेशन परिणामांचा अर्थ लावा.xlsx
प्रतिगमन म्हणजे काय?
अनेक व्हेरिएबल्समधील संबंध निश्चित करण्यासाठी डेटा विश्लेषणामध्ये रीग्रेशन विश्लेषणाचा वापर केला जातो. रिग्रेशन विश्लेषण तुम्हाला स्वतंत्र व्हेरिएबलपैकी एक बदलल्यास अवलंबून व्हेरिएबलचे काय होईल हे निवडण्याची परवानगी देते. कोणत्या स्वतंत्र व्हेरिएबल्सचा प्रभाव आहे हे हे तुम्हाला गणितीयदृष्ट्या शोधून काढू देते.
साधे रेखीय प्रतिगमन आकडेवारीमध्ये एकाधिक रेखीय प्रतिगमन पासून वेगळे आहे. रेखीय कार्य वापरून, साधे रेषीय प्रतिगमन विश्लेषण व्हेरिएबल्स आणि एक स्वतंत्र व्हेरिएबल यांच्यातील संबंध. मल्टिपल रेखीय प्रतिगमन म्हणजे जेव्हा चल निर्धारित करण्यासाठी दोन किंवा अधिक स्पष्टीकरणात्मक घटक वापरले जातात. आश्रित व्हेरिएबलऐवजी नॉनलाइनर रिग्रेशन वापरणे हे नॉनलाइनर फंक्शन म्हणून वर्णन केले जाते कारण डेटा संबंध रेषीय नसतात. हा लेख मल्टिपल लिनियरवर लक्ष केंद्रित करेलरीग्रेशन तुम्ही एक्सेलमध्ये रिग्रेशनच्या परिणामांचा अर्थ कसा लावू शकता हे दाखवण्यासाठी .
एक्सेलमध्ये रिग्रेशन करण्याच्या पायऱ्या
रिग्रेशनच्या उद्देशांसाठी, आम्ही खालील डेटासेटचा वापर करू विश्लेषण उद्देश. येथे स्वतंत्र व्हेरिएबल किंमत स्तंभ आणि विकलेला स्तंभ असेल. स्वतंत्र स्तंभ हा मागणी स्तंभ असेल.
चरण
- आम्हाला डेटा टॅबवर जावे लागेल आणि प्रतिगमन करण्यासाठी डेटा विश्लेषण वर क्लिक करावे लागेल .
- एक नवीन विंडो असेल; अवलंबित व्हेरिएबल आणि स्वतंत्र व्हेरिएबल डेटा श्रेणी निवडा.
- नंतर लेबल बॉक्स आणि आत्मविश्वास बॉक्सवर खूण करा.
- नंतर आउटपुट सेल श्रेणीवर क्लिक करा आउटपुट सेल पत्ता निवडण्यासाठी बॉक्स
- पुढे, अवशिष्टांची गणना करण्यासाठी अवशिष्ट वर टिक करा.
- त्यानंतर, अवशिष्ट प्लॉटवर टिक करा आणि लाइन फिट प्लॉट बॉक्स
- यानंतर ओके क्लिक करा.
14>
- क्लिक केल्यानंतर ठीक आहे, विश्लेषणाचे प्राथमिक आउटपुट पॅरामीटर्स निर्दिष्ट सेलवर असतील.
- मग तुम्हाला काही पॅरामीटर्स देखील मिळतील जसे की ANOVA ( विविधताचे विश्लेषण ) टेबलमधील महत्त्व मूल्य इ.
- येथे, df सूचित करते भिन्नतेच्या स्त्रोताशी संबंधित स्वातंत्र्याची डिग्री.
- SS वर्गांची बेरीज दर्शवते. जर तुमचे मॉडेल डेटा अधिक चांगले प्रतिबिंबित करेल अवशिष्ट SS एकूण SS पेक्षा लहान आहे.
- MS म्हणजे चौरस.
- F शून्य गृहीतकासाठी F -चाचणी दर्शविते.
- महत्त्व F हे F चे P -मूल्य दर्शवते.
- मग तुम्हाला टेबलमध्ये व्हेरिएबलचे गुणांक, महत्त्व मूल्य इत्यादी देखील मिळतील.
- मग तुम्हाला गुणांक सारणीच्या खाली एक अंतिम सारणी मिळेल ज्यामध्ये प्रत्येक नोंदीसाठी अवशिष्ट मूल्य असेल.
- पुढे, तुम्हाला ट्रेंडलाइनसह डिमांड वि किंमत रिग्रेशन चार्ट मिळेल.
- नंतर हे, तुम्हाला ट्रेंडलाइनसह डिमांड वि विक्री रिग्रेशन चार्ट मिळेल.
22>
- आणखी एक आहे विकलेल्या व्हेरिएबलमधून प्रत्येक एंट्रीच्या अवशेषांचे वितरण दर्शविणारा चार्ट.
- अवशेषांचे वितरण दर्शविणारा दुसरा तक्ता आहे प्रत्येक एंट्रीची किंमत व्हेरिएबल.
पुढे, आम्ही तुम्हाला दाखवू की तुम्ही कसे n या प्रतिगमन परिणामांचा एक्सेलमध्ये अर्थ लावा.
अधिक वाचा: एक्सेलमध्ये लॉजिस्टिक रीग्रेशन कसे करावे (द्रुत चरणांसह)
कसे अर्थ लावायचे एक्सेल मधील प्रतिगमन परिणाम
रीग्रेशन विश्लेषण केल्यानंतर तुम्हाला पुढील गोष्टी कराव्या लागतील आणि त्यांचा अर्थ लावा. परिणामांचे वर्णन आणि तपशील खाली दिले आहेत.
मल्टिपल आर-स्क्वेअर रिग्रेशन व्हॅल्यू विश्लेषण
द R-squared संख्या डेटासेटचे घटक किती जवळून संबंधित आहेत आणि रीग्रेशन लाइन डेटाशी किती व्यवस्थित जुळते हे दर्शवते. आपण मल्टिपल रेखीय प्रतिगमन विश्लेषण वापरणार आहोत, ज्यामध्ये आपण मुख्य घटकावर दोन किंवा अधिक व्हेरिएबल्सचा प्रभाव निश्चित करणार आहोत. हे स्वतंत्र व्हेरिएबल बदलते म्हणून अवलंबून व्हेरिएबल कसे बदलते याचा संदर्भ देते. या गुणांकाची श्रेणी -1 ते 1 पर्यंत आहे. येथे,
- 1 म्हणजे जवळचा सकारात्मक संबंध
- 0 म्हणजे व्हेरिएबल्समध्ये कोणतेही संबंध नाहीत. दुसऱ्या शब्दांत, डेटा पॉइंट्स यादृच्छिक आहेत.
- -1 म्हणजे व्हेरिएबल्समधील व्यस्त किंवा नकारात्मक संबंध.
वर दर्शविलेल्या आउटपुट परिणामांमध्ये, दिलेल्या अनेक आर-मूल्य डेटा संच o.7578( अंदाजे ), जे व्हेरिएबल्समधील मजबूत संबंध दर्शवतात.
R वर्ग
R वर्ग मूल्य हे स्पष्ट करते की अवलंबून व्हेरिएबल्सचा प्रतिसाद स्वतंत्र व्हेरिएबलमध्ये कसा बदलतो. आमच्या बाबतीत, मूल्य ०.५७४(अंदाजे) आहे, ज्याचा व्हेरिएबल्समधील योग्य संबंध म्हणून अर्थ लावला जाऊ शकतो.
समायोजित R-वर्ग
हे फक्त आहे R वर्ग मूल्याची पर्यायी आवृत्ती. हे प्रतिसाद व्हेरिएबलचा अंदाज लावताना फक्त प्रेडिक्टर व्हेरिएबल्स बदलते. हे
R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)] <3 असे मोजते>
येथे, R^2 : आम्हाला मिळालेले R^2 मूल्यडेटासेट.
n : निरीक्षणांची संख्या.
K : प्रेडिक्टर व्हेरिएबल्सची संख्या.
महत्त्व दोन प्रेडिक्टर व्हेरिएबल्समधील प्रतिगमन विश्लेषण करताना या मूल्याचे उद्भवते. डेटासेटमध्ये एकापेक्षा जास्त प्रेडिक्टर व्हेरिएबल असल्यास, आर स्क्वेअर मूल्य वाढवले जाईल, जे अत्यंत अवांछनीय आहे. समायोजित R वर्ग मूल्य ही चलनवाढ समायोजित करते आणि व्हेरिएबल्सचे अचूक चित्र देते.
मानक त्रुटी
आणखी एक चांगली मेट्रिक ते तुमच्या प्रतिगमन विश्लेषणाची अचूकता दर्शवते; मूल्य जितके कमी असेल तितके तुम्ही तुमच्या प्रतिगमन विश्लेषणामध्ये अधिक खात्री बाळगू शकता.
मानक त्रुटी हे एक प्रायोगिक मेट्रिक आहे जे बिंदू ट्रेंडलाइनपासून विचलित होणारे सरासरी अंतर दर्शवते. याउलट, R2 अवलंबून व्हेरिएबल भिन्नतेचे प्रमाण दर्शवते. या प्रकरणात, मानक त्रुटी चे मूल्य 288.9 ( अंदाजे ) आहे, जे सूचित करते की आमचे डेटा पॉइंट्स, सरासरी, ट्रेंडलाइनपासून 288.9 कमी होतात.
निरीक्षणे
निरीक्षणांची संख्या किंवा नोंदी दर्शवा.
महत्त्वपूर्ण चल निश्चित करा
महत्त्वाचे मूल्य आमच्या विश्लेषणाची विश्वासार्हता (सांख्यिकीयदृष्ट्या योग्य) दर्शवते. दुसऱ्या शब्दांत, ते आमचा डेटासेट चुकीचा असण्याची शक्यता दर्शवते. हे मूल्य 5% पेक्षा कमी असावे. परंतु या प्रकरणात, आमचे महत्त्व ०.००११७ आहे,जे 0.1% मध्ये भाषांतरित करते, जे 5% च्या खाली आहे. त्यामुळे आमचे विश्लेषण ठीक आहे. अन्यथा, आम्हाला आमच्या विश्लेषणासाठी वेगवेगळे व्हेरिएबल्स निवडावे लागतील.
रिग्रेशन अॅनालिसिसमधील पी-व्हॅल्यू
महत्त्वपूर्ण मूल्याशी जवळून जोडलेले आहे, पी- मूल्य गुणांक मूल्य चुकीची असण्याची संभाव्यता दर्शवते. P-मूल्य व्हेरिएबल्ससह शून्य गृहितकाचा संबंध दर्शवते.
जर तुमचे p-मूल्य < महत्त्व संख्या, शून्य मूल्य गृहितक नाकारण्यासाठी पुरेसे पुरावे आहेत. याचा अर्थ व्हेरिएबल्समध्ये शून्य-नसलेला परस्परसंबंध आहे.
परंतु जर p-मूल्य > महत्त्व मूल्य असेल तर, डिसमिस करण्यासाठी पुरेसा पुरावा नसेल. शून्य गृहीतक. हे सूचित करते की व्हेरिएबल्समध्ये कोणताही संबंध असू शकत नाही.
किंवा बाबतीत, व्हेरिएबलचे पी-मूल्य किंमत =0.000948 < 0.00117 (महत्त्वाचे मूल्य),
म्हणून येथे कोणतेही शून्य गृहितक चालू नाही, आणि व्हेरिएबल्समधील परस्परसंबंध घोषित करण्यासाठी पुरेसा पुरावा आहे.
दुसरीकडे, व्हेरिएबल <1 साठी>विकले , (पी-मूल्य) ०.००३८५१५ < 0.0011723 (महत्त्व मूल्य)
म्हणून येथे एक शून्य गृहितक चालू असू शकते, आणि व्हेरिएबल्समधील शून्य-नसलेला सहसंबंध घोषित करण्यासाठी पुरेसा पुरावा नाही.
बहुतांश प्रकरणांमध्ये, हे पी व्हेरिएबल डेटासेटमध्ये असेल की नाही हे मूल्य निर्धारित करते. उदाहरणार्थ, आपण विकलेला काढून टाकला पाहिजेडेटासेटची मजबूतता टिकवून ठेवण्यासाठी व्हेरिएबल.
रिग्रेशन समीकरण
जसे आपण एक्सेलमध्ये रेखीय प्रतिगमन विश्लेषण निर्धारित करतो, ट्रेंड लाइन देखील रेषीय असावी. सामान्य रूप आहे:
Y=mX+C.
येथे, Y हे अवलंबून चल आहे.
आणि येथे X हे स्वतंत्र चल आहे, याचा अर्थ आपण व्हेरिएबल x च्या बदलाचा परिणाम Y वर निश्चित करू.
C हे फक्त Y-अक्ष छेदनबिंदूचे मूल्य असेल. ओळ.
या प्रकरणात, C इंटरसेप्टचे मूल्य 9502.109853 च्या बरोबरीचे आहे
आणि दोन व्हेरिएबल्ससाठी m चे मूल्य -809.265 आणि 0.424818 आहे.
म्हणून, आमच्याकडे दोन वेगळ्या चलांसाठी अंतिम समीकरण आहे.
पहिले आहे:
Y=-809.265771X+9502.12आणि दुसऱ्या व्हेरिएबलचे समीकरण आहे:
Y=0.4248X+9502.12गुणांक
आम्हाला मिळालेले गुणांक आहेत m1=-809.2655 आणि m2=04248 . आणि इंटरसेप्टर, C= 9502.12 .
- प्रथम, इंटरसेप्टर मूल्य हे सूचित करते की जेव्हा किंमत शून्य असेल तेव्हा मागणी 9502 असेल.
- आणि ची मूल्ये m दर बदलाच्या प्रति युनिट मागणी बदलते दर दर्शवा. किंमत गुणांक मूल्य -809.265 आहे, हे दर्शविते की किमतीतील प्रति युनिट वाढ मागणी सुमारे 809 युनिट्सने कमी करेल.
- दुसऱ्या व्हेरिएबलसाठी, विकल्या गेलेल्या, m मूल्य 0.424 आहे. हे सूचित करते की प्रति युनिट विकल्या गेलेल्या आयटममध्ये बदलपरिणामी उत्पादनात 0424-वेळेची एकक वाढ होईल.
अवशेष
अवशिष्ट मूळ आणि गणनामधील फरक रीग्रेशन लाइनमधील प्रवेश हा फरक आहे. अवशेष हे सूचित करतात की वास्तविक मूल्य रेषेपासून किती दूर आहे. उदाहरणार्थ, पहिल्या एंट्रीसाठी रिग्रेशन विश्लेषणातून गणना केलेली एंट्री 9497 आहे. आणि पहिले मूळ मूल्य 9500 आहे. त्यामुळे अवशिष्ट सुमारे 2.109 आहे.
टी-सांख्यिकी मूल्य
टी-स्टॅटिक्स व्हॅल्यू हे गुणांकाचे मानक मूल्याने भागणे आहे. मूल्य जितके जास्त असेल तितकी गुणांकाची अधिक विश्वासार्हता दर्शवते.
या मूल्याचे आणखी एक महत्त्व आहे, जे P-मूल्याची गणना करण्यासाठी आवश्यक आहे.
९५% कॉन्फिडन्स इंटरव्हल
येथे व्हेरिएबलचा कॉन्फिडन्स आपण सुरुवातीला ९५ म्हणून सेट केला आहे. तरीही ते बदलू शकते.
- येथे, खालच्या 95% चे गुणांक 8496.84 असे मोजले जाते म्हणजे वरचे 95% 10507.37 असे मोजले जाते,
- याचा अर्थ असा की जेव्हा आमचे मुख्य गुणांक 9502.1 आहे. 95% प्रकरणांमध्ये मूल्य 8496 च्या खाली असण्याची उच्च शक्यता आहे आणि 10507.37 पेक्षा जास्त असण्याची 5% शक्यता आहे
अधिक वाचा:
लक्षात ठेवण्याच्या गोष्टी
✎ रिग्रेशन अॅनालिसिस पद्धत केवळ परिक्षणाधीन व्हेरिएबल्समधील संबंधांचे मूल्यांकन करते. हे कार्यकारणभाव स्थापित करत नाही. इतर प्रकारे, फक्त पैलूच्या सहसंबंधाचा विचार केला जातो. जेव्हा एखादी कृती एखाद्या गोष्टीला कारणीभूत ठरते तेव्हा ते कार्यकारण बनते. जेव्हा एका व्हेरिएबलमधील बदलामुळे बदल घडतात, तेव्हा ते कारण मानले जाऊ शकते.
✎ आउटलायर्सद्वारे प्रतिगमन विश्लेषण मोठ्या प्रमाणात अडथळा आणते. विश्लेषण होण्यापूर्वी सर्व प्रकारचे आउटलियर काढले जाणे आवश्यक आहे. एक्सेलमध्ये प्रतिगमन विश्लेषण परिणामांचे विश्लेषण आणि व्याख्या करण्यासाठी, तुम्हाला या मुद्द्यांचा विचार करणे आवश्यक आहे.
निष्कर्ष
याचा सारांश म्हणून, "एक्सेलमध्ये प्रतिगमन परिणामांचा अर्थ कसा लावायचा" या प्रश्नाचे उत्तर विस्तृतपणे दिले आहे. विश्लेषण आणि नंतर त्याचा अर्थ लावणे. विश्लेषण डेटा टॅबमधील डेटा विश्लेषण टूलद्वारे केले जाते.
या समस्येसाठी, एक कार्यपुस्तिका डाउनलोड करण्यासाठी उपलब्ध आहे जिथे तुम्ही प्रतिगमन विश्लेषणाचा सराव करू शकता आणि अर्थ लावू शकता. ते.
टिप्पणी विभागाद्वारे कोणतेही प्रश्न किंवा अभिप्राय विचारण्यास मोकळ्या मनाने. Exceldemy समुदायाच्या सुधारणेसाठी कोणतीही सूचना अत्यंत प्रशंसनीय असेल.