विषयसूची
प्रतिगमन विश्लेषण लगभग हर प्रकार के सांख्यिकीय सॉफ़्टवेयर जैसे SPSS , R, और एक्सेल का उल्लेख नहीं है। प्रतिगमन हमें चरों के बीच संबंधों के बारे में बड़ी तस्वीर दे सकता है। डेटा विश्लेषण टूल का उपयोग करके एक्सेल में रेखीय प्रतिगमन बहुत जल्दी किया जा सकता है। यह लेख दिखाएगा कि कैसे आप Excel में प्रतिगमन परिणामों की व्याख्या कर सकते हैं।
अभ्यास कार्यपुस्तिका डाउनलोड करें
नीचे इस अभ्यास कार्यपुस्तिका को डाउनलोड करें।
प्रतिगमन परिणामों की व्याख्या करें। xlsx
प्रतिगमन क्या है?
रिग्रेशन विश्लेषण का उपयोग अक्सर डेटा विश्लेषण में कई चर के बीच संघों को निर्धारित करने के लिए किया जाता है। प्रतिगमन विश्लेषण आपको यह चुनने की अनुमति देता है कि यदि स्वतंत्र चर में से एक बदल जाता है तो आश्रित चर का क्या होता है। यह आपको गणितीय रूप से यह पता लगाने में भी मदद करता है कि कौन से स्वतंत्र चर का प्रभाव है।
सरल रेखीय प्रतिगमन आँकड़ों में एकाधिक रेखीय प्रतिगमन से अलग है। एक रैखिक फ़ंक्शन का उपयोग करके, सरल रैखिक प्रतिगमन विश्लेषण चर और एक स्वतंत्र चर के बीच संबंध। एकाधिक रेखीय प्रतिगमन तब होता है जब दो या दो से अधिक व्याख्यात्मक कारकों का उपयोग चर निर्धारित करने के लिए किया जाता है। आश्रित चर के बजाय गैर-रैखिक प्रतिगमन का उपयोग करना एक गैर-रैखिक कार्य के रूप में वर्णित है क्योंकि डेटा संबंध रैखिक नहीं हैं। यह लेख एकाधिक रैखिक पर केंद्रित होगाप्रतिगमन यह प्रदर्शित करने के लिए कि आप कैसे एक्सेल में प्रतिगमन परिणामों की व्याख्या कर सकते हैं। विश्लेषण के उद्देश्य। यहां स्वतंत्र चर कीमत कॉलम और बेचा गया कॉलम होगा। स्वतंत्र कॉलम मांग कॉलम होगा।
कदम
- हमें डेटा टैब पर जाना होगा और डेटा विश्लेषण पर क्लिक करके प्रतिगमन करना होगा।
- एक नई विंडो होगी; निर्भर चर और स्वतंत्र चर डेटा श्रेणी का चयन करें।
- फिर लेबल बॉक्स और आत्मविश्वास बॉक्स पर टिक करें।
- फिर आउटपुट सेल रेंज पर क्लिक करें आउटपुट सेल एड्रेस का चयन करने के लिए बॉक्स
- अगला, अवशिष्ट की गणना करने के लिए अवशिष्ट पर टिक करें।
- उसके बाद, अवशिष्ट प्लॉट पर टिक करें और लाइन फिट प्लॉट बॉक्स
- इसके बाद ओके क्लिक करें।
- क्लिक करने के बाद ठीक है, विश्लेषण के प्राथमिक आउटपुट पैरामीटर निर्दिष्ट सेल पर होंगे।
- फिर आपको कुछ पैरामीटर भी मिलेंगे जैसे महत्व मान आदि ANOVA ( विचरण का विश्लेषण ) तालिका में।
- यहाँ, df दर्शाता है भिन्नता के स्रोत से संबंधित स्वतंत्रता की डिग्री।
- SS वर्गों के योग को दर्शाता है। आपका मॉडल डेटा को बेहतर ढंग से प्रदर्शित करेगा यदि अवशिष्ट SS, कुल SS से छोटा है।
- MS का अर्थ है वर्ग।
- F अशक्त परिकल्पना के लिए F -परीक्षण को दर्शाता है।
- महत्व F P - F का मूल्य दर्शाता है।
- फिर आपको तालिका में चर के गुणांक, सार्थकता मान आदि भी मिलेंगे।
- फिर आपको गुणांक तालिका के नीचे एक अंतिम तालिका मिलेगी जिसमें प्रत्येक प्रविष्टि के लिए अवशिष्ट मान होगा।
- इसके बाद, आपको ट्रेंडलाइन के साथ डिमांड बनाम कीमत रिग्रेशन चार्ट मिलेगा।
- बाद इसमें, आपको मांग बनाम बेचा गया ट्रेंडलाइन के साथ प्रतिगमन चार्ट मिलता है।
- एक और है बेचे गए वैरिएबल से प्रत्येक प्रविष्टि के अवशिष्टों का वितरण दिखाने वाला चार्ट। मूल्य वैरिएबल से प्रत्येक प्रविष्टि का।
आगे, हम आपको दिखाएंगे कि आप कैसे एक्सेल में इन प्रतिगमन परिणामों की व्याख्या करें। एक्सेल में प्रतिगमन परिणाम
प्रतिगमन विश्लेषण करने और उनकी व्याख्या करने के बाद आपको अगला काम करना है। परिणामों का वर्णन और विवरण नीचे दिया गया है।
मल्टीपल आर-स्क्वेर्ड रिग्रेशन वैल्यू एनालिसिस
द आर-स्क्वेर्ड संख्या इंगित करती है कि डेटासेट के तत्व कितनी निकटता से संबंधित हैं और प्रतिगमन रेखा डेटा से कितनी अच्छी तरह मेल खाती है। हम एकाधिक रेखीय प्रतिगमन विश्लेषण का उपयोग करने जा रहे हैं, जिसमें हम मुख्य कारक पर दो या दो से अधिक चरों के प्रभाव को निर्धारित करने जा रहे हैं। यह संदर्भित करता है कि निर्भर चर कैसे बदलता है क्योंकि स्वतंत्र चर में से एक में परिवर्तन होता है। इस गुणांक की सीमा -1 से 1 तक है। यहाँ,
- 1 का अर्थ है निकट सकारात्मक संबंध
- 0 का अर्थ है कि चरों के बीच कोई संबंध नहीं है। दूसरे शब्दों में, डेटा बिंदु यादृच्छिक हैं।
- -1 का अर्थ है चर के बीच उलटा या नकारात्मक संबंध।
ऊपर दिखाए गए आउटपुट परिणामों में, दिए गए कई आर-वैल्यू डेटा सेट o.7578( लगभग ) है, जो चरों के बीच मजबूत संबंधों को इंगित करता है।
R चुकता
R चुकता मूल्य बताता है कि कैसे आश्रित चर की प्रतिक्रिया स्वतंत्र चर में भिन्न होती है। हमारे मामले में, मान 0.574(लगभग) है, जिसे चरों के बीच यथोचित ठीक संबंध के रूप में समझा जा सकता है।
समायोजित आर-वर्ग
यह केवल है R चुकता मान का एक वैकल्पिक संस्करण। प्रतिक्रिया चर की भविष्यवाणी करते समय यह केवल भविष्यवक्ता चर को फेरबदल करता है। यह
R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)] <3 के रूप में गणना करता है
यहां, R^2 : R^2 वैल्यू हमें इससे मिलीडेटासेट।
n : टिप्पणियों की संख्या।
K : भविष्यवक्ता चर की संख्या।
महत्व दो भविष्यवक्ता चरों के बीच प्रतिगमन विश्लेषण करते समय यह मान उत्पन्न होता है। यदि डेटासेट में एक से अधिक पूर्वसूचक चर हैं, तो आर चुकता मान बढ़ा दिया जाएगा, जो अत्यधिक अवांछनीय है। समायोजित R वर्ग मान इस मुद्रास्फीति को समायोजित करता है और चरों की एक सटीक तस्वीर देता है।
मानक त्रुटि
एक और उपयुक्त मीट्रिक जो आपके प्रतिगमन विश्लेषण की सटीकता को इंगित करता है; मूल्य जितना कम होगा, आप अपने प्रतिगमन विश्लेषण में उतना ही अधिक सुनिश्चित हो सकते हैं।
मानक त्रुटि एक अनुभवजन्य मीट्रिक है जो औसत दूरी का प्रतिनिधित्व करती है जिस पर अंक ट्रेंडलाइन से विचलित होते हैं। इसके विपरीत, R2 निर्भर चर भिन्नता के अनुपात का प्रतिनिधित्व करता है। इस मामले में, मानक त्रुटि का मान 288.9 ( लगभग ) है, जो दर्शाता है कि हमारे डेटा बिंदु औसतन ट्रेंडलाइन से 288.9 गिर जाते हैं।
अवलोकन
टिप्पणियों या प्रविष्टियों की संख्या इंगित करें। हमारे विश्लेषण की विश्वसनीयता (सांख्यिकीय रूप से ध्वनि) को इंगित करता है। दूसरे शब्दों में, यह हमारे डेटासेट के गलत होने की संभावना को दर्शाता है। यह मान 5% से कम होना चाहिए। लेकिन इस मामले में, हमारा महत्व मान 0.00117 है,जो 0.1% है, जो 5% से काफी नीचे है। तो हमारा विश्लेषण ठीक है। अन्यथा, हमें अपने विश्लेषण के लिए विभिन्न चरों का चयन करना पड़ सकता है। मूल्य गुणांक मान के गलत होने की संभावना को दर्शाता है। P-मान चर के साथ शून्य परिकल्पना के संबंध को दर्शाता है।
यदि आपका p-मान < महत्व संख्या, शून्य मान परिकल्पना को अस्वीकार करने के लिए पर्याप्त सबूत हैं। इसका अर्थ है कि चरों के बीच एक गैर-शून्य सहसंबंध है।
लेकिन यदि p-मान > महत्व मूल्य, तो इसे खारिज करने के लिए अपर्याप्त साक्ष्य होंगे। शून्य परिकल्पना। यह दर्शाता है कि वेरिएबल्स के बीच कोई संबंध नहीं हो सकता है। 0.00117 (महत्व मान),
इसलिए यहां कोई अशक्त परिकल्पना नहीं चल रही है, और चर के बीच सहसंबंध घोषित करने के लिए पर्याप्त सबूत हैं।
दूसरी ओर, चर के लिए बेचा , (पी-वैल्यू) 0.0038515 < 0.0011723 (महत्व मूल्य)
इसलिए यहां एक अशक्त परिकल्पना चल रही हो सकती है, और चर के बीच गैर-शून्य सहसंबंध घोषित करने के लिए पर्याप्त सबूत नहीं हैं।
ज्यादातर मामलों में, यह पी -मान निर्धारित करता है कि कोई चर डेटासेट में होगा या नहीं। उदाहरण के लिए, हमें बेचा हुआ हटा देना चाहिएडेटासेट की मजबूती को बनाए रखने के लिए वेरिएबल।
रिग्रेशन इक्वेशन
जैसा कि हम एक्सेल में लीनियर रिग्रेशन एनालिसिस निर्धारित करते हैं, ट्रेंड लाइन भी लीनियर होनी चाहिए। सामान्य रूप है:
Y=mX+C।
यहाँ, Y निर्भर चर है।
और X यहां स्वतंत्र चर है, जिसका अर्थ है कि हम चर x के परिवर्तन का चर Y पर प्रभाव निर्धारित करेंगे।
C केवल Y-अक्ष के चौराहे का मान होगा लाइन।
इस मामले में, C इंटरसेप्ट का मान 9502.109853
के बराबर है और दो वेरिएबल्स के लिए m का मान -809.265 और 0.424818 है।
तो, हमारे पास दो अलग-अलग चर के लिए अंतिम समीकरण है।
पहला है:
Y=-809.265771X+9502.12 <3और दूसरे चर के लिए समीकरण है:
Y=0.4248X+9502.12गुणांक
हमें मिले गुणांक m1=-809.2655 और m2=04248 हैं। और इंटरसेप्टर, C = 9502.12 ।
- सबसे पहले, इंटरसेप्टर मूल्य इंगित करता है कि कीमत शून्य होने पर मांग 9502 होगी।
- और के मान m उस दर को दर्शाता है जिस पर मूल्य परिवर्तन की प्रति इकाई मांग में परिवर्तन होता है। मूल्य गुणांक मान -809.265 है, यह दर्शाता है कि मूल्य में प्रति इकाई वृद्धि से मांग में लगभग 809 इकाइयों की कमी आएगी।
- दूसरे चर के लिए, बेचा गया, m मान 0.424 है। यह दर्शाता है कि प्रति यूनिट बेची गई वस्तु में परिवर्तनपरिणामस्वरूप उत्पाद में 0424-समय की इकाई वृद्धि होगी। प्रतिगमन रेखा से प्रवेश अंतर है। अवशिष्ट इंगित करते हैं कि रेखा से वास्तविक मान कितना दूर है। उदाहरण के लिए, पहली प्रविष्टि के लिए प्रतिगमन विश्लेषण से परिकलित प्रविष्टि 9497 है। और पहला मूल मान 9500 है। इसलिए अवशिष्ट लगभग 2.109 है।
टी-सांख्यिकी मूल्य <3
टी-स्टैटिक्स मान मानक मान द्वारा गुणांक का विभाजन है। मूल्य जितना अधिक होता है, गुणांक की बेहतर विश्वसनीयता इंगित करती है।
इस मूल्य का एक और महत्व है, जो पी-मूल्य की गणना करने के लिए आवश्यक है।
95% कॉन्फिडेंस इंटरवल
यहां वेरिएबल का कॉन्फिडेंस हम शुरुआत में 95 के रूप में सेट करते हैं। हालांकि, यह बदल सकता है।
- यहां, निचले 95% के गुणांक मान की गणना 8496.84 के रूप में की जाती है, जिसका अर्थ है कि ऊपरी 95% की गणना 10507.37 के रूप में की जाती है,
- इसका मतलब है कि जबकि हमारा मुख्य गुणांक 9502.1 के बारे में है। 95% मामलों में मूल्य 8496 से कम होने की संभावना अधिक है और 10507.37 से अधिक होने की 5% संभावना है
अधिक पढ़ें:
याद रखने योग्य बातें
✎ प्रतिगमन विश्लेषण पद्धति केवल परीक्षा के तहत चरों के बीच संबंध का आकलन करती है। यह कार्य-कारण स्थापित नहीं करता है। अन्य तरीकों से, केवल पहलूसहसंबंध पर विचार करता है। जब कोई कार्य किसी चीज़ का कारण बनता है, तो वह कार्य-कारण बन जाता है। जब एक चर का परिवर्तन परिवर्तन पैदा करता है, तो इसे कारण माना जा सकता है। विश्लेषण किए जाने से पहले सभी प्रकार के आउटलेयर हटा दिए जाने चाहिए। एक्सेल में रिग्रेशन विश्लेषण परिणामों का विश्लेषण और व्याख्या करने के लिए, आपको इन बिंदुओं पर विचार करने की आवश्यकता है।
निष्कर्ष
इसका योग करने के लिए, "एक्सेल में रिग्रेशन परिणामों की व्याख्या कैसे करें" प्रश्न का उत्तर विस्तृत रूप से दिया गया है। विश्लेषण करना और बाद में उसकी व्याख्या करना। विश्लेषण डेटा टैब में डेटा विश्लेषण टूल के माध्यम से किया जाता है।
इस समस्या के लिए, एक कार्यपुस्तिका डाउनलोड के लिए उपलब्ध है जहां आप प्रतिगमन विश्लेषण का अभ्यास कर सकते हैं और व्याख्या कर सकते हैं it.
टिप्पणी अनुभाग के माध्यम से कोई भी प्रश्न या प्रतिक्रिया पूछने के लिए स्वतंत्र महसूस करें। Exceldemy समुदाय की बेहतरी के लिए कोई भी सुझाव अत्यधिक प्रशंसनीय होगा।