सामग्री सारणी
डेटा सेटमधील डेटावर सांख्यिकीय गणना करण्यासाठी आउटलियर्स ओळखणे आवश्यक असू शकते. तुम्ही मायक्रोसॉफ्ट एक्सेल वापरून मोठ्या डेटासेटमधून आउटलायर्स शोधू शकता. या पोस्टमध्ये, आम्ही तुम्हाला मायक्रोसॉफ्ट एक्सेलमध्ये पाच वेगळ्या पद्धतींचा वापर करून आउटलायर्सची गणना कशी करायची ते दाखवू.
सराव वर्कबुक डाउनलोड करा
तुम्ही येथून विनामूल्य एक्सेल वर्कबुक डाउनलोड करू शकता आणि स्वत: सराव करू शकता. .
Find Outliers.xlsx
एक्सेलमध्ये आउटलायर्सची गणना करण्यासाठी 5 सुलभ दृष्टीकोन
आउटलायर्स डेटा मूल्ये आहेत जे डेटासेटमधील उर्वरित डेटा मूल्यांपेक्षा लक्षणीय भिन्न आहेत. Outliers, दुसऱ्या शब्दांत, असाधारण मूल्ये आहेत. डेटा सेटमधील इतर मूल्यांच्या तुलनेत ते एकतर अपवादात्मकपणे उच्च किंवा अत्याधिक कमी आहेत. बाहेरील व्यक्ती शोधणे सांख्यिकीय गणनेमध्ये महत्त्वाचे आहे कारण त्यांचा आमच्या डेटा विश्लेषणाच्या निष्कर्षांवर प्रभाव पडतो.
उदाहरणार्थ, तुमच्याकडे बारा लोकांचे दैनंदिन उत्पन्न दर्शविणारा डेटा सेट आहे. आता, तुम्हाला मायक्रोसॉफ्ट एक्सेल वापरून आउटलियर्सची गणना करणे आवश्यक आहे. येथे, मी तुम्हाला असे करण्यासाठी पाच सोप्या पद्धती दाखवतो.
1. क्रमवारी वापरा & एक्सेलमध्ये आउटलियर्सची गणना करण्यासाठी फिल्टर करा
तुम्ही क्रमवारी आणि & एक्सेलमध्ये फिल्टर कमांड. जर तुम्हाला सॉर्ट आणि फिल्टर फंक्शन वापरून आउटलियर्सची गणना करायची असेल, तर तुम्ही ते फॉलो करून करू शकताखालील पायऱ्या.
स्टेप 1:
- सर्वप्रथम, तुमच्या एक्सेलच्या डेटासेटमधील कॉलम हेडर निवडा जो तुम्हाला क्रमवारी लावायचा आहे. उदाहरणार्थ, दिलेल्या डेटा सेटमध्ये, दैनिक उत्पन्न नावाच्या फाईल कॉलम हेडरमध्ये (सेल C40 निवडला आहे).
चरण 2:
- नंतर, होम <7 दाबा> रिबनवरील टॅब आणि संपादन गटावर जा.
चरण 3:<7
- त्यानंतर, संपादन गट मध्ये > क्रमवारी लावा & कमांड फिल्टर करा आणि सानुकूल >>> क्रमवारी लावा वर क्लिक करा.
चरण 4:
- त्यानंतर, सॉर्ट नावाचा नवीन डायलॉग बॉक्स उघडेल. पॉप-अप डायलॉग बॉक्समध्ये, क्रमवारीनुसार मध्ये दैनिक उत्पन्न निवडा> ड्रॉप-डाउन आणि ऑर्डर ड्रॉप-डाउनमध्ये सर्वात लहान ते सर्वात मोठे . त्यानंतर, ठीक आहे वर क्लिक करा.
पायरी 5:
<13
उदाहरणार्थ, स्तंभातील पहिली दोन मूल्ये लक्षणीयरीत्या कमी आहेत आणि स्तंभातील शेवटची दोन मूल्ये डेटा सेटमधील उर्वरित मूल्यांपेक्षा लक्षणीयरीत्या जास्त आहेत.वरील निकाल.
अधिक वाचा: एक्सेलमधील रीग्रेशन अॅनालिसिसमध्ये आउटलायर्स कसे शोधायचे (3 सोपे मार्ग)
2. क्वॉर्टिले फंक्शन लागू करा एक्सेलमध्ये आउटलायर्सची गणना करा
क्वार्टाइल फंक्शन दृष्टीकोन हा एक्सेलमध्ये आउटलायर्सची गणना करण्याचा अधिक वैज्ञानिक मार्ग आहे. तुमचा डेटा सेट चार समान भागांमध्ये विभागण्यासाठी तुम्ही हे फंक्शन वापरू शकता. खालील मूल्ये QUARTILE कार्य द्वारे परत केली जातील:
- किमान मूल्य.
- द पहिला चतुर्थांश (Q1- दिलेल्या डेटासेटचा सर्वात कमी 25%).
- द दुसरा चतुर्थांश (Q2-पुढील डेटासेटचा सर्वात कमी 25%).
- तृतीय चतुर्थांश (Q3- डेटासेटचा दुसरा सर्वोच्च 25%).
- <6 कमाल मूल्य.
एक्सेलमधील QUARTILE फंक्शन चे सिंटॅक्स आहे:
=QUARTILE( array,quart)
वाक्यरचनामध्ये खालील आर्ग्युमेंट्स असतात:
- a रे : दिलेल्या सेल श्रेणी डेटा सेट ज्यासाठी तुम्ही चतुर्थक मूल्याची गणना कराल.
- चतुर्थांश: हे निर्दिष्ट करते की कोणते मूल्य परत केले जावे.
<22
वरील डेटासेटसाठी QUARTILE फंक्शन वापरून आउटलायर्सची गणना करण्यासाठी, खालील चरणांचे अनुसरण करा.
चरण 1:
- सर्वप्रथम, पहिला चतुर्थांश ( Q1 ) निश्चित करण्यासाठी खालील सूत्र टाइप करा.
=QUARTILE($C$5:$C$16,1)
पायरी 2:
- येथेपुन्हा, तृतीय चतुर्थांश ( Q3 ) मोजण्याचे सूत्र खाली दिले आहे.
=QUARTILE($C$5:$C$16,3)
पायरी 3:
- तिसरे, तुम्हाला IQR, जे निश्चित करावे लागेल आंतर-चतुर्थक श्रेणी (हे पहिल्या आणि तिसऱ्या चतुर्थांशात मोडणाऱ्या डेटा सेटच्या श्रेणीतील दिलेल्या डेटाचे 50% प्रतिनिधित्व करते) Q1 वजा करून (सेल G4 ) पासून Q3 (सेल G5 ). वजाबाकी काढण्यासाठी खालील सूत्र टाइप करा.
=G5-G4
पायरी 4:
- IQR शोधल्यानंतर, पुढे तुम्हाला वरील आणि कमी कारण वरच्या आणि कमी मर्यादेत बहुतांश डेटा असेल डेटा सेट. वरच्या मर्यादेची गणना करण्यासाठी खालील सूत्र लिहा.
=G5+(1.5*G6)
चरण 5:
- मग, कमी मर्यादा मोजण्यासाठी, खालील सूत्र लिहा.
=G4-(1.5*G6)
पायरी 6:
- शेवटी, मागील पायरी पूर्ण केल्यानंतर, तुम्ही प्रत्येक डेटासाठी आउटलायर्स निर्धारित करू शकता मूल्य. एक्सेल वर्कशीटमध्ये, सेल D5 मध्ये OR फंक्शन सह खालील सूत्र टाइप करा.
=OR(C5$G$7)
- हा फॉर्म्युला वर नमूद केलेल्या रेंज मर्यादेत न येणारा डेटा ओळखण्यात मदत करेल. प्रक्रिया केल्यानंतरफॉर्म्युला विशिष्ट डेटा आउटलायर असल्यास सत्य विधान दर्शवेल आणि असत्य नसल्यास. सेलमधील ऑटोफिल टूल C5 वर सूत्र उर्वरित सेलवर कॉपी करण्यासाठी डबल-क्लिक करा स्तंभ C मध्ये. अशा प्रकारे, तुम्ही तुमच्या डेटासेटमधील सर्व आउटलियर्सच्या पुढे एक खरे मूल्य पाहू शकता.
3. सरासरी आणि मानक विचलनातून आउटलायर्सची गणना करण्यासाठी AVERAGE आणि STDEV.P फंक्शन्स एकत्र करा
A मानक विचलन (किंवा σ ) संपूर्ण डेटा सेटच्या सरासरी मूल्याशी संबंधित डेटा कसा वितरित केला जातो हे निर्धारित करण्यासाठी एक मेट्रिक आहे. जेव्हा मानक विचलन कमी असते तेव्हा डेटा सरासरीच्या आसपास गटबद्ध केला जातो, तर जेव्हा मानक विचलन जास्त असते तेव्हा डेटा अधिक पसरतो. मीन आणि मानक विचलन वापरून आउटलायर्सची गणना करण्यासाठी तुम्ही खालील पायऱ्या फॉलो करू शकता.
चरण 1:
- सर्वप्रथम, या लेखाच्या सुरुवातीला दाखवलेला डेटासेट वापरा आणि नंतर सरासरी आणि मानक विचलनाची गणना करा. सरासरीची गणना करण्यासाठी, सेल G5 मध्ये AVERAGE फंक्शन सह खालील सूत्र टाइप करा.
=AVERAGE(C5:C16)
पायरी 2:
- मानक विचलनाची गणना करण्यासाठी, STDEV सह खालील सूत्र घाला .P फंक्शन सेल G6 .
=STDEV.P(C5:C16)
चरण 3:
- पुढे, तुम्ही गणना करालप्रक्रियेतील पुढील प्रगतीसाठी वरची मर्यादा. सेल G7 मध्ये, खालील सूत्र वापरून निम्न मर्यादा मोजा.
=G5-(1.25*G6)
चरण 4:
- आणि सेलमध्ये G8 खालील सूत्रावरून वरच्या मर्यादा मोजा
=G5+(1.5*G6)
चरण 5:
- त्यानंतर , कोणतेही आउटलायर्स अस्तित्वात आहेत की नाही याची गणना करण्यासाठी, सेलमध्ये खालील सूत्र टाइप करा D5 .
=OR(C5$G$8)
- अशा प्रकारे, इच्छित सेलमधील विशिष्ट डेटा आउटलायर आणि असल्यास सूत्र TRUE मूल्य देईल. असत्य.
- सेल ऑटोफिल टूलवर D5 वर डबल क्लिक करा स्तंभ D मधील उर्वरित सेलमध्ये सूत्र कॉपी करण्यासाठी. अशाप्रकारे, तुम्ही तुमच्या डेटासेटमध्ये उर्वरित सर्व आउटलायर्स शोधू शकता.
अधिक वाचा: एक्सेलमधील मानक विचलनासह आउटलायर्स कसे शोधायचे (द्रुत चरणांसह)
4. एक्सेलमध्ये आउटलियर्सची गणना करण्यासाठी Z-स्कोअर घाला
Z-स्कोअर हा सर्वात जास्त वापरल्या जाणार्या मेट्रिक्सपैकी एक आहे बाहेरील व्यक्ती ओळखणे. ही पद्धत डेटासेटच्या सरासरी विचलनाच्या संदर्भात विशिष्ट डेटा किती दूर आहे हे दर्शवते. एक्सेलमध्ये Z-स्कोअर वापरून आउटलायर्सची गणना करण्यासाठी तुम्ही खाली वर्णन केलेल्या पायऱ्या पाहू शकता.
पायरी 1:
- प्रथम, इच्छित डेटा सेट घ्या.
चरण2:
- दुसरे, सेल H5, मध्ये मीन <ची गणना करण्यासाठी खालील सूत्र टाइप करा 7>दिलेल्या डेटासाठी.
=AVERAGE(C5:C16)
चरण 3:
- तिसरे, खालील सूत्र वापरून सेल H6 मध्ये दिलेल्या डेटासेटचे मानक विचलन मोजा.
=STDEV.P(C5:C16)
चरण 4:
- त्यानंतर , तुम्हाला प्रत्येक डेटा मूल्यासाठी Z -स्कोअर निर्धारित करावे लागेल. हे करण्यासाठी तुम्ही खालील सूत्र वापरता.
=(C5-$H$5)/$H$6
चरण 5:
- सर्व Z-मूल्यांची गणना केल्यानंतर, तुम्हाला Z-मूल्यांची श्रेणी दिसेल> -1.44 आणि 13 दरम्यान आहे. म्हणून, आम्ही बाह्य मर्यादांसाठी Z-स्कोअर -1.2 पेक्षा कमी किंवा +1.8 पेक्षा जास्त मूल्यांचा विचार करतो.
- नंतर, खालील सूत्र सेलमध्ये टाइप करा E 5 .
=OR((D51.8))
<39
- शेवटी, विशिष्ट डेटा आउटलायर असल्यास सूत्र सत्य मूल्य परत करेल आणि असत्य <9 परत करेल ऑटोफिल वापरण्यासाठी
- सेल E5 वर डबल-क्लिक करा स्तंभ E मधील उर्वरित सेलमध्ये सूत्र कॉपी करण्यासाठी टूल फिल हँडल. अशा प्रकारे, तुम्ही तुमच्या डेटासेटमध्ये उर्वरित सर्व आउटलायर्स शोधू शकता.
अधिक वाचा: एक्सेलमध्ये झेड स्कोअर वापरून आउटलायर्स कसे शोधायचे (क्विकसह)स्टेप्स)
5. Excel मध्ये आउटलायर्स शोधण्यासाठी मोठ्या आणि लहान फंक्शन्स मर्ज करा
LARGE फंक्शन आणि SMALL फंक्शन Excel मध्ये विरुद्ध ऑपरेशन्स आहेत. डेटा सेटमधील सर्वात मोठा आणि सर्वात लहान डेटा किंवा मूल्ये शोधण्यासाठी आम्ही त्याचा वापर करू. हे फंक्शन डेटा सेटमधील सर्व डेटा खेचते, सर्वात लहान आणि सर्वात मोठी संख्या शोधते. ते दुसरे सर्वात लहान किंवा सर्वात मोठे, तिसरे सर्वात मोठे किंवा सर्वात लहान इत्यादी शोधण्यात सक्षम आहेत.
पायरी 1:
- सर्वप्रथम, LARGE फंक्शन सह सेल E5 मध्ये खालील सूत्र वापरा.
=LARGE($C$5:$C$16,1)
-
- अशा प्रकारे, 12 मूल्यांमधून, तुम्ही पहिले सर्वात मोठे मूल्य पाहू शकता जे <6 आहे. 780 .
चरण 2:
<13 =SMALL($C$5:$C$16,1)
- शेवटी, 12 मूल्यांमधून, तुम्ही 1ले पाहू शकता सर्वात लहान मूल्य 110 .
- एकदा तुम्हाला सर्व आवश्यक मूल्ये सापडली की, तुम्ही डेटासेटमधील कोणतेही आउटलाअर सहजपणे दर्शवू शकता.
निष्कर्ष
तो या लेखाचा शेवट आहे. मला आशा आहे की तुम्हाला हा लेख उपयुक्त वाटला. हा लेख वाचल्यानंतर, तुम्ही कोणत्याही पद्धतीचा वापर करून एक्सेलमध्ये आउटलायर्सची गणना करण्यास सक्षम असाल. कृपया पुढील कोणत्याही शंका किंवा शिफारसी सोबत शेअर कराआम्हाला खालील टिप्पण्या विभागात.