एक्सेलमध्ये आउटलियर्स कसे काढायचे (3 मार्ग)

  • ह्याचा प्रसार करा
Hugh West

सांख्यिकी, डेटा मायनिंग, मशीन लर्निंग इत्यादीमधील डेटाचे विश्लेषण करण्यासाठी आउटलायर्स शोधणे आणि त्यांना काढून टाकणे हे एक सामान्य काम आहे. असे बरेच मार्ग आहेत की तुम्ही तुमच्या डेटासेटमध्ये आउटलायर्स शोधू शकता परंतु त्यांना काढण्याची प्रक्रिया इतकी सोपी नाही. शोधणे. या लेखात, आम्ही तुम्हाला एक्सेलमधील आउटलायर्स कसे काढायचे दाखवू.

वर्कबुक डाउनलोड करा

तुम्ही विनामूल्य सराव एक्सेल वर्कबुक येथून डाउनलोड करू शकता येथे.

Outliers.xlsx काढून टाका

Excel मध्ये Outliers म्हणजे काय?

An outlier हे असे मूल्य आहे जे डेटासेटच्या सरासरी किंवा मध्य मूल्यापेक्षा कमी होते. दुसऱ्या शब्दांत, आऊटलायर्स ही मूल्ये आहेत जी डेटासेटमधील उर्वरित मूल्यांपेक्षा लक्षणीयरीत्या जास्त किंवा कमी असतात.

एका क्रिकेट सामन्याचा विचार करा जिथे सर्व फलंदाजांनी ५० च्या आसपास धावा केल्या परंतु फक्त एका फलंदाजाने शतक केले (१०० ) आणि दुसरा फलंदाज ० वर आऊट झाला. या सामन्यातील १०० आणि ० स्कोअर हे आउटलायर्स आहेत.

आउटलियर्स समस्याप्रधान आहेत कारण ते डेटा विश्लेषणाचा परिणाम तिरस्कार करू शकतात आणि दिशाभूल करणारे निकाल देऊ शकतात. त्यामुळे गुळगुळीत डेटासेट ठेवण्यासाठी आउटलायर्स शोधणे आणि त्यांना काढून टाकणे अधिक चांगले आहे.

एक्सेलमधील आउटलियर्स काढण्याचे ३ मार्ग

या विभागात, तुम्ही कसे करायचे ते शिकाल तुमच्या डेटासेटमधून 3 वेगवेगळ्या प्रकारे आउटलायर्स हटवा . आउटलायर्स काढणे ही एक अवघड प्रक्रिया आहे, त्यामुळे संपूर्ण लेख काळजीपूर्वक वाचा.

1. शिवाय सरासरीची गणना करण्यासाठी Excel फंक्शन वापरणेOutliers

Excel TRIMMEAN फंक्शन आउटलायर्स वगळून दिलेल्या डेटासेटची सरासरी काढण्यासाठी वापरला जाऊ शकतो. वगळण्यासाठी डेटा पॉइंट्स टक्केवारी म्हणून पुरवले जातात. टक्केवारी मूल्य दशांश स्वरूप किंवा टक्के स्वरूप म्हणून इनपुट केले जाऊ शकते.

आउटलायर्सशिवाय सरासरीची गणना करण्यासाठी सिंटॅक्स आहे,

=TRIMMEAN(अॅरे, टक्के)

येथे,

  • अॅरे = ट्रिम करण्यासाठी आणि सरासरी निकालाची गणना करण्यासाठी डेटाची श्रेणी
  • टक्के = द वगळण्यासाठी डेटा पॉइंट्सची संख्या

हे फंक्शन काढून टाकलेल्या आऊटलायर्ससह निकालांची गणना करण्यासाठी हे कार्य कसे अंमलात आणायचे ते पाहू.

वरील चित्राचा विचार करा. आमच्याकडे सेल B5 ते B14 पर्यंतचा डेटा आहे. येथे बहुतेक संख्या 20 ते 27 च्या दरम्यान आहेत, परंतु दोन मूल्ये – 0 आणि 100 – या मूल्यांपेक्षा खूप दूर आहेत. त्यामुळे आमच्या डेटासेटमध्ये हे आउटलायर्स आहेत.

आमच्या डेटासेटसाठी, एक्सेल TRIMMEAN फंक्शनसह आउटलियर मूल्यांशिवाय सरासरी (सरासरी) मोजण्याचे सूत्र आहे,

=TRIMMEAN(B5:B14,0.2)

येथे,

  • B5:B14 = ट्रिम करण्यासाठी आणि सरासरी निकालाची गणना करण्यासाठी डेटाची श्रेणी
  • 0.2 (किंवा 20%) = वगळण्यासाठी डेटा पॉइंट्सची संख्या

डेटासेटमधील कोणतीही संख्या उर्वरित डेटासेटपेक्षा 20% कमी असल्यास , नंतर त्या संख्येला आउटलियर म्हटले जाईल.

तुम्ही तुमच्या डेटासेटनुसार सूत्र लिहून एंटर दाबल्यास, तुम्हाला आउटलायर्सशिवाय गणित सरासरी मिळेल. तुमच्या डेटासेटसाठी. आमच्या बाबतीत, सेल E6 मध्ये गणना केलेली सरासरी असते जी 23.50 असते.

उत्तर बरोबर आहे की नाही हे तपासण्यासाठी, आम्ही AVERAGE फंक्शन चालवतो. सेल E5 मध्ये जे B5:B14 श्रेणीतील सर्व मूल्यांची सरासरी ( 28.80 ) मिळवते. आणि सेल E7 मध्‍ये, आऊटलायर्स व्हॅल्यू धारण करणार्‍या सेल वगळता सर्व सेल मॅन्युअली इनपुट करून आम्ही दुसरे AVERAGE फंक्शन चालवतो आणि परिणामी 23.50 परतावा मिळतो.

म्हणून आम्ही असे म्हणू शकतो की TRIMMEAN फंक्शन एक्सेलमध्ये सरासरी काढताना दिलेल्या डेटासेटमधून आउटलायर्स यशस्वीरित्या काढू शकते.

अधिक वाचा: एक्सेलमधील फॉर्म्युला कसा साफ करायचा (7+ पद्धती)

2. एक्सेलमधील डेटासेट आणि लाइन चार्टमधून आउटलियर्स काढा

खालील चित्राकडे लक्ष द्या. आमच्याकडे काही डेटा आहे ज्यावर आधारित आम्ही एक रेखा आलेख तयार केला आहे. रेषा आलेखावरून, आपण सहजपणे पाहू शकतो की डेटा पॉइंट 4 आणि 8 मध्ये आपले आउटलायर्स आहेत .

आता आपण कसे गुळगुळीत करू शकतो ते पाहू. डेटासेटमधून बाह्य मूल्ये काढून लाइन चार्ट तयार करा.

दुसऱ्या सेलमध्ये (आमच्या बाबतीत ते सेल H6 आहे), खालील सूत्र लिहा,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

येथे,

  • C6 = डेटासेटमध्ये पहिला डेटा ठेवणारा सेल
  • C5 = पहिल्या डेटा सेलच्या वरचा सेल
  • C7 = पहिल्या डेटा सेलच्या खाली सेल
  • $E$6 = डेटा पॉइंट्समधील फरक .

पाहत आहेआमचा डेटा, असे दिसते की जेव्हा डेटा पॉइंट इतरांपेक्षा 10 युनिट्स भिन्न असतो, तेव्हा तो आउटलायर म्हणून नियुक्त केला जातो. म्हणून आम्ही सेल E6 मध्‍ये 10 ठेवतो आणि त्याला संपूर्ण सेल संदर्भ बनावतो जेणेकरुन संपूर्ण डेटासेटचे स्कॅनिंग आणि गणना करताना हा सेल निश्चित केला जाईल.<3

एंटर दाबल्यानंतर, तुम्हाला पहिला डेटा अजूनही परिणाम सेलमध्ये दिसत आहे H6 दिसेल. तुम्हाला इथे फक्त फॉर्म्युला तयार करायचा आहे जेणेकरुन बाकीच्या सेलवर फॉर्म्युला लागू करण्यासाठी आम्ही फिल हँडल ड्रॅग करू शकतो.

आता फिल हँडल ने पंक्ती खाली ड्रॅग करा आणि तुम्हाला दिसेल की ज्या सेल आउटलियर्स धारण करत होत्या ते आता #N/A ने भरलेले आहेत.

आणि आता रेखा चार्ट पहा, हा आता त्यात कोणत्याही बाह्य मूल्यांशिवाय एक सपाट आलेख आहे.

फॉर्म्युला ब्रेकडाउन

=IF(

जसे की आपण मूल्यांची तुलना करणार आहोत ज्याच्या आधारावर आपण परिणाम काढू, आम्ही यासह सूत्र सुरू करतो IF स्थिती.

=IF(AND(

आम्ही वर्तमान डेटा पॉइंट आणि वरील सेल आणि खालील सेलची तुलना करणार आहोत. . आणि जर दोन्ही तुलना सत्य असतील, तरच परिणाम म्हणून आपण डेटा पॉईंट दाखवू. त्यामुळे, आपल्याला “दोन्ही” तुलने हाताळायची असल्याने आपण AND फंक्शन वापरावे.

=IF(AND(ABS(

जेव्हा आपण डेटा पॉइंट्स वजा करतो, तेव्हा काही डेटा नकारात्मक मूल्ये टाकू शकतो. आणि आम्ही करतो) नाहीनकारात्मक मूल्यांना सामोरे जायचे आहे कारण नकारात्मक मूल्ये नेहमी "अंतर 10 असताना डेटा काढून टाकणे" या स्थितीचा विरोध करतात. त्यामुळे आम्हाला नेहमी सकारात्मक परिणाम मिळतात याची खात्री करण्यासाठी, आम्हाला संपूर्ण मूल्य फंक्शन मध्ये तुलना गुंडाळणे आवश्यक आहे.

=IF(AND(ABS(C6-C5)> ;$E$6

येथे आम्ही आमची पहिली तुलना सुरू केली. आम्ही वरील मूल्यासह फक्त वर्तमान मूल्य वजा करतो आणि परिणाम सेल E6<2 मध्ये संचयित केलेल्या फरक पातळीपेक्षा जास्त आहे की नाही ते पाहतो> आणि सेल मूल्य लॉक ठेवण्यासाठी सेलला संपूर्ण संदर्भ बनवले.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

पुढे, तुलनेचा दुसरा भाग जो स्वल्पविरामाने विभक्त केला आहे. तो सध्याच्या डेटा पॉइंटची पुढील डेटा पॉइंटशी तुलना करेल.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

आता आम्ही ठेवतो स्वल्पविराम द्या आणि AND दोन्ही फंक्शन्स सत्य असल्यास तेथे NA फंक्शन ठेवण्याचे निश्चित करा.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

आणि जर AND फंक्शन सत्य नसेल तर आम्ही वास्तविक डेटा पॉइंट IF खोटे मूल्य म्हणून परत करायचे आहे. म्हणून आम्ही टाइप करू e स्वल्पविरामाने आणि तेथे सेल संदर्भ क्रमांक C6 पास करा.

अधिक वाचा: एक्सेलमध्ये डेटा प्रमाणीकरण कसे काढायचे (5 मार्ग)

समान रीडिंग

  • एक्सेलमध्ये हेडर कसे काढायचे (4 पद्धती)
  • मध्ये ठिपकेदार रेषा काढाExcel (5 द्रुत मार्ग)
  • एक्सेलमधून ग्रिड कसे काढायचे (6 सोप्या पद्धती)
  • एक्सेलमधील सीमा काढा (4 द्रुत मार्ग)
  • एक्सेलमधील सुसंगतता मोड कसा काढायचा (2 सोपे मार्ग)

3. एक्सेलमध्ये आउटलियर्स मॅन्युअली काढा

एक्सेलमधील आउटलायर्स काढून टाकण्याचा आणखी एक सोपा मार्ग म्हणजे, फक्त तुमच्या डेटासेटची व्हॅल्यू क्रमवारी लावा आणि त्यातून वरची आणि खालची व्हॅल्यू मॅन्युअली हटवा.

क्रमवारी लावा. डेटा,

  • निवडा डेटासेट.
  • वर जा क्रमवारी करा & संपादन गटामध्ये फिल्टर करा आणि सर्वात लहान ते सर्वात मोठ्या क्रमवारी लावा किंवा सर्वात लहान क्रमवारी लावा निवडा.

<19

  • आमच्या बाबतीत, आम्ही सर्वात लहान ते सर्वात मोठे क्रमवारी लावा निवडले. याने आमच्या डेटासेटमधील संख्यांची चढत्या क्रमाने क्रमवारी लावली, सर्वात लहान शीर्षस्थानी आणि सर्वात मोठी संख्या तळाशी ठेवली.

आता फक्त तो डेटा व्यक्तिचलितपणे हटवा डेटासेट बाह्य मूल्ये विनामूल्य करण्यासाठी.

आम्ही मोठ्या डेटासेटसह कार्य करताना ही प्रक्रिया फॉलो करण्याची शिफारस करत नाही. जेव्हा तुमचा डेटासेट लहान असेल आणि पाहण्यास सोपा असेल, तेव्हाच तुम्ही ही प्रक्रिया लागू करू शकता, अन्यथा याची अंमलबजावणी करू नका.

अधिक वाचा: एक्सेलमध्ये क्रमवारी कशी काढायची ( 3 सोप्या पद्धती)

निष्कर्ष

या लेखाने तुम्हाला एक्सेलमध्ये आउटलायर्स कसे काढायचे दाखवले. मला आशा आहे की हा लेख तुमच्यासाठी खूप फायदेशीर ठरला आहे. तुम्हाला यासंबंधी काही प्रश्न असल्यास मोकळ्या मनाने विचाराविषय.

ह्यू वेस्ट हे एक अत्यंत अनुभवी एक्सेल ट्रेनर आणि विश्लेषक आहेत ज्याचा उद्योगात 10 वर्षांपेक्षा जास्त अनुभव आहे. त्यांनी अकाउंटिंग आणि फायनान्समध्ये बॅचलर डिग्री आणि बिझनेस अॅडमिनिस्ट्रेशनमध्ये पदव्युत्तर पदवी घेतली आहे. ह्यूला शिकवण्याची आवड आहे आणि त्याने एक अद्वितीय शिकवण्याचा दृष्टीकोन विकसित केला आहे ज्याचे अनुसरण करणे आणि समजणे सोपे आहे. एक्सेलच्या त्यांच्या तज्ञ ज्ञानाने जगभरातील हजारो विद्यार्थ्यांना आणि व्यावसायिकांना त्यांची कौशल्ये सुधारण्यास आणि त्यांच्या करिअरमध्ये उत्कृष्ट कामगिरी करण्यास मदत केली आहे. त्याच्या ब्लॉगद्वारे, ह्यू आपले ज्ञान जगासोबत सामायिक करतो, व्यक्ती आणि व्यवसायांना त्यांच्या पूर्ण क्षमतेपर्यंत पोहोचण्यात मदत करण्यासाठी विनामूल्य एक्सेल ट्यूटोरियल आणि ऑनलाइन प्रशिक्षण ऑफर करतो.