कसरी एक्सेलमा आउटलियरहरू हटाउने (3 तरिका)

  • यो साझा गर्नुहोस्
Hugh West

आउटलियरहरू फेला पार्ने र तिनीहरूलाई हटाउने तथ्याङ्क, डाटा माइनिङ, मेसिन लर्निङ आदिमा डाटा विश्लेषण गर्न एक धेरै सामान्य कार्य हो। त्यहाँ धेरै तरिकाहरू छन् कि तपाईंले आफ्नो डेटासेटमा आउटलियरहरू फेला पार्न सक्नुहुन्छ तर तिनीहरूलाई हटाउने प्रक्रिया त्यति सजिलो छैन। फेला पार्नुहोस्। यस लेखमा, हामी तपाईंलाई कसरी Excel मा outliers हटाउने देखाउनेछौं।

कार्यपुस्तिका डाउनलोड गर्नुहोस्

तपाईले नि:शुल्क अभ्यास एक्सेल कार्यपुस्तिका यहाँबाट डाउनलोड गर्न सक्नुहुन्छ। यहाँ।

Outliers.xlsx हटाउनुहोस्

Excel मा Outliers के हो?

An outlier एउटा मान हो जुन डेटासेटको औसत वा मध्य मानबाट टाढा हुन्छ। अर्को शब्दमा भन्नुपर्दा, आउटलियरहरू मानहरू हुन् जुन डेटासेटका बाँकी मानहरू भन्दा उल्लेखनीय रूपमा उच्च वा कम छन्।

क्रिकेट म्याचको बारेमा सोच्नुहोस् जहाँ सबै ब्याट्सम्यानले लगभग 50 रन बनाए तर एकजना ब्याट्सम्यानले मात्र शतक बनाए (100) ) र अर्को ब्याट्सम्यान ० मा आउट भए। त्यो 100 र 0 स्कोर यस खेलमा आउटलियरहरू हुन्।

आउटलियरहरू समस्याग्रस्त छन् किनकि उनीहरूले डेटा विश्लेषणको नतिजालाई बेवास्ता गर्न सक्छन् र भ्रामक परिणामहरू निम्त्याउन सक्छन्। त्यसैले आउटलियरहरू फेला पार्न र तिनीहरूलाई हटाउन सजिलो डेटासेटको लागि राम्रो हुन्छ।

3 एक्सेलमा आउटलियरहरू हटाउने तरिका

यस खण्डमा, तपाइँ कसरी सिक्नुहुनेछ। आफ्नो डेटासेटबाट ३ फरक तरिकामा आउटलियरहरू मेटाउनुहोस् । आउटलियरहरू हटाउनु एक कठिन प्रक्रिया हो, त्यसैले सम्पूर्ण लेख ध्यानपूर्वक पढ्नुहोस्।

1. बिना औसत गणना गर्न एक्सेल प्रकार्य प्रयोग गर्दैOutliers

Excel TRIMMEAN प्रकार्य आउटलियरहरू बाहेक दिइएको डेटासेटको औसत गणना गर्न प्रयोग गर्न सकिन्छ। बहिष्कार गर्न डेटा बिन्दुहरू प्रतिशतको रूपमा आपूर्ति गरिन्छ। प्रतिशत मान दशमलव ढाँचा वा प्रतिशत ढाँचाको रूपमा इनपुट हुन सक्छ।

आउटलियर बिना मतलब गणना गर्न सिन्ट्याक्स हो,

=TRIMMEAN(एरे, प्रतिशत)

यहाँ,

  • एरे = ट्रिम गर्न र औसत परिणाम गणना गर्न डेटाको दायरा
  • प्रतिशत = द बहिष्करण गर्नका लागि डेटा बिन्दुहरूको संख्या

हटाइएका आउटलियरहरूसँग नतिजाहरू गणना गर्न यो कार्य कसरी कार्यान्वयन गर्ने हेरौं।

14>

माथिको चित्रलाई विचार गर्नुहोस्। हामीसँग सेल B5 देखि B14 सम्मको डाटा छ। यहाँ धेरै जसो संख्याहरू 20 देखि 27 को बीचमा छन्, तर दुई मानहरू - 0 र 100 - ती मानहरू भन्दा टाढा छन्। त्यसोभए यी हाम्रो डेटासेटमा आउटलियरहरू हुन्।

हाम्रो डेटासेटको लागि, एक्सेल TRIMMEAN प्रकार्यसँग आउटलियर मानहरू बिना औसत (औसत) गणना गर्ने सूत्र हो,

=TRIMMEAN(B5:B14,0.2)

यहाँ,

  • B5:B14 = ट्रिम गर्न र औसत परिणाम गणना गर्न डेटाको दायरा
  • 0.2 (वा 20%) = बहिष्करण गर्न डेटा बिन्दुहरूको संख्या

यदि डेटासेटमा कुनै पनि संख्या डाटासेटको बाँकी 20% तल खस्छ , त्यसपछि त्यो संख्यालाई आउटलियर भनिनेछ।

यदि तपाईँले आफ्नो डेटासेट अनुसार सूत्र लेख्नुभयो र Enter थिच्नु भयो भने, तपाईँले आउटलियर बिना गणना गरिएको अर्थ प्राप्त गर्नुहुनेछ। तपाईँको डेटासेटको लागि। हाम्रो केसमा, सेल E6 ले गणना गरिएको माध्य हो जुन 23.50 हो।

उत्तर सही छ वा छैन भनी जाँच गर्न, हामी AVERAGE प्रकार्य चलाउँछौं। सेल E5 मा जसले दायरा B5:B14 सबै मानहरूको औसत ( 28.80 ) फर्काउँछ। र सेल E7 मा, हामीले अर्को AVERAGE प्रकार्य म्यानुअल रूपमा आउटलियर मानहरू राख्ने बाहेक सबै सेलहरू इनपुट गरेर चलाउँछौं, र परिणामको रूपमा 23.50 को रिटर्न पायौं।

त्यसैले हामी भन्न सक्छौं कि TRIMMEAN प्रकार्यले Excel मा औसत गणना गर्दा दिइएको डेटासेटबाट आउटलियरहरू सफलतापूर्वक हटाउन सक्छ।

थप पढ्नुहोस्: एक्सेलमा सूत्र कसरी खाली गर्ने (७+ विधिहरू)

2. एक्सेलमा डाटासेट र रेखा चार्टबाट आउटलियरहरू हटाउनुहोस्

निम्न चित्रलाई ध्यान दिनुहोस्। हामीसँग केहि डाटा छ जसको आधारमा हामीले रेखा ग्राफ सिर्जना गर्यौं। रेखा ग्राफबाट, हामी सजिलै देख्न सक्छौं कि डेटा बिन्दु 4 र 8 मा हामीसँग हाम्रा आउटलियरहरू छन्

अब हामी हेर्नेछौं कि हामी कसरी सहज बनाउन सक्छौं। डेटासेटबाट बाहिरी मानहरू हटाएर रेखा चार्ट बाहिर गर्नुहोस्।

अर्को कक्षमा (हाम्रो अवस्थामा यो सेल H6 हो), निम्न सूत्र लेख्नुहोस्,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

यहाँ,

  • C6 = डेटासेटमा पहिलो डाटा राख्ने कक्ष
  • C5 = पहिलो डाटा सेल माथिको सेल
  • C7 = पहिलो डाटा सेलको तलको सेल
  • $E$6 = डेटा बिन्दुहरू बीचको भिन्नता .

हेर्दैहाम्रो डेटा, यस्तो देखिन्छ कि जब डेटा बिन्दु अन्यबाट 10 एकाइ फरक हुन्छ, एक आउटलियर को रूपमा तोकिएको छ। त्यसैले हामीले 10 लाई सेल E6 मा राख्छौं र यसलाई निरपेक्ष सेल सन्दर्भ बनाउँछौँ ताकि सम्पूर्ण डाटासेटलाई स्क्यान र गणना गर्दा यो सेल फिक्स हुन्छ।<3

Enter थिचेपछि, तपाईंले पहिलो डाटा अझै पनि परिणाम कक्षमा देखा परेको देख्न सक्नुहुन्छ H6 । तपाईंले यहाँ गर्नु पर्ने कुरा मात्र सूत्र निर्माण गर्नको लागि हो ताकि हामी बाँकी कक्षहरूमा सूत्र लागू गर्न फिल ह्यान्डल तान्न सकौं।

अब फिल ह्यान्डल को साथ पङ्क्तिलाई तल तान्नुहोस् र तपाईंले बाहिरीहरूलाई समात्ने कक्षहरू अब #N/A भरिएको देख्नुहुनेछ।

र अब रेखा चार्ट हेर्नुहोस्, यो अब यसमा कुनै बाहिरी मानहरू बिना नै समतल ग्राफ हो।

1 IF अवस्था।

=IF(AND(

हामी हालको डाटा पोइन्ट र माथिको सेल र तलको सेल तुलना गर्न जाँदैछौं। र यदि दुबै तुलनाहरू सत्य छन् भने, तब मात्र हामीले परिणामको रूपमा डेटा बिन्दु देखाउनेछौं। त्यसैले, हामीले "दुवै" तुलनाहरूसँग व्यवहार गर्न आवश्यक भएकोले हामीले AND प्रकार्य प्रयोग गर्नुपर्छ।

=IF(AND(ABS(

जब हामीले डेटा बिन्दु घटाउछौं, केहि डेटाले नकारात्मक मानहरू फाल्न सक्छ। र हामी गर्छौं) होइननकारात्मक मानहरूसँग व्यवहार गर्न चाहन्छु किनकि नकारात्मक मानहरू सधैं "भिन्नता 10 हुँदा डेटा हटाउने" को शर्तको विरोधाभास हुनेछ। त्यसैले हामीसँग सधैं सकारात्मक नतिजाहरू छन् भनी सुनिश्चित गर्न, हामीले तुलनाहरूलाई निरपेक्ष मान प्रकार्य मा बेर्नु पर्छ।

=IF(AND(ABS(C6-C5)>। ;$E$6

यहाँ हामीले हाम्रो पहिलो तुलना सुरु गर्यौं। हामीले माथिको मानसँग हालको मान घटाउँछौं र परिणाम सेल E6<2 मा भण्डारण गरिएको भिन्नता स्तर भन्दा ठूलो छ कि छैन भनेर हेर्नुहोस्।> र सेल मानलाई लक राख्नको लागि सेललाई पूर्ण सन्दर्भ बनायो।

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

अर्को, तुलनाको दोस्रो भाग जसलाई अल्पविरामले छुट्याइएको छ। यसले हालको डेटा बिन्दुलाई अर्को डेटा बिन्दुसँग तुलना गर्नेछ।

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

अब हामी राख्छौं अल्पविराम र त्यहाँ NA प्रकार्य राख्न निर्धारण गर्नुहोस् यदि दुबै AND प्रकार्यहरू सत्य छन् भने।

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

र यदि AND प्रकार्य सत्य छैन भने हामी वास्तविक डेटा बिन्दुलाई IF False value को रूपमा फर्काउन चाहन्छौं। त्यसैले हामी टाइप गर्छौं e अल्पविराममा र त्यहाँ सेल सन्दर्भ नम्बर C6 पास गर्नुहोस्।

थप पढ्नुहोस्: एक्सेलमा डाटा प्रमाणीकरण कसरी हटाउने (५ तरिका)

समान पढाइहरू

  • एक्सेलमा हेडर कसरी हटाउने (४ विधिहरू)
  • मा डटेड लाइनहरू हटाउनुहोस्एक्सेल (५ द्रुत तरिकाहरू)
  • कसरी एक्सेलबाट ग्रिड हटाउने (6 सजिलो विधिहरू)
  • एक्सेलमा बोर्डरहरू हटाउनुहोस् (४ द्रुत तरिकाहरू)
  • कसरी एक्सेलमा कम्प्याटिबिलिटी मोड हटाउने (२ सजिलो तरिका)

3. एक्सेलमा आउटलियरहरू म्यानुअल रूपमा हटाउनुहोस्

एक्सेलमा आउटलियरहरू हटाउने अर्को सजिलो तरिका हो, केवल आफ्नो डेटासेटको मानहरू क्रमबद्ध गर्नुहोस् र त्यसबाट माथि र तल्लो मानहरू म्यानुअल रूपमा मेटाउनुहोस्।

क्रमबद्ध गर्न। डेटा,

  • चयन गर्नुहोस् डेटासेट।
  • मा जानुहोस् क्रमबद्ध गर्नुहोस् & सम्पादन समूहमा फिल्टर सबैभन्दा सानो क्रमबद्ध गर्नुहोस् वा सबैभन्दा सानो क्रमबद्ध गर्नुहोस्

  • हाम्रो अवस्थामा, हामीले सबैभन्दा सानो क्रमबद्ध गर्नुहोस् चयन गर्यौं। यसले हाम्रो डेटासेटका नम्बरहरूलाई बढ्दो क्रममा क्रमबद्ध गर्यो, सबैभन्दा सानोलाई माथि र सबैभन्दा ठूलोलाई तल राखेर।

अब ती डाटाहरूलाई म्यानुअल रूपमा मेटाउनुहोस्। डेटासेट बाहिरी मानहरू निःशुल्क बनाउन।

हामी ठूलो डेटासेटसँग काम गर्दा यो प्रक्रिया अनुसरण गर्न सिफारिस गर्दैनौं। जब तपाईंको डेटासेट सानो र हेर्न सजिलो हुन्छ, तब मात्र तपाईंले यो प्रक्रिया लागू गर्न सक्नुहुन्छ, अन्यथा यसलाई लागू नगर्नुहोस्।

थप पढ्नुहोस्: एक्सेलमा क्रमबद्ध कसरी हटाउने ( ३ सजिलो विधिहरू)

निष्कर्ष

यस लेखले एक्सेलमा कसरी आउटलियरहरू हटाउने देखाएको छ। मलाई आशा छ कि यो लेख तपाईलाई धेरै लाभदायक भएको छ। यदि तपाइँसँग सम्बन्धित कुनै प्रश्नहरू छन् भने सोध्न नहिचकिचाउनुहोस्विषय।

Hugh West एक उच्च अनुभवी एक्सेल प्रशिक्षक र उद्योग मा 10 वर्ष भन्दा बढी अनुभव संग विश्लेषक हो। उनले लेखा र वित्तमा स्नातक र व्यवसाय प्रशासनमा स्नातकोत्तर डिग्री हासिल गरेका छन्। Hugh को शिक्षण को लागी एक जोश छ र एक अद्वितीय शिक्षण दृष्टिकोण को विकास गरेको छ जुन पछ्याउन र बुझ्न सजिलो छ। एक्सेलको उनको विशेषज्ञ ज्ञानले विश्वभरका हजारौं विद्यार्थी र पेशेवरहरूलाई उनीहरूको सीप सुधार गर्न र उनीहरूको करियरमा उत्कृष्टता हासिल गर्न मद्दत गरेको छ। आफ्नो ब्लग मार्फत, हगले व्यक्ति र व्यवसायहरूलाई उनीहरूको पूर्ण क्षमतामा पुग्न मद्दत गर्न नि:शुल्क एक्सेल ट्यूटोरियलहरू र अनलाइन प्रशिक्षणहरू प्रदान गर्दै आफ्नो ज्ञान संसारसँग साझा गर्छन्।