एक्सेल में आउटलेयर की गणना कैसे करें (5 आसान तरीके)

  • इसे साझा करें
Hugh West

डेटा सेट से डेटा पर सांख्यिकीय संगणना करने के लिए आउटलेयर की पहचान करने की आवश्यकता हो सकती है। आप Microsoft Excel का उपयोग करके कई तरीकों से विशाल डेटासेट से आउटलेयर खोज सकते हैं। इस पोस्ट में, हम आपको दिखाएंगे कि पांच अलग-अलग तरीकों का उपयोग करके Microsoft Excel में आउटलेयर की गणना कैसे करें।

प्रैक्टिस वर्कबुक डाउनलोड करें

आप यहां से मुफ्त एक्सेल वर्कबुक डाउनलोड कर सकते हैं और खुद अभ्यास कर सकते हैं .

आउटलेयर्स का पता लगाएं। xlsx

एक्सेल में आउटलेयर्स की गणना करने के लिए 5 आसान तरीके

आउटलेयर्स डेटा मान हैं जो डेटासेट के बाकी डेटा मानों से काफ़ी अलग हैं। आउटलेयर, दूसरे शब्दों में, असाधारण मूल्य हैं। डेटा सेट में अन्य मानों की तुलना में वे या तो असाधारण रूप से उच्च या अत्यधिक कम हैं। बाहरी तत्वों का पता लगाना सांख्यिकीय गणनाओं में महत्वपूर्ण है क्योंकि उनका हमारे डेटा विश्लेषण के निष्कर्षों पर प्रभाव पड़ता है।

उदाहरण के लिए, आपके पास बारह लोगों की दैनिक आय दिखाने वाला एक डेटा सेट है। अब, आपको Microsoft Excel का उपयोग करके आउटलेयर की गणना करने की आवश्यकता है। यहां, मैं आपको ऐसा करने के पांच आसान तरीके दिखाऊंगा।

1. Sort & एक्सेल में आउटलेयर की गणना करने के लिए फ़िल्टर

आप सॉर्ट और amp का उपयोग करके छोटे डेटा सेट से आउटलेयर की गणना कर सकते हैं; एक्सेल में फ़िल्टर कमांड। यदि आप सॉर्ट और फ़िल्टर फ़ंक्शन का उपयोग करके आउटलेयर की गणना करना चाहते हैं, तो आप इसका अनुसरण करके कर सकते हैंचरण नीचे।

चरण 1:

  • सबसे पहले, एक्सेल के अपने डेटासेट में उस कॉलम हेडर का चयन करें जिसे आप सॉर्ट करना चाहते हैं। उदाहरण के लिए, दिए गए डेटा सेट में, दैनिक आय नामक फ़ाइल कॉलम हेडर में (सेल C40 चुना गया है)।<15

चरण 2:

  • फिर, होम <7 दबाएं> रिबन पर टैब करें और संपादन समूह पर जाएं.

चरण 3:<7

  • उसके बाद, संपादन समूह में सॉर्ट & फ़िल्टर कमांड और कस्टम सॉर्ट करें पर क्लिक करें।

<19

चरण 4:

  • फिर, सॉर्ट करें नाम का एक नया डायलॉग बॉक्स खुलेगा। पॉप-अप संवाद बॉक्स में, दैनिक आय द्वारा क्रमबद्ध करें <7 चुनें> ड्रॉप-डाउन और सबसे छोटा से बड़ा ऑर्डर ड्रॉप-डाउन में। उसके बाद, ठीक क्लिक करें।

चरण 5:

<13
  • अंत में, दैनिक आय कॉलम को बताए गए तरीके से क्रमबद्ध किया जाएगा, शीर्ष पर सबसे कम मान और सबसे नीचे सबसे बड़ा मान होगा। प्रक्रिया चलाने के बाद, आउटलेयर निर्धारित करने के लिए डेटा श्रेणी में किसी भी अनियमितता की तलाश करें।
  • उदाहरण के लिए, कॉलम में पहले दो मान काफी कम हैं और कॉलम में अंतिम दो मान डेटा सेट के बाकी मानों की तुलना में काफी अधिक हैं, जैसा कि में दिखाया गया हैउपरोक्त परिणाम।

    और पढ़ें: एक्सेल में प्रतिगमन विश्लेषण में आउटलेयर कैसे खोजें (3 आसान तरीके)

    2. QUARTILE फ़ंक्शन लागू करें एक्सेल में आउटलेयर की गणना करें

    क्वार्टाइल फ़ंक्शन दृष्टिकोण एक्सेल में आउटलेयर की गणना करने का एक अधिक वैज्ञानिक तरीका है। आप अपने डेटा सेट को चार बराबर भागों में विभाजित करने के लिए इस फ़ंक्शन का उपयोग कर सकते हैं। निम्न मान QUARTILE फ़ंक्शन द्वारा लौटाए जाएंगे:

    • न्यूनतम मान.
    • पहला चतुर्थक (Q1- किसी दिए गए डेटासेट का निम्नतम 25%)।
    • दूसरा चतुर्थक (Q2-अगला) डेटासेट का निम्नतम 25%)।
    • तीसरा चतुर्थक (डेटासेट का Q3- दूसरा उच्चतम 25%)।
    • <6 अधिकतम मान।

    एक्सेल में QUARTILE फ़ंक्शन का सिंटैक्स है:

    =QUARTILE( array,quart)

    सिंटैक्स में निम्नलिखित तर्क शामिल हैं:

    • a rray : दिया गया सेल रेंज डेटा सेट जिसके लिए आप चतुर्थक मूल्य की गणना करेंगे।

    QUARTILE फ़ंक्शन का उपयोग करके उपरोक्त डेटासेट के लिए आउटलेयर की गणना करने के लिए, नीचे दिए गए चरणों का पालन करें।

    चरण 1:

    • सबसे पहले, पहले चतुर्थक ( Q1 ) के निर्धारण के लिए निम्न सूत्र टाइप करें, जो नीचे दिया गया है।
    =QUARTILE($C$5:$C$16,1) <7

    चरण 2:

    • यहांपुनः, तीसरा चतुर्थक ( Q3 ) की गणना करने का सूत्र नीचे दिया गया है।
    =QUARTILE($C$5:$C$16,3)

    चरण 3:

    • तीसरा, आपको IQR, निर्धारित करना होगा जो कि है अंतर-चतुर्थक श्रेणी (यह डेटा सेट की श्रेणी से दिए गए डेटा का 50% प्रतिनिधित्व करता है जो पहले और तीसरे चतुर्थक में आते हैं) घटाकर Q1 (सेल G4 में) Q3 से (सेल G5 में)। घटाव की गणना करने के लिए निम्न सूत्र टाइप करें।

      =G5-G4

    चरण 4:

    • IQR, पाने के बाद, आपको ऊपरी और निचले क्योंकि ऊपरी और निचले सीमा में अधिकांश डेटा शामिल होगा डेटा सेट। ऊपरी सीमा की गणना करने के लिए निम्न सूत्र लिखें।

      =G5+(1.5*G6)

    <1

    चरण 5:

    • फिर, निचली सीमा की गणना करने के लिए, निम्न सूत्र लिखें।
    =G4-(1.5*G6)

    चरण 6:

    • अंत में, पिछले चरण को पूरा करने के बाद, आप प्रत्येक डेटा के लिए आउटलेयर निर्धारित कर सकते हैं मूल्य। एक्सेल वर्कशीट में, सेल D5 में OR फंक्शन के साथ निम्न सूत्र टाइप करें।
    =OR(C5$G$7)

    • यह सूत्र उस डेटा की पहचान करने में मदद करेगा जो उपर्युक्त सीमा सीमा के भीतर नहीं आता है। प्रसंस्करण के बादसूत्र सत्य कथन दिखाएगा यदि विशिष्ट डेटा एक बाहरी है और गलत यदि ऐसा नहीं है। सेल में ऑटोफिल टूल कॉपी करने के लिए C5 बाकी सेल में फॉर्मूला पर डबल-क्लिक करें कॉलम C में। इस प्रकार, आप अपने डेटासेट में सभी आउटलेयर के बगल में एक सही मान देख सकते हैं। मानक विचलन (या σ ) यह निर्धारित करने के लिए एक मीट्रिक है कि पूरे डेटा सेट के औसत मूल्य के संबंध में डेटा कैसे वितरित किया जाता है। मानक विचलन कम होने पर डेटा को माध्य के आसपास समूहीकृत किया जाता है, जबकि मानक विचलन अधिक होने पर डेटा अधिक फैला हुआ होता है। माध्य और मानक विचलन का उपयोग करके आउटलेयर की गणना करने के लिए आप निम्न चरणों का पालन कर सकते हैं।

    चरण 1:

    • सबसे पहले, इस आलेख के प्रारंभ में दिखाए गए समान डेटासेट का उपयोग करें और फिर माध्य और मानक विचलन की गणना करें। माध्य की गणना करने के लिए, सेल G5 में औसत फ़ंक्शन के साथ निम्न सूत्र टाइप करें।
    =AVERAGE(C5:C16)

    चरण 2:

    • मानक विचलन की गणना करने के लिए, STDEV के साथ निम्न सूत्र डालें .P फ़ंक्शन सेल में G6 .
    =STDEV.P(C5:C16)

    चरण 3:

    • अगला, आप गणना करेंगेप्रक्रिया में आगे की प्रगति के लिए ऊपरी सीमा। सेल G7 में, निम्न सूत्र का उपयोग करके निचली सीमा की गणना करें।
    =G5-(1.25*G6)

    <32

    चरण 4:

    • और कक्ष G8 निम्न सूत्र से ऊपरी सीमा की गणना करें
    =G5+(1.5*G6)

    5वां चरण:

    • उसके बाद , गणना करने के लिए कि कोई आउटलेयर मौजूद है या नहीं, सेल D5 में निम्न सूत्र टाइप करें।
    =OR(C5$G$8)

    • इस प्रकार, यदि वांछित सेल में विशिष्ट डेटा एक बाहरी है और तो सूत्र TRUE मान लौटाएगा FALSE।
    • सेल D5 <7 में ऑटोफिल टूल पर डबल-क्लिक करें।> सूत्र को स्तंभ D में शेष कक्षों में कॉपी करने के लिए। इस प्रकार, आप अपने डेटासेट में शेष सभी आउटलेयर का पता लगा सकते हैं।

    और पढ़ें: एक्सेल में मानक विचलन के साथ आउटलेयर कैसे खोजें (त्वरित चरणों के साथ)

    4. एक्सेल में आउटलेयर की गणना करने के लिए Z-स्कोर डालें

    Z-स्कोर अक्सर उपयोग किए जाने वाले मेट्रिक्स में से एक है बाहरी कारकों की पहचान करना। यह विधि दर्शाती है कि एक विशिष्ट डेटा अपने मानक विचलन के संबंध में डेटासेट के माध्यम से कितनी दूर है। एक्सेल में जेड-स्कोर का उपयोग करके आउटलेयर की गणना करने के लिए आप नीचे वर्णित चरणों को देख सकते हैं।

    चरण 1:

    • सबसे पहले, वांछित डेटा सेट लें।

    चरण2:

    • दूसरा, सेल H5 में, माध्य <की गणना के लिए निम्न सूत्र टाइप करें 7>दिए गए डेटा के लिए।
    =AVERAGE(C5:C16)

    चरण 3:

    • तीसरा, निम्न सूत्र का उपयोग करके सेल H6 में दिए गए डेटासेट के मानक विचलन की गणना करें।
    =STDEV.P(C5:C16)

    चरण 4:

    • उसके बाद , आपको प्रत्येक डेटा मान के लिए Z -स्कोर निर्धारित करना होगा। ऐसा करने के लिए आप नीचे दिए गए सूत्र का उपयोग करें।
    =(C5-$H$5)/$H$6

    चरण 5:

    • सभी Z-मानों की गणना करने के बाद, आप देखेंगे कि Z-मानों <7 की श्रेणी> -1.44 और 13 के बीच है। इसलिए, हम बाहरी सीमाओं के लिए Z-स्कोर -1.2 से कम या +1.8 से अधिक के मानों पर विचार करते हैं।
    • फिर, निम्न सूत्र को सेल E 5 में टाइप करें।
    =OR((D51.8))

    <39

    • अंत में, सूत्र TRUE मान लौटाएगा यदि विशिष्ट डेटा एक बाहरी है और गलत <9 लौटाएगा
    • सेल E5 ऑटोफिल का उपयोग करने के लिए पर डबल-क्लिक करें टूल फिल हैंडल कॉलम E के बाकी सेल में फ़ॉर्मूला कॉपी करने के लिए। इस प्रकार, आप अपने डेटासेट में सभी शेष आउटलेयर ढूंढ सकते हैं।

    और पढ़ें: एक्सेल में जेड स्कोर का उपयोग करके आउटलेयर कैसे खोजें (त्वरित के साथ)चरण)

    5. एक्सेल में आउटलेयर खोजने के लिए बड़े और छोटे कार्यों को मर्ज करें

    बड़ा फ़ंक्शन और छोटा फ़ंक्शन एक्सेल में विपरीत क्रियाएं होती हैं। हम इसका उपयोग क्रमशः डेटा सेट में सबसे बड़ा और सबसे छोटा डेटा या मान खोजने के लिए करेंगे। यह फ़ंक्शन डेटा सेट के भीतर सभी डेटा को खींचेगा, सबसे छोटी और सबसे बड़ी संख्या का पता लगाएगा। वे दूसरे सबसे छोटे या सबसे बड़े, तीसरे सबसे बड़े या सबसे छोटे आदि को खोजने में सक्षम हैं।

    चरण 1:

    • सबसे पहले, सेल E5 LARGE फ़ंक्शन के साथ
    <में निम्न सूत्र का उपयोग करें। 6> =LARGE($C$5:$C$16,1)

      • इस प्रकार, 12 मानों से, आप पहला सबसे बड़ा मान देख सकते हैं जो <6 है 780 .

    चरण 2:

    <13
  • उसके बाद, सेल G5 में, सबसे छोटा मान ज्ञात करने के लिए निम्न सूत्र लिखें।
  • =SMALL($C$5:$C$16,1)

    • अंत में, 12 मानों से, आप पहला देख सकते हैं सबसे छोटा मान 110
    • एक बार जब आप सभी आवश्यक मानों का पता लगा लेते हैं, तो आप डेटासेट में किसी भी आउटलेयर को आसानी से इंगित कर सकते हैं।

    निष्कर्ष

    यही इस लेख का अंत है। मुझे उम्मीद है कि आपको यह लेख मददगार लगा होगा। इस लेख को पढ़ने के बाद, आप किसी भी तरीके का उपयोग करके एक्सेल में आउटलेयर की गणना करने में सक्षम होंगे। कृपया किसी और प्रश्न या सुझाव के साथ साझा करेंहमें नीचे टिप्पणी अनुभाग में।

    ह्यूग वेस्ट उद्योग में 10 से अधिक वर्षों के अनुभव के साथ एक अत्यधिक अनुभवी एक्सेल ट्रेनर और विश्लेषक है। उनके पास लेखा और वित्त में स्नातक की डिग्री और व्यवसाय प्रशासन में मास्टर डिग्री है। ह्यूग को पढ़ाने का शौक है और उन्होंने एक अद्वितीय शिक्षण दृष्टिकोण विकसित किया है जिसका पालन करना और समझना आसान है। एक्सेल के उनके विशेषज्ञ ज्ञान ने दुनिया भर में हजारों छात्रों और पेशेवरों को अपने कौशल में सुधार करने और अपने करियर में उत्कृष्टता हासिल करने में मदद की है। अपने ब्लॉग के माध्यम से, ह्यूग दुनिया के साथ अपने ज्ञान को साझा करता है, व्यक्तियों और व्यवसायों को उनकी पूरी क्षमता तक पहुंचने में मदद करने के लिए मुफ्त एक्सेल ट्यूटोरियल और ऑनलाइन प्रशिक्षण प्रदान करता है।