सामग्री तालिका
डेटा सेटबाट डाटामा सांख्यिकीय गणना गर्न बाहिरीहरूलाई पहिचान गर्न आवश्यक हुन सक्छ। तपाईले धेरै तरिकामा माइक्रोसफ्ट एक्सेल प्रयोग गरेर विशाल डेटासेटहरूबाट आउटलियरहरू पत्ता लगाउन सक्नुहुन्छ। यस पोष्टमा, हामी तपाईंलाई पाँचवटा फरक तरिकाहरू प्रयोग गरेर माइक्रोसफ्ट एक्सेलमा आउटलियरहरू कसरी गणना गर्ने भनेर देखाउनेछौं।
अभ्यास कार्यपुस्तिका डाउनलोड गर्नुहोस्
तपाईं यहाँबाट नि:शुल्क एक्सेल कार्यपुस्तिका डाउनलोड गर्न सक्नुहुन्छ र आफ्नै अभ्यास गर्न सक्नुहुन्छ। .
Find Outliers.xlsx
5 एक्सेलमा आउटलियरहरू गणना गर्न सजिलो दृष्टिकोण
आउटलियर्स डेटा मानहरू हुन् जुन डेटासेटको बाँकी डेटा मानहरू भन्दा धेरै फरक छन्। आउटलियरहरू, अन्य शब्दहरूमा, असाधारण मानहरू हुन्। तिनीहरू या त असाधारण रूपमा उच्च वा अत्यधिक कम डेटा सेटमा अन्य मानहरूको तुलनामा। बाह्य व्यक्तिहरू फेला पार्नु सांख्यिकीय गणनामा महत्त्वपूर्ण छ किनभने तिनीहरूले हाम्रो डेटा विश्लेषणको निष्कर्षमा प्रभाव पार्छ।
उदाहरणका लागि, तपाईंसँग बाह्र व्यक्तिको दैनिक आय देखाउने डेटा सेट छ। अब, तपाईंले माइक्रोसफ्ट एक्सेल प्रयोग गरेर आउटलियरहरू गणना गर्न आवश्यक छ। यहाँ, म तपाईंलाई त्यसो गर्नका लागि पाँचवटा सजिलो उपायहरू देखाउनेछु।
1. क्रमबद्ध गर्नुहोस् र प्रयोग गर्नुहोस्। एक्सेलमा आउटलियरहरू गणना गर्न फिल्टर गर्नुहोस्
तपाईँले सर्ट र amp; फिल्टर एक्सेल मा आदेश। यदि तपाइँ क्रमबद्ध र फिल्टर प्रकार्य प्रयोग गरेर आउटलियरहरू गणना गर्न चाहनुहुन्छ भने, तपाइँ यसलाई पछ्याएर गर्न सक्नुहुन्छ।तलका चरणहरू।
चरण 1:
- पहिले, तपाईँले क्रमबद्ध गर्न चाहनुभएको एक्सेलको डेटासेटमा स्तम्भ हेडर चयन गर्नुहोस्। उदाहरणका लागि, दिइएको डेटा सेटमा, दैनिक आय नामको फाइल स्तम्भ हेडरमा (सेल C40 छनोट गरिएको छ)।
चरण 2:
- त्यसपछि घर <7 थिच्नुहोस्> रिबनमा ट्याब गर्नुहोस् र सम्पादन समूहमा जानुहोस्।
चरण ३:
- त्यसपछि, सम्पादन समूह मा क्लिक गर्नुहोस् क्रमबद्ध गर्नुहोस् & फिल्टर आदेश र अनुकूलित क्रमबद्ध मा क्लिक गर्नुहोस्।
चरण 4:
- त्यसपछि, Sort नामको नयाँ संवाद बक्स खुल्नेछ। पप-अप संवाद बक्समा, क्रमबद्ध <7 मा दैनिक आय चयन गर्नुहोस्।> ड्रप-डाउन र अर्डर ड्रप-डाउनमा सबैभन्दा सानो देखि ठूलो । त्यस पछि, ठीक मा क्लिक गर्नुहोस्।
चरण 5:
<13
उदाहरणका लागि, स्तम्भमा पहिलो दुई मानहरू उल्लेखनीय रूपमा कम छन् र स्तम्भमा अन्तिम दुई मानहरू डेटा सेटको बाँकी मानहरू भन्दा धेरै उच्च छन्, जस्तैमाथिको नतिजा।
थप पढ्नुहोस्: एक्सेलमा रिग्रेसन एनालिसिसमा आउटलायरहरू कसरी फेला पार्ने (३ सजिलो तरिका)
2. QUARTILE प्रकार्य लागू गर्नुहोस् एक्सेलमा आउटलियरहरू गणना गर्नुहोस्
QUARTILE प्रकार्य दृष्टिकोण एक्सेलमा आउटलियरहरू गणना गर्ने थप वैज्ञानिक तरिका हो। तपाईंले आफ्नो डेटा सेटहरूलाई चार बराबर भागहरूमा विभाजन गर्न यो प्रकार्य प्रयोग गर्न सक्नुहुन्छ। निम्न मानहरू QUARTILE प्रकार्य द्वारा फर्काइनेछ:
- न्यूनतम मान।
- द पहिलो चतुर्थक (Q1- दिइएको डेटासेटको सबैभन्दा कम 25%)।
- द दोस्रो चतुर्थक (Q2-अर्को डाटासेटको सबैभन्दा कम २५%)।
- तेस्रो चतुर्थक (Q3- डाटासेटको दोस्रो उच्चतम 25%)।
- <6 अधिकतम मान।
एक्सेलमा QUARTILE प्रकार्य को सिन्ट्याक्स हो:
=QUARTILE( array, quart)
सिन्ट्याक्सले निम्न आर्गुमेन्टहरू समावेश गर्दछ:
- a rray : दिईएको सेल दायरा डेटा सेट जसको लागि तपाईंले चतुर्थक मान गणना गर्नुहुनेछ।
- चौथाई: यसले कुन मान फिर्ता गर्नुपर्छ भनेर निर्दिष्ट गर्दछ।
<22
QUARTILE प्रकार्य प्रयोग गरेर माथिको डेटासेटको लागि बाहिरीहरू गणना गर्नको लागि, तलका चरणहरू पालना गर्नुहोस्।
चरण 1:
- सबैभन्दा पहिले, पहिलो चतुर्थक ( Q1 ) निर्धारण गर्नको लागि निम्न सूत्र टाइप गर्नुहोस्।
=QUARTILE($C$5:$C$16,1)
चरण 2:
- यहाँफेरि, 3rd चतुर्थक ( Q3 ) गणना गर्ने सूत्र तल दिइएको छ।
=QUARTILE($C$5:$C$16,3)
24>
चरण 3:
13> =G5-G4
- IQR फेला पारेपछि, अर्को तपाईंले माथिल्लो र तल्लो किनभने माथिल्लो र तल्लो सीमा भित्र अधिकांश डाटा समावेश हुनेछ डाटा सेट। माथिल्लो सीमा गणना गर्न निम्न सूत्र लेख्नुहोस्।
=G5+(1.5*G6)
चरण 5:
- त्यसपछि, तल्लो सीमा गणना गर्न, निम्न सूत्र लेख्नुहोस्।
=G4-(1.5*G6)
चरण 6:
- अन्तमा, अघिल्लो चरण समाप्त गरेपछि, तपाइँ प्रत्येक डेटाको लागि आउटलियरहरू निर्धारण गर्न सक्नुहुन्छ। मूल्य। एक्सेल कार्यपत्रमा, सेल D5 मा OR प्रकार्य संग निम्न सूत्र टाइप गर्नुहोस्।
=OR(C5$G$7)
- यस सूत्रले माथि उल्लिखित दायरा सीमा भित्र नपर्ने डाटा पहिचान गर्न मद्दत गर्नेछ। प्रशोधन पछिसूत्रले TRUE कथन देखाउनेछ यदि विशिष्ट डेटा आउटलायर हो र यदि यो होइन भने FALSE । AutoFill सेलमा रहेको उपकरण C5 मा सूत्रलाई बाँकी कक्षहरूमा प्रतिलिपि गर्न डबल-क्लिक गर्नुहोस्। स्तम्भ C मा। यसरी, तपाईंले आफ्नो डेटासेटमा सबै आउटलियरहरूको छेउमा एउटा ट्रु मान अवलोकन गर्न सक्नुहुन्छ।
३. औसत र मानक विचलनबाट आउटलियरहरू गणना गर्न AVERAGE र STDEV.P प्रकार्यहरू मिलाउनुहोस्
A मानक विचलन (वा σ ) सम्पूर्ण डेटा सेटको औसत मानको सन्दर्भमा डाटा कसरी वितरण गरिन्छ भनेर निर्धारण गर्ने मेट्रिक हो। मानक विचलन कम हुँदा डेटा औसतको वरिपरि समूहबद्ध गरिन्छ, जबकि मानक विचलन उच्च हुँदा डेटा बढी फैलिन्छ। मीन र मानक विचलन प्रयोग गरेर आउटलियरहरू गणना गर्न तपाईंले निम्न चरणहरू पालना गर्न सक्नुहुन्छ।
चरण 1:
- पहिले, यस लेखको सुरुमा देखाइएको समान डेटासेट प्रयोग गर्नुहोस् र त्यसपछि औसत र मानक विचलन गणना गर्नुहोस्। औसत गणना गर्न, सेल G5 मा AVERAGE प्रकार्य संग निम्न सूत्र टाइप गर्नुहोस्।
=AVERAGE(C5:C16)
चरण 2:
- मानक विचलन गणना गर्न, निम्न सूत्र घुसाउनुहोस् STDEV सेल G6 मा .P प्रकार्य ।
=STDEV.P(C5:C16)
चरण 3:
- अर्को, तपाईंले गणना गर्नुहुनेछप्रक्रियामा थप प्रगतिको लागि माथिल्लो सीमा। कक्ष G7 मा, निम्न सूत्र प्रयोग गरेर तल्लो सीमा गणना गर्नुहोस्।
=G5-(1.25*G6)
चरण 4:
- र कक्षमा G8 निम्न सूत्रबाट माथिल्लो सीमा गणना गर्नुहोस्
=G5+(1.5*G6)
चरण 5:
- त्यसपछि , कुनै बाहिरीहरू अवस्थित छन् वा छैनन् भनेर गणना गर्न, कक्षमा निम्न सूत्र टाइप गर्नुहोस् D5 ।
=OR(C5$G$8)
- यसैले, सूत्रले TRUE मान फर्काउनेछ यदि इच्छित कक्षमा निर्दिष्ट डाटा आउटलियर हो र FALSE।
- डबल-क्लिक गर्नुहोस् कक्षमा स्वतः भरण उपकरणमा D5 <7 स्तम्भ D मा रहेको बाँकी कक्षहरूमा सूत्र प्रतिलिपि गर्न। यसरी, तपाईंले आफ्नो डेटासेटमा बाँकी रहेका सबै आउटलियरहरू फेला पार्न सक्नुहुन्छ।
थप पढ्नुहोस्: एक्सेलमा मानक विचलन (द्रुत चरणहरूको साथ) सँग आउटलायरहरू कसरी फेला पार्न सकिन्छ
4. एक्सेलमा आउटलियरहरू गणना गर्न Z-स्कोर घुसाउनुहोस्
Z-स्कोर को लागि प्राय: प्रयोग हुने मेट्रिकहरू मध्ये एक हो बाहिरीहरूको पहिचान। यो विधिले एक विशिष्ट डेटा डेटासेटको माध्यबाट यसको मानक विचलनको सन्दर्भमा कति टाढा छ भनेर देखाउँछ। एक्सेलमा Z-स्कोर प्रयोग गरेर आउटलियरहरू गणना गर्न तपाईंले तल वर्णन गरिएका चरणहरू हेर्न सक्नुहुन्छ।
चरण 1:
- पहिले, इच्छित डेटा सेट लिनुहोस्।
चरण2:
- दोस्रो, कक्ष H5, मा मतलब गणना गर्न निम्न सूत्र टाइप गर्नुहोस्। 7>दिईएको डेटाको लागि।
=AVERAGE(C5:C16)
चरण ३:
- तेस्रो, निम्न सूत्र प्रयोग गरेर कक्ष H6 मा दिइएको डेटासेटको मानक विचलन गणना गर्नुहोस्।
=STDEV.P(C5:C16)
चरण 4:
- त्यसपछि , तपाईंले प्रत्येक डेटा मानको लागि Z -स्कोर निर्धारण गर्नुपर्छ। यसका लागि तपाईंले तल दिइएको सूत्र प्रयोग गर्नुहोस्।
=(C5-$H$5)/$H$6
चरण ५:
- सबै Z-मानहरू, गणना गरेपछि तपाईंले Z-मानहरू को दायरा देख्नुहुनेछ।> -1.44 र 13 बीचमा छ। त्यसोभए, हामी बाहिरी सीमाहरूको लागि -1.2 भन्दा कम वा +1.8 भन्दा कम Z-स्कोर को मानहरू विचार गर्छौं।
- त्यसपछि सेल E 5 मा निम्न सूत्र टाइप गर्नुहोस्।
=OR((D51.8))
- अन्तमा, सूत्रले TRUE मान फर्काउनेछ यदि विशिष्ट डेटा आउटलायर हो र फर्काउनेछ FALSE
- सेलमा डबल-क्लिक गर्नुहोस् E5 स्वत: भरण प्रयोग गर्न स्तम्भ E मा रहेको बाँकी कक्षहरूमा सूत्र प्रतिलिपि गर्न उपकरण भर्ने ह्यान्डल। यसरी, तपाईंले आफ्नो डेटासेटमा बाँकी सबै आउटलियरहरू फेला पार्न सक्नुहुन्छ।
थप पढ्नुहोस्: एक्सेलमा Z स्कोर प्रयोग गरेर आउटलियरहरू कसरी फेला पार्ने (क्विकसँग)चरणहरू)
5. एक्सेलमा आउटलियरहरू फेला पार्न ठूला र साना प्रकार्यहरू मर्ज गर्नुहोस्
ठूलो प्रकार्य र सानो प्रकार्य एक्सेलमा विपरीत कार्यहरू छन्। हामी यसलाई डेटा सेटमा क्रमशः सबैभन्दा ठूलो र सबैभन्दा सानो डेटा वा मानहरू फेला पार्न प्रयोग गर्नेछौं। यो प्रकार्यले सबै डाटालाई डाटा सेट भित्र तान्नेछ, सबैभन्दा सानो र ठूलो संख्याहरू फेला पार्नेछ। तिनीहरू दोस्रो सबैभन्दा सानो वा सबैभन्दा ठूलो, तेस्रो-ठूलो वा सबैभन्दा सानो, आदि फेला पार्न सक्षम छन्।
चरण 1:
- सर्वप्रथम, निम्न सूत्र प्रयोग गर्नुहोस् सेल E5 ठूलो प्रकार्य सँग।
=LARGE($C$5:$C$16,1)
-
- यसैले, 12 मानहरूबाट, तपाईंले पहिलो ठूलो मान देख्न सक्नुहुन्छ जुन <6 हो।> 780 ।
चरण २:
<13 =SMALL($C$5:$C$16,1)
- अन्तमा, 12 मानहरूबाट, तपाईंले पहिलो हेर्न सक्नुहुन्छ सबैभन्दा सानो मान 110 ।
- तपाईंले सबै आवश्यक मानहरू फेला पारेपछि, तपाईं सजिलैसँग डेटासेटमा कुनै पनि आउटलियरहरू देखाउन सक्नुहुन्छ।
निष्कर्ष
यो यस लेखको अन्त्य हो। मलाई आशा छ कि तपाईंले यो लेख उपयोगी पाउनुभयो। यो लेख पढिसकेपछि, तपाइँ कुनै पनि विधिहरू प्रयोग गरेर एक्सेलमा आउटलियरहरू गणना गर्न सक्षम हुनुहुनेछ। कृपया कुनै पनि थप प्रश्न वा सिफारिसहरू साझा गर्नुहोस्हामीलाई तलको टिप्पणी सेक्सनमा।