విషయ సూచిక
గణాంకాలు, డేటా మైనింగ్, మెషిన్ లెర్నింగ్ మొదలైనవాటిలో డేటాను విశ్లేషించడానికి అవుట్లయర్లను కనుగొనడం మరియు వాటిని తీసివేయడం చాలా సాధారణమైన పని. మీరు మీ డేటాసెట్లో అవుట్లైయర్లను కనుగొనడానికి చాలా మార్గాలు ఉన్నాయి కానీ వాటిని తొలగించే ప్రక్రియ అంత సులభం కాదు. కనుగొనండి. ఈ కథనంలో, ఎక్సెల్లో అవుట్లైయర్లను ఎలా తీసివేయాలో మేము మీకు చూపుతాము.
వర్క్బుక్ని డౌన్లోడ్ చేయండి
మీరు ఉచిత ప్రాక్టీస్ Excel వర్క్బుక్ని డౌన్లోడ్ చేసుకోవచ్చు ఇక్కడ.
Outliersని తీసివేయండిఅనేది డేటాసెట్ యొక్క సగటు లేదా మధ్యస్థ విలువ నుండి దూరంగా ఉండే విలువ. మరో మాటలో చెప్పాలంటే, డేటాసెట్లోని మిగిలిన విలువల కంటే గణనీయంగా ఎక్కువ లేదా తక్కువగా ఉండే విలువలను అవుట్లయర్లు అంటారు.క్రికెట్ మ్యాచ్ గురించి ఆలోచించండి, అక్కడ బ్యాటర్లందరూ దాదాపు 50 పరుగులు చేశారు, అయితే ఒక్క బ్యాట్స్మన్ మాత్రమే సెంచరీ (100) చేశాడు. ) మరియు మరొక బ్యాట్స్మెన్ 0 వద్ద అవుట్ అయ్యాడు. ఈ మ్యాచ్లో 100 మరియు 0 స్కోర్లు అవుట్లైయర్లు.
అవుట్లయర్లు డేటా విశ్లేషణ ఫలితాన్ని వక్రీకరించి తప్పుదారి పట్టించే ఫలితాలు రావడంతో సమస్యాత్మకం. కాబట్టి ఔట్లైయర్లను కనుగొనడం మరియు వాటిని తొలగించడం మంచిది డేటాసెట్ను కలిగి ఉంటుంది.
Excelలో అవుట్లయర్లను తీసివేయడానికి 3 మార్గాలు
ఈ విభాగంలో, మీరు ఎలా చేయాలో నేర్చుకుంటారు. 3 విభిన్న మార్గాల్లో మీ డేటాసెట్ నుండి అవుట్లయర్లను తొలగించండి . అవుట్లైయర్లను తీసివేయడం ఒక గమ్మత్తైన ప్రక్రియ, కాబట్టి మొత్తం కథనాన్ని జాగ్రత్తగా చదవండి.
1. లేకుండా సగటును లెక్కించడానికి ఎక్సెల్ ఫంక్షన్ని ఉపయోగించడంఅవుట్లయర్లను మినహాయించి ఇచ్చిన డేటాసెట్ సగటును లెక్కించడానికి అవుట్లియర్లు
Excel TRIMMEAN ఫంక్షన్ ని ఉపయోగించవచ్చు. మినహాయించాల్సిన డేటా పాయింట్లు శాతంగా అందించబడతాయి. శాతం విలువను దశాంశ ఆకృతి లేదా శాతం ఫార్మాట్గా ఇన్పుట్ చేయవచ్చు.
అవుట్లియర్లు లేకుండా సగటును లెక్కించడానికి సింటాక్స్,
=TRIMMEAN(అరే, శాతం)ఇక్కడ,
- శ్రేణి = ట్రిమ్ చేయడానికి మరియు సగటు ఫలితాన్ని లెక్కించడానికి డేటా పరిధి
- శాతం = ది మినహాయించాల్సిన డేటా పాయింట్ల సంఖ్య
తీసివేయబడిన అవుట్లయర్లతో ఫలితాలను గణించడానికి ఈ ఫంక్షన్ని ఎలా అమలు చేయాలో చూద్దాం.
పై చిత్రాన్ని పరిగణించండి. మా వద్ద సెల్ B5 నుండి B14 వరకు డేటా ఉంది. ఇక్కడ చాలా సంఖ్యలు 20 నుండి 27 మధ్య ఉన్నాయి, కానీ రెండు విలువలు - 0 మరియు 100 - ఆ విలువలకు దూరంగా ఉన్నాయి. కాబట్టి ఇవి మా డేటాసెట్లోని అవుట్లియర్లు .
మా డేటాసెట్ కోసం, Excel TRIMMEAN ఫంక్షన్తో అవుట్లియర్ విలువలు లేకుండా సగటు (సగటు) గణించే ఫార్ములా,
=TRIMMEAN(B5:B14,0.2)
ఇక్కడ,
- B5:B14 = ట్రిమ్ చేయడానికి మరియు సగటు ఫలితాన్ని లెక్కించడానికి డేటా పరిధి
- 0.2 (లేదా 20%) = మినహాయించాల్సిన డేటా పాయింట్ల సంఖ్య
డేటాసెట్లోని ఏదైనా సంఖ్య మిగిలిన డేటాసెట్లో 20% తగ్గితే , అప్పుడు ఆ సంఖ్య అవుట్లియర్స్ అని పిలువబడుతుంది.
మీరు మీ డేటాసెట్ ప్రకారం ఫార్ములాను వ్రాసి, ఎంటర్ నొక్కితే, మీరు అవుట్లయర్లు లేకుండా లెక్కించిన సగటును పొందుతారు మీ డేటాసెట్ కోసం. మా సందర్భంలో, సెల్ E6 లెక్కించిన సగటును కలిగి ఉంటుంది, ఇది 23.50 .
సమాధానం సరైనదో కాదో తనిఖీ చేయడానికి, మేము సగటు ఫంక్షన్ను అమలు చేస్తాము. సెల్ E5 లో B5:B14 పరిధిలోని అన్ని విలువల సగటు ( 28.80 )ని అందిస్తుంది. మరియు సెల్ E7 లో, మేము అవుట్లయర్ విలువలను కలిగి ఉన్న సెల్లను మినహాయించి అన్ని సెల్లను మాన్యువల్గా ఇన్పుట్ చేయడం ద్వారా మరొక సగటు ఫంక్షన్ను అమలు చేస్తాము మరియు ఫలితంగా 23.50 తిరిగి పొందాము.
కాబట్టి మేము TRIMMEAN ఫంక్షన్ Excelలో సగటును గణిస్తున్నప్పుడు ఇచ్చిన డేటాసెట్ నుండి అవుట్లయర్లను విజయవంతంగా తొలగించగలదని చెప్పగలం.
మరింత చదవండి: Excel (7+ మెథడ్స్)లో ఫార్ములా క్లియర్ చేయడం ఎలా
2. Excelలో డేటాసెట్ మరియు లైన్ చార్ట్ నుండి అవుట్లియర్లను తీసివేయండి
క్రింది చిత్రాన్ని గమనించండి. మేము లైన్ గ్రాఫ్ని సృష్టించిన దాని ఆధారంగా మాకు కొంత డేటా ఉంది. లైన్ గ్రాఫ్ నుండి, డేటా పాయింట్లు 4 మరియు 8లో మనకు మా అవుట్లయర్లు ఉన్నాయని సులభంగా చూడవచ్చు.
ఇప్పుడు మనం ఎలా స్మూత్ చేయవచ్చో చూద్దాం డేటాసెట్ నుండి బయటి విలువలను తీసివేయడం ద్వారా లైన్ చార్ట్ను తీసివేయండి.
మరొక సెల్లో (మా విషయంలో ఇది సెల్ H6 ), క్రింది సూత్రాన్ని వ్రాయండి,
7> =IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ఇక్కడ,
- C6 = డేటాసెట్లోని మొదటి డేటాను కలిగి ఉన్న సెల్
- C5 = మొదటి డేటా సెల్ పైన ఉన్న సెల్
- C7 = మొదటి డేటా సెల్ క్రింద సెల్
- $E$6 = డేటా పాయింట్ల మధ్య వ్యత్యాసం .
చూస్తోందిమా డేటా, ఒక డేటా పాయింట్ 10 యూనిట్లు ఇతరుల నుండి భిన్నంగా ఉన్నప్పుడు, అవుట్లియర్ గా సూచించబడుతుంది. కాబట్టి మేము సెల్ E6 లో 10 ని ఉంచాము మరియు దానిని సంపూర్ణ సెల్ రిఫరెన్స్ గా చేస్తాము, తద్వారా మొత్తం డేటాసెట్ను స్కాన్ చేస్తున్నప్పుడు మరియు లెక్కించేటప్పుడు ఈ సెల్ పరిష్కరించబడుతుంది.
Enter నొక్కిన తర్వాత, మీరు మొదటి డేటా ఫలితం సెల్ H6 లో ఇప్పటికీ కనిపించడాన్ని చూడవచ్చు. మీరు ఇక్కడ చేయాల్సిందల్లా, సూత్రాన్ని నిర్మించడం మాత్రమే, తద్వారా మేము మిగిలిన సెల్లకు ఫార్ములాను వర్తింపజేయడానికి ఫిల్ హ్యాండిల్ ని లాగవచ్చు.
ఇప్పుడు ఫిల్ హ్యాండిల్ తో అడ్డు వరుసను క్రిందికి లాగండి మరియు అవుట్లయర్లను కలిగి ఉన్న సెల్లు ఇప్పుడు #N/A తో నిండి ఉన్నట్లు మీరు చూస్తారు.
మరియు ఇప్పుడు లైన్ చార్ట్ని చూడండి, ఇది ఇప్పుడు ఎటువంటి బాహ్య విలువలు లేకుండా చదును చేయబడిన గ్రాఫ్.
ఫార్ములా బ్రేక్డౌన్
=IF(
మేము ఫలితాన్ని సంగ్రహించే దాని ఆధారంగా విలువలను సరిపోల్చబోతున్నాము, మేము దీనితో సూత్రాన్ని ప్రారంభిస్తాము IF షరతు.
=IF(AND(
మేము ప్రస్తుత డేటా పాయింట్ మరియు ఎగువ సెల్ మరియు దిగువ సెల్ను సరిపోల్చబోతున్నాము . మరియు రెండు పోలికలు నిజమైతే, అప్పుడు మాత్రమే మేము డేటా పాయింట్ని ఫలితంగా చూపుతాము. కాబట్టి, మనం “రెండూ” పోలికలతో వ్యవహరించాలి కాబట్టి మనం మరియు ఫంక్షన్ ని ఉపయోగించాలి.
0> =IF(AND(ABS(మేము డేటా పాయింట్లను తీసివేసినప్పుడు, కొన్ని డేటా ప్రతికూల విలువలను విసిరివేస్తుంది. మరియు మేము చేస్తాము కాదుప్రతికూల విలువలు ఎల్లప్పుడూ "తేడా 10 ఉన్నప్పుడు డేటాను తీసివేయడం" యొక్క షరతుకు విరుద్ధంగా ఉంటాయి కాబట్టి ప్రతికూల విలువలతో వ్యవహరించాలనుకుంటున్నారు. కాబట్టి మేము ఎల్లప్పుడూ సానుకూల ఫలితాలను కలిగి ఉన్నామని నిర్ధారించుకోవడానికి, మేము సంపూర్ణ విలువ ఫంక్షన్ లో పోలికలను చుట్టాలి.
=IF(AND(ABS(C6-C5)>) ;$E$6
ఇక్కడ మేము మా మొదటి పోలికను ప్రారంభించాము. మేము ప్రస్తుత విలువను ఎగువ ఉన్న విలువతో తీసివేసి, సెల్ E6<2లో నిల్వ చేయబడిన వ్యత్యాస స్థాయి కంటే ఫలితం ఎక్కువగా ఉందో లేదో చూద్దాం> మరియు సెల్ విలువను లాక్లో ఉంచడానికి సెల్ను సంపూర్ణ సూచన గా చేసారు.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
తర్వాత, కామాతో వేరు చేయబడిన పోలిక యొక్క రెండవ భాగం. ఇది ప్రస్తుత డేటా పాయింట్ను తదుపరి డేటా పాయింట్తో పోలుస్తుంది.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
ఇప్పుడు మనం ఉంచాము కామా మరియు మరియు ఫంక్షన్లు రెండూ నిజమైతే అక్కడ NA ఫంక్షన్ ని ఉంచాలని నిర్ణయించండి.
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
మరియు AND ఫంక్షన్ నిజం కాకపోతే మేము వాస్తవ డేటా పాయింట్ని IF తప్పుడు విలువగా తిరిగి ఇవ్వాలనుకుంటున్నాము. కాబట్టి మేము టైప్ చేస్తాము e కామాలో మరియు సెల్ రిఫరెన్స్ నంబర్ను అక్కడ పాస్ చేయండి C6 .
మరింత చదవండి: Excelలో డేటా ధ్రువీకరణను ఎలా తీసివేయాలి (5 మార్గాలు)
సారూప్య రీడింగ్లు
- Excelలో హెడర్ను ఎలా తొలగించాలి (4 పద్ధతులు)
- లో చుక్కల రేఖలను తొలగించండిExcel (5 త్వరిత మార్గాలు)
- Excel నుండి గ్రిడ్ను ఎలా తీసివేయాలి (6 సులభమైన పద్ధతులు)
- Excelలో సరిహద్దులను తొలగించండి (4 త్వరిత మార్గాలు)
- Excelలో అనుకూలత మోడ్ని ఎలా తీసివేయాలి (2 సులభమైన మార్గాలు)
3. Excelలో అవుట్లైయర్లను మాన్యువల్గా తీసివేయండి
Excelలో అవుట్లయర్లను తొలగించడానికి మరొక సులభమైన మార్గం, మీ డేటాసెట్ విలువలను క్రమబద్ధీకరించండి మరియు దాని నుండి ఎగువ మరియు దిగువ విలువలను మాన్యువల్గా తొలగించండి.
క్రమీకరించడానికి. డేటా,
- డేటాసెట్ని ఎంచుకోండి.
- క్రమీకరించు & సవరణ సమూహంలో ని ఫిల్టర్ చేయండి మరియు చిన్నది నుండి పెద్దది నుండి క్రమీకరించు లేదా అతి పెద్దది నుండి చిన్నది వరకు క్రమీకరించు .
<19
- మా విషయంలో, మేము చిన్నవి నుండి పెద్దవిగా క్రమీకరించు ని ఎంచుకున్నాము. ఇది మా డేటాసెట్లోని సంఖ్యలను ఆరోహణ క్రమంలో క్రమబద్ధీకరించింది, చిన్న వాటిని ఎగువన మరియు పెద్ద వాటిని దిగువన ఉంచుతుంది.
ఇప్పుడు ఆ డేటాను మాన్యువల్గా తొలగించండి. డేటాసెట్ అవుట్లైయింగ్ విలువలను ఉచితంగా చేయడానికి.
పెద్ద డేటాసెట్తో పని చేస్తున్నప్పుడు ఈ విధానాన్ని అనుసరించమని మేము సిఫార్సు చేయము. మీ డేటాసెట్ చిన్నగా మరియు వీక్షించడానికి సులభంగా ఉన్నప్పుడు, అప్పుడు మాత్రమే మీరు ఈ విధానాన్ని వర్తింపజేయగలరు, లేకుంటే దీన్ని అమలు చేయవద్దు.
మరింత చదవండి: Excelలో క్రమబద్ధీకరణను ఎలా తీసివేయాలి ( 3 సులభమైన పద్ధతులు)
ముగింపు
Excelలో అవుట్లయర్లను ఎలా తీసివేయాలో ఈ కథనం మీకు చూపింది. ఈ వ్యాసం మీకు చాలా ఉపయోగకరంగా ఉందని నేను ఆశిస్తున్నాను. మీకు సంబంధించి ఏవైనా ప్రశ్నలు ఉంటే అడగడానికి సంకోచించకండిఅంశం.