உள்ளடக்க அட்டவணை
புள்ளிவிவரங்கள், தரவுச் செயலாக்கம், இயந்திரக் கற்றல் போன்றவற்றில் உள்ள தரவை பகுப்பாய்வு செய்வதற்கு வெளியாட்களைக் கண்டறிந்து அவற்றை அகற்றுவது மிகவும் பொதுவான பணியாகும். உங்கள் தரவுத்தொகுப்பில் பல வழிகள் உள்ளன, ஆனால் அவற்றை அகற்றுவதற்கான செயல்முறை அவ்வளவு எளிதானது அல்ல. கண்டுபிடிக்க. இந்தக் கட்டுரையில், எக்செல் ல் உள்ள அவுட்லையர்களை எவ்வாறு அகற்றுவது என்பதை நாங்கள் உங்களுக்குக் காண்பிப்போம்.
ஒர்க்புக்கைப் பதிவிறக்கவும்
இதிலிருந்து இலவச பயிற்சி எக்செல் பணிப்புத்தகத்தைப் பதிவிறக்கலாம். இங்கே.
Outliers ஐ அகற்றுஎன்பது தரவுத்தொகுப்பின் சராசரி அல்லது இடைநிலை மதிப்பிலிருந்து கீழே விழும் மதிப்பு. வேறு வார்த்தைகளில் கூறுவதானால், தரவுத்தொகுப்பில் உள்ள மற்ற மதிப்புகளை விட குறிப்பிடத்தக்க அளவு அதிகமாகவோ அல்லது குறைவாகவோ இருக்கும் மதிப்புகள் அவுட்லையர்களாகும்.ஒரு கிரிக்கெட் போட்டியில் அனைத்து பேட்டர்களும் சுமார் 50 ரன்கள் எடுத்தனர், ஆனால் ஒரே ஒரு பேட்ஸ்மேன் மட்டுமே சதம் அடித்தார் (100). ) மற்றும் மற்றொரு பேட்ஸ்மேன் 0 இல் அவுட் ஆனார். இந்த போட்டியில் 100 மற்றும் 0 ஸ்கோர்கள்தான் அவுட்லையர்களாகும்.
வெளியீட்டாளர்கள் தரவு பகுப்பாய்வின் முடிவைத் திசைதிருப்பலாம் மற்றும் தவறான முடிவுகளை ஏற்படுத்தலாம். எனவே அவுட்லையர்களைக் கண்டறிந்து அவற்றை அகற்றுவது ஒரு மென்மையான தரவுத்தொகுப்பைப் பெறுவது நல்லது.
Excel இல் அவுட்லையர்களை அகற்ற 3 வழிகள்
இந்தப் பகுதியில், எப்படி என்பதை நீங்கள் கற்றுக் கொள்வீர்கள். 3 வெவ்வேறு வழிகளில் உங்கள் தரவுத்தொகுப்பில் இருந்து அவுட்லையர்களை நீக்கவும். அவுட்லையர்களை அகற்றுவது ஒரு தந்திரமான செயலாகும், எனவே முழு கட்டுரையையும் கவனமாக படிக்கவும்.
1. இல்லாமல் சராசரியைக் கணக்கிட எக்செல் செயல்பாட்டைப் பயன்படுத்துதல்Outliers
Excel TRIMMEAN செயல்பாடு என்பது அவுட்லையர்களைத் தவிர்த்து கொடுக்கப்பட்ட தரவுத்தொகுப்பின் சராசரியைக் கணக்கிடப் பயன்படும். விலக்க வேண்டிய தரவு புள்ளிகள் சதவீதமாக வழங்கப்படுகின்றன. சதவீத மதிப்பானது தசம வடிவம் அல்லது சதவீத வடிவமாக உள்ளீடு செய்யப்படலாம்.
வெளியீடுகள் இல்லாமல் சராசரியைக் கணக்கிடுவதற்கான தொடரியல்,
=TRIMMEAN(வரிசை, சதவீதம்)இங்கே,
- வரிசை = சராசரி முடிவை ஒழுங்கமைத்து கணக்கிடுவதற்கான தரவு வரம்பு
- சதவீதம் = தி விலக்க வேண்டிய தரவுப் புள்ளிகளின் எண்ணிக்கை
அகற்றப்பட்ட அவுட்லையர்களைக் கொண்டு முடிவுகளைக் கணக்கிட இந்தச் செயல்பாட்டைச் செயல்படுத்துவது எப்படி என்று பார்ப்போம்.
மேலே உள்ள படத்தைக் கவனியுங்கள். எங்களிடம் செல் B5 முதல் B14 வரையிலான தரவு உள்ளது. இங்கே பெரும்பாலான எண்கள் 20 முதல் 27 வரை இருக்கும், ஆனால் இரண்டு மதிப்புகள் - 0 மற்றும் 100 - அந்த மதிப்புகளிலிருந்து வெகு தொலைவில் உள்ளன. எனவே இவை எங்கள் தரவுத்தொகுப்பில் உள்ள அவுட்லியர்ஸ் ஆகும்.
எங்கள் தரவுத்தொகுப்புக்கு, Excel TRIMMEAN செயல்பாட்டுடன் வெளிப்புற மதிப்புகள் இல்லாமல் சராசரி (சராசரி) கணக்கிடுவதற்கான சூத்திரம்,
=TRIMMEAN(B5:B14,0.2)
இங்கே,
- B5:B14 = சராசரி முடிவை ஒழுங்கமைத்து கணக்கிடுவதற்கான தரவு வரம்பு
- 0.2 (அல்லது 20%) = விலக்க வேண்டிய தரவுப் புள்ளிகளின் எண்ணிக்கை
தரவுத்தொகுப்பில் உள்ள எந்த எண்ணும் மீதமுள்ள தரவுத்தொகுப்பில் இருந்து 20% குறைந்தால் , பிறகு அந்த எண் outliers என்று அழைக்கப்படும்.
உங்கள் தரவுத்தொகுப்பின்படி நீங்கள் சூத்திரத்தை எழுதி Enter ஐ அழுத்தினால், நீங்கள் கணக்கிடப்பட்ட சராசரியை outliers இல்லாமல் பெறுவீர்கள். உங்கள் தரவுத்தொகுப்புக்கு. எங்கள் விஷயத்தில், செல் E6 கணக்கிடப்பட்ட சராசரியை 23.50 வைத்திருக்கிறது.
பதில் சரியானதா இல்லையா என்பதைச் சரிபார்க்க, நாங்கள் சராசரி செயல்பாட்டை இயக்குகிறோம் செல் E5 இல் B5:B14 வரம்பில் உள்ள அனைத்து மதிப்புகளின் சராசரியை ( 28.80 ) வழங்குகிறது. மேலும் செல் E7 இல், அவுட்லையர்ஸ் மதிப்புகளை வைத்திருக்கும் செல்களைத் தவிர அனைத்து கலங்களையும் கைமுறையாக உள்ளீடு செய்வதன் மூலம் மற்றொரு சராசரி செயல்பாட்டை இயக்குகிறோம், இதன் விளைவாக 23.50 திரும்பப் பெற்றோம்.
எனவே, எக்செல் இல் சராசரியைக் கணக்கிடும் போது, TRIMMEAN செயல்பாடு, கொடுக்கப்பட்ட தரவுத்தொகுப்பில் இருந்து அவுட்லையர்களை வெற்றிகரமாக அகற்றும் என்று நாம் கூறலாம்.
மேலும் படிக்க: எக்செல் (7+ முறைகள்) இல் ஃபார்முலாவை எவ்வாறு அழிப்பது
2. எக்செல்
ல் டேட்டாசெட் மற்றும் லைன் சார்ட்டில் இருந்து அவுட்லையர்களை அகற்று
பின்வரும் படத்தை கவனிக்கவும். ஒரு வரி வரைபடத்தை உருவாக்கிய சில தரவுகள் எங்களிடம் உள்ளன. வரி வரைபடத்தில் இருந்து, தரவுப் புள்ளிகள் 4 மற்றும் 8 இல் எங்களின் வெளிப்புறங்கள் இருப்பதை எளிதாகக் காணலாம்.
இப்போது நாம் எப்படி மென்மையாக்கலாம் என்பதைப் பார்ப்போம். தரவுத்தொகுப்பில் இருந்து வெளிப்புற மதிப்புகளை அகற்றுவதன் மூலம் வரி விளக்கப்படத்திற்கு வெளியே.
மற்றொரு கலத்தில் (எங்கள் விஷயத்தில் இது செல் H6 ), பின்வரும் சூத்திரத்தை எழுதவும்,
7> =IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
இங்கே,
- C6 = தரவுத்தொகுப்பில் முதல் தரவை வைத்திருக்கும் செல்
- C5 = முதல் தரவுக் கலத்திற்கு மேலே உள்ள செல்
- C7 = முதல் தரவுக் கலத்திற்குக் கீழே செல்
- $E$6 = தரவுப் புள்ளிகளுக்கு இடையே உள்ள வேறுபாடு .
பார்க்கிறேன்எங்கள் தரவு, ஒரு தரவுப் புள்ளி மற்றவற்றிலிருந்து 10 அலகுகள் வேறுபடும் போது, அவுட்லியர் என குறிப்பிடப்படுகிறது. எனவே, செல் E6 ல் 10 ஐ வைத்து, அதை முழுமையான செல் குறிப்பாக உருவாக்குகிறோம், இதனால் முழு தரவுத்தொகுப்பையும் ஸ்கேன் செய்து கணக்கிடும்போது இந்தக் கலம் சரி செய்யப்படும்.<3
Enter ஐ அழுத்திய பிறகு, முடிவு கலத்தில் H6 முதல் தரவு இன்னும் தோன்றுவதைக் காணலாம். நீங்கள் இங்கு செய்ய வேண்டியதெல்லாம், சூத்திரத்தை உருவாக்குவது மட்டுமே, இதன் மூலம் மீதமுள்ள கலங்களுக்கு சூத்திரத்தைப் பயன்படுத்த ஃபில் ஹேண்டில் ஐ இழுக்கலாம்.
இப்போது Fill Handle உடன் வரிசையை கீழே இழுக்கவும். 17>
மேலும் இப்போது வரி விளக்கப்படத்தைப் பார்க்கவும், இது இப்போது எந்த வெளிப்புற மதிப்புகளும் இல்லாமல் ஒரு தட்டையான வரைபடமாக உள்ளது.
சூத்திரப் பிரிப்பு
=IF(
முடிவைப் பிரித்தெடுக்கும் மதிப்புகளின் அடிப்படையில் நாம் ஒப்பிடப் போகிறோம், நாங்கள் சூத்திரத்தைத் தொடங்குகிறோம் IF நிபந்தனை.
=IF(AND(
நாம் தற்போதைய தரவுப் புள்ளியையும் மேலே உள்ள கலத்தையும் கீழே உள்ள கலத்தையும் ஒப்பிடப் போகிறோம். . இரண்டு ஒப்பீடுகளும் உண்மையாக இருந்தால், அதன் விளைவாக தரவுப் புள்ளியைக் காண்பிப்போம். எனவே, "இரண்டு" ஒப்பீடுகளையும் நாம் கையாள வேண்டும் என்பதால், மற்றும் செயல்பாட்டை பயன்படுத்த வேண்டும்.
0> =IF(AND(ABS(நாம் தரவு புள்ளிகளைக் கழிக்கும்போது, சில தரவு எதிர்மறை மதிப்புகளை வீசலாம். மேலும் நாங்கள் செய்கிறோம் இல்லைஎதிர்மறை மதிப்புகள் எப்போதுமே "வேறுபாடு 10 ஆக இருக்கும் போது தரவை அகற்றும்" நிபந்தனைக்கு முரணாக இருப்பதால் எதிர்மறை மதிப்புகளை சமாளிக்க வேண்டும். எனவே எப்பொழுதும் நேர்மறையான முடிவுகளைப் பெறுவதை உறுதிசெய்ய, ஒப்பீடுகளை முழுமையான மதிப்பு செயல்பாட்டில் மடிக்க வேண்டும்.
=IF(AND(ABS(C6-C5)>) ;$E$6
இங்கே நாங்கள் எங்கள் முதல் ஒப்பீட்டைத் தொடங்கினோம். தற்போதைய மதிப்பை மேலே உள்ள மதிப்புடன் கழித்துவிட்டு, செல் E6<2 இல் சேமிக்கப்பட்டுள்ள வேறுபாடு அளவை விட முடிவு அதிகமாக உள்ளதா என்பதைப் பார்க்கிறோம்> மற்றும் செல் மதிப்பைப் பூட்டி வைக்க, கலத்தை முழுமையான குறிப்பான் ஆக்கியது.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
அடுத்து, காற்புள்ளியால் பிரிக்கப்பட்ட ஒப்பீட்டின் இரண்டாம் பகுதி. இது தற்போதைய தரவுப் புள்ளியை அடுத்த தரவுப் புள்ளியுடன் ஒப்பிடும்.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
இப்போது வைக்கிறோம் காற்புள்ளி மற்றும் மற்றும் செயல்பாடுகள் இரண்டும் உண்மையாக இருந்தால், NA செயல்பாட்டை உள்ளிட தீர்மானிக்கவும்.
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
மேலும் மற்றும் செயல்பாடு உண்மையாக இல்லை என்றால் நாங்கள் உண்மையான தரவுப் புள்ளியை IF தவறான மதிப்பாகத் திரும்பப் பெற விரும்புகிறோம். எனவே தட்டச்சு செய்கிறோம் e ஒரு கமாவில் மற்றும் செல் குறிப்பு எண்ணை அனுப்பவும் C6 .
மேலும் படிக்க: எக்செல் இல் தரவு சரிபார்ப்பை எவ்வாறு அகற்றுவது (5 வழிகள்)
இதே மாதிரியான அளவீடுகள்
- எக்செல் (4 முறைகள்) இல் தலைப்பை எவ்வாறு அகற்றுவது
- புள்ளியிடப்பட்ட கோடுகளை அகற்றவும்எக்செல் (5 விரைவு வழிகள்)
- எக்செல் இலிருந்து கட்டத்தை அகற்றுவது எப்படி (6 எளிதான முறைகள்)
- எக்செல் இல் உள்ள எல்லைகளை அகற்று (4 விரைவு வழிகள்)
- எக்செல் இல் பொருந்தக்கூடிய பயன்முறையை எவ்வாறு அகற்றுவது (2 எளிதான வழிகள்)
3. Excel இல் அவுட்லையர்களை கைமுறையாக அகற்று
Excel இல் உள்ள அவுட்லையர்களை அகற்றுவதற்கான மற்றொரு எளிய வழி, உங்கள் தரவுத்தொகுப்பின் மதிப்புகளை வரிசைப்படுத்தி, அதிலிருந்து மேல் மற்றும் கீழ் மதிப்புகளை கைமுறையாக நீக்குவது.
வரிசைப்படுத்த. தரவு,
- தேர்ந்தெடு தரவுத்தொகுப்பு.
- வரிசைப்படுத்து & எடிட்டிங் குழுவில் வடிகட்டி சிறியது முதல் பெரியது அல்லது பெரியது முதல் சிறியது என வரிசைப்படுத்துங்கள்.
<19
- எங்கள் விஷயத்தில், சிறியது முதல் பெரியது வரை வரிசைப்படுத்து என்பதைத் தேர்ந்தெடுத்தோம். இது எங்கள் தரவுத்தொகுப்பில் உள்ள எண்களை ஏறுவரிசையில் வரிசைப்படுத்தி, சிறியவற்றை மேலேயும் பெரியவற்றை கீழேயும் வைத்தது.
இப்போது அந்தத் தரவை கைமுறையாக நீக்கவும். தரவுத்தொகுப்பை வெளிப்புற மதிப்புகளை இலவசமாக்க.
பெரிய தரவுத்தொகுப்பில் பணிபுரியும் போது இந்த செயல்முறையைப் பின்பற்றுவதை நாங்கள் பரிந்துரைக்கவில்லை. உங்கள் தரவுத்தொகுப்பு சிறியதாகவும் பார்க்க எளிதாகவும் இருக்கும் போது, இந்த நடைமுறையை நீங்கள் பயன்படுத்த முடியும், இல்லையெனில் இதை செயல்படுத்த வேண்டாம்.
மேலும் படிக்க: எக்செல் இல் வரிசையை அகற்றுவது எப்படி ( 3 எளிய முறைகள்)
முடிவு
எக்செல் இல் அவுட்லையர்களை அகற்றுவது எப்படி என்பதை இந்தக் கட்டுரை உங்களுக்குக் காட்டுகிறது. இந்த கட்டுரை உங்களுக்கு மிகவும் பயனுள்ளதாக இருந்தது என்று நம்புகிறேன். பற்றி ஏதேனும் கேள்விகள் இருந்தால் தயங்காமல் கேட்கவும்தலைப்பு.