අන්තර්ගත වගුව
සංඛ්යාලේඛන, දත්ත කැණීම, යන්ත්ර ඉගෙනීම ආදී වශයෙන් දත්ත විශ්ලේෂණය කිරීම සඳහා පිටස්තරයන් සොයා ගැනීම සහ ඒවා ඉවත් කිරීම ඉතා සුලභ කාර්යයකි. ඔබේ දත්ත කට්ටලය තුළ ඔබට පිටස්තරයින් සොයා ගත හැකි ක්රම බොහොමයක් ඇතත් ඒවා ඉවත් කිරීමේ ක්රියාවලිය එතරම් පහසු නැත. සොයාගන්න. මෙම ලිපියෙන්, අපි ඔබට පෙන්වන්නේ එක්සෙල් හි පිටස්තර ඉවත් කරන ආකාරය .
වැඩපොත බාගන්න
ඔබට නොමිලේ පුහුණු Excel වැඩපොත බාගත කළ හැක මෙන්න.
Outliers ඉවත් කරන්නයනු දත්ත කට්ටලයක මධ්යන්ය හෝ මධ්ය අගයෙන් පහළට වැටෙන අගයකි. වෙනත් වචන වලින් කිවහොත්, outliers යනු දත්ත කට්ටලයක ඉතිරි අගයන්ට වඩා සැලකිය යුතු ලෙස ඉහල හෝ අඩු අගයන් වේ.ක්රිකට් තරඟයක් ගැන සිතන්න, එහිදී සියලුම පිතිකරුවන් ලකුණු 50ක් පමණ ලබා ගත් නමුත් එක් පිතිකරුවෙකු පමණක් ශතකයක් (100) ලබා ගත්තා. ) සහ තවත් පිතිකරුවෙක් 0 දී දැවී ගියේය. එම ලකුණු 100 සහ 0 මෙම තරගයේ පිටස්තරයන් වේ.
දත්ත විශ්ලේෂණයේ ප්රතිඵලය විකෘති කර නොමඟ යවන සුළු ප්රතිඵල ඇති විය හැකි බැවින් පිටස්තරයින් ගැටළුකාරී වේ. එබැවින් සුමට දත්ත කට්ටලයක් ලබා ගැනීම සඳහා පිටස්තරයන් සොයා ඒවා ඉවත් කිරීම වඩා හොඳය.
Excel හි Outliers ඉවත් කිරීමට ක්රම 3
මෙම කොටසේදී, ඔබ ඉගෙන ගනු ඇත විවිධ ආකාර 3 කින් ඔබගේ දත්ත කට්ටලයෙන් පිටස්තර මකන්න. පිටස්තර ඉවත් කිරීම උපක්රමශීලී ක්රියාවලියකි, එබැවින් සම්පූර්ණ ලිපිය ප්රවේශමෙන් කියවන්න.
1. නොමැතිව සාමාන්ය ගණනය කිරීමට Excel ශ්රිතය භාවිතා කිරීමOutliers
Excel TRIMMEAN ශ්රිතය ලබා දී ඇති දත්ත කට්ටලයක සාමාන්යය ගණනය කිරීමට භාවිතා කළ හැක. බැහැර කළ යුතු දත්ත ප්රතිශතයක් ලෙස සපයනු ලැබේ. ප්රතිශත අගය දශම ආකෘතියක් හෝ ප්රතිශත ආකෘතියක් ලෙස ආදානය කළ හැක.
පිටස්තර රහිත මධ්යන්යය ගණනය කිරීමට වාක්ය ඛණ්ඩය වේ,
=TRIMMEAN(array, ප්රතිශතය)මෙහි,
- array = සාමාන්ය ප්රතිඵලය කප්පාදු කිරීමට සහ ගණනය කිරීමට දත්ත පරාසය
- සියයට = බැහැර කළ යුතු දත්ත ලක්ෂ්ය ගණන
ඉවත් කළ පිටස්තර සමඟ ප්රතිඵල ගණනය කිරීමට මෙම ශ්රිතය ක්රියාත්මක කරන්නේ කෙසේදැයි බලමු.
ඉහත පින්තූරය සලකා බලන්න. අපට Cell B5 සිට B14 දක්වා දත්ත තිබේ. මෙහි බොහෝ සංඛ්යා 20 සිට 27 අතර වේ, නමුත් අගයන් දෙකක් - 0 සහ 100 - එම අගයන්ගෙන් බොහෝ දුරස් වේ. එබැවින් මේවා අපගේ දත්ත කට්ටලයේ ඇති පිටස්තර වේ.
අපගේ දත්ත කට්ටලය සඳහා, Excel TRIMMEAN ශ්රිතය සමඟින් පිටත අගයන් නොමැතිව මධ්යන්යය (සාමාන්ය) ගණනය කිරීමේ සූත්රය වන්නේ,
=TRIMMEAN(B5:B14,0.2)
මෙහි,
- B5:B14 = සාමාන්ය ප්රතිඵලය කැපීමට සහ ගණනය කිරීමට දත්ත පරාසය
- 0.2 (හෝ 20%) = බැහැර කළ යුතු දත්ත ලක්ෂ්ය ගණන
දත්ත කට්ටලයේ කිසියම් සංඛ්යාවක් ඉතිරි දත්ත කට්ටලයට වඩා 20%ක් පහත වැටේ නම් , එවිට එම අංකය outliers ලෙස හඳුන්වනු ලැබේ.
ඔබගේ දත්ත කට්ටලයට අනුව සූත්රය ලියා Enter ඔබා ඇත්නම්, ඔබට ගණනය කළ මධ්යන්යය පිටස්තර රහිතව ලැබෙනු ඇත. ඔබගේ දත්ත කට්ටලය සඳහා. අපගේ නඩුවේදී, Cell E6 23.50 ගණනය කළ මධ්යය රඳවා තබා ගනී.
පිළිතුර නිවැරදිද නැද්ද යන්න පරීක්ෂා කිරීමට, අපි AVERAGE ශ්රිතය ක්රියාත්මක කරමු. Cell E5 හි B5:B14 පරාසයේ ඇති සියලුම අගයන් වල සාමාන්යය ( 28.80 ) ලබා දෙයි. තවද Cell E7 හි, අපි පිටස්තර අගයන් ඇති සෛල හැර අනෙකුත් සියලුම සෛල හස්තීයව ආදානය කිරීමෙන් තවත් AVERAGE ශ්රිතයක් ක්රියාත්මක කරන අතර එහි ප්රතිඵලයක් ලෙස 23.50 ප්රතිලාභයක් ලැබුණි.
එබැවින් අපට කියන්න පුළුවන් TRIMMEAN ශ්රිතයට Excel හි සාමාන්යය ගණනය කරන අතරතුර දී ඇති දත්ත කට්ටලයකින් පිටස්තරයන් සාර්ථකව ඉවත් කළ හැකි බව.
තවත් කියවන්න: Excel හි සූත්රය ඉවත් කරන්නේ කෙසේද (7+ ක්රම)
2. Excel
Dataset සහ Line Chart වෙතින් Outliers ඉවත් කරන්න
පහත පින්තූරය සැලකිල්ලට ගන්න. අපි රේඛා ප්රස්ථාරයක් සෑදූ දත්ත කිහිපයක් අප සතුව ඇත. රේඛා ප්රස්ථාරයෙන්, දත්ත ලක්ෂ්ය 4 සහ 8 හි අපට අපගේ පිටස්තරයන් ඇති බව අපට පහසුවෙන් දැකගත හැක .
දැන් අපි බලමු කොහොමද අපි සුමට කරන්නේ කියලා. දත්ත කට්ටලයෙන් බැහැර අගයන් ඉවත් කිරීමෙන් රේඛා ප්රස්ථාරයෙන් ඉවත් වන්න.
වෙනත් කොටුවක (අපගේ නඩුවේ එය Cell H6 වේ), පහත සූත්රය ලියන්න,
7> =IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
මෙහි,
- C6 = දත්ත කට්ටලයේ පළමු දත්ත රඳවා තබා ගන්නා කොටුව
- C5 = පළමු දත්ත කොටුවට ඉහළින් ඇති කොටුව
- C7 = පළමු දත්ත කොටුවට පහළින් ඇති කොටුව
- $E$6 = දත්ත ලක්ෂ්ය අතර වෙනස .
බලනවාඅපගේ දත්ත, දත්ත ලක්ෂ්යයක් අනෙක් ඒවාට වඩා ඒකක 10 ක් වෙනස් වන විට, පිටත ලෙස නම් කර ඇති බව පෙනේ. එබැවින් අපි Cell E6 තුළ 10 දමා එය නිරපේක්ෂ සෛල යොමුවක් බවට පත් කරන්න එවිට මෙම කොටුව සම්පූර්ණ දත්ත කට්ටලය හරහා ස්කෑන් කිරීම සහ ගණනය කිරීමේදී ස්ථාවර වනු ඇත.
Enter එබීමෙන් පසු, ප්රතිඵල කොටුවේ H6 පළමු දත්ත තවමත් දිස්වන බව ඔබට දැකගත හැක. ඔබට මෙහි කළ යුතුව තිබුණේ, ඉතිරි කොටුවලට සූත්රය යෙදීමට අපට පිරවුම් හසුරුව ඇදගෙන යා හැකි වන පරිදි සූත්රය ගොඩනැගීම පමණි.
දැන් Fill Handle සමඟින් පේළිය පහළට ඇද දමන්න, එවිට පිටස්තර රඳවා තිබූ සෛල දැන් #N/A පිරී ඇති බව ඔබට පෙනෙනු ඇත.
සහ දැන් රේඛා ප්රස්ථාරය දෙස බලන්න, මෙය දැන් කිසිදු බාහිර අගයක් නොමැතිව සමතලා කළ ප්රස්ථාරයකි.
සූත්රය බිඳවැටීම
=IF(
අපි ප්රතිඵලය උපුටා ගන්නා අගයන් සංසන්දනය කිරීමට යන විට, අපි සූත්රය ආරම්භ කරන්නේ IF කොන්දේසිය.
=IF(AND(
අපි දැනට පවතින දත්ත ලක්ෂ්යය සහ ඉහත කොටුව සහ පහත කොටුව සංසන්දනය කරන්නෙමු. සහ සැසඳීම් දෙකම සත්ය නම්, ප්රතිඵලයක් ලෙස අපි දත්ත ලක්ෂ්යය පෙන්වමු.එබැවින්, අපට "දෙකම" සැසඳීම් සමඟ කටයුතු කිරීමට අවශ්ය බැවින් අපි AND ශ්රිතය භාවිතා කළ යුතුය.
0> =IF(AND(ABS(අපි දත්ත ලක්ෂ්ය අඩු කරන විට, සමහර දත්ත සෘණ අගයන් විසි කළ හැක. අපි එසේ කරමු. නැතඍණ අගයන් සමඟ ගනුදෙනු කිරීමට අවශ්ය වන්නේ සෘණ අගයන් සෑම විටම "වෙනස 10 වන විට දත්ත ඉවත් කිරීම" යන කොන්දේසියට පටහැනි වන බැවිනි. එබැවින් අපට සැමවිටම ධනාත්මක ප්රතිඵල ඇති බව සහතික කර ගැනීම සඳහා, අපි සැසඳීම් නිරපේක්ෂ අගය ශ්රිතයක් තුළ ආවරණය කළ යුතුය.
=IF(AND(ABS(C6-C5)> ;$E$6
මෙතනින් අපි අපගේ පළමු සංසන්දනය ආරම්භ කළෙමු.අපි සරලව ඉහත අගය සමඟ වත්මන් අගය අඩුකර Cell E6<2 හි ගබඩා කර ඇති වෙනස මට්ටමට වඩා ප්රතිඵලය වැඩිදැයි බලන්න> සහ සෛල අගය අගුලු දමා තබා ගැනීමට සෛලය නිරපේක්ෂ යොමුව බවට පත් කරන ලදී.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
ඊළඟට, කොමාවකින් වෙන් කරන ලද සැසඳීමේ දෙවන කොටස. එය වත්මන් දත්ත ලක්ෂ්යය ඊළඟ දත්ත ලක්ෂ්යය සමඟ සංසන්දනය කරයි.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
දැන් අපි දානවා කොමාවක් සහ සහ ශ්රිත දෙකම සත්ය නම් එහි NA ශ්රිතය දැමීමට තීරණය කරන්න.
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
සහ AND ශ්රිතය සත්ය නොවේ නම් අපි සත්ය දත්ත ලක්ෂ්යය IF සාවද්ය අගය ලෙස ආපසු ලබා දීමට අවශ්යයි. එබැවින් අපි ටයිප් කරන්නෙමු e කොමාවකින් සහ එහි සෛල යොමු අංකය යවන්න C6 .
වැඩිදුර කියවන්න: Excel හි දත්ත වලංගුකරණය ඉවත් කරන්නේ කෙසේද (මාර්ග 5)
සමාන කියවීම්
- Excel හි ශීර්ෂයක් ඉවත් කරන්නේ කෙසේද (ක්රම 4)
- තිත් රේඛා ඉවත් කරන්නExcel (ඉක්මන් ක්රම 5ක්)
- Excel වෙතින් ජාලකය ඉවත් කරන්නේ කෙසේද (පහසු ක්රම 6ක්)
- Excel හි මායිම් ඉවත් කරන්න (ඉක්මන් ක්රම 4ක්)
- Excel හි ගැළපුම් ප්රකාරය ඉවත් කරන්නේ කෙසේද (පහසු ක්රම 2)
3. Excel හි Outliers අතින් ඉවත් කරන්න
Excel හි පිටස්තරයන් ඉවත් කිරීමට තවත් පහසු ක්රමයක් නම්, ඔබේ දත්ත කට්ටලයේ අගයන් වර්ග කර එයින් ඉහළ සහ පහළ අගයන් අතින් මකන්න.
වර්ග කිරීමට. දත්ත,
- තෝරන්න දත්ත කට්ටලය.
- Sort & සංස්කරණ සමූහයේ පෙරහන් කර කුඩාම සිට විශාලම දක්වා වර්ග කරන්න හෝ ලොකුම සිට කුඩාම දක්වා වර්ග කරන්න .
<19
- අපගේ නඩුවේදී, අපි තෝරා ගත්තේ කුඩාම සිට විශාලම දක්වා වර්ග කරන්න . එය අපගේ දත්ත කට්ටලයේ ඇති සංඛ්යා ආරෝහණ අනුපිළිවෙලට වර්ග කර, කුඩාම ඒවා ඉහළින් සහ විශාලතම ඒවා පහළින් තබයි.
දැන් එම දත්ත අතින් මකන්න. දත්ත කට්ටලය බැහැර අගයන් නිදහස් කිරීමට.
විශාල දත්ත කට්ටලයක් සමඟ වැඩ කරන අතරතුර මෙම ක්රියාවලිය අනුගමනය කිරීම අපි නිර්දේශ නොකරමු. ඔබගේ දත්ත කට්ටලය කුඩා සහ බැලීමට පහසු වන විට, ඔබට මෙම ක්රියා පටිපාටිය යෙදිය හැක්කේ, එසේ නොමැතිනම් මෙය ක්රියාත්මක නොකරන්න.
වැඩිදුර කියවන්න: Excel හි වර්ග කිරීම ඉවත් කරන්නේ කෙසේද ( පහසු ක්රම 3ක්)
නිගමනය
මෙම ලිපිය මඟින් Excel හි අවුට්ලියර් ඉවත් කරන ආකාරය පෙන්වයි. මෙම ලිපිය ඔබට ඉතා ප්රයෝජනවත් වී ඇතැයි මම බලාපොරොත්තු වෙමි. සම්බන්ධයෙන් ඔබට කිසියම් ප්රශ්නයක් ඇත්නම් විමසීමට නිදහස් වන්නමාතෘකාව.