ഉള്ളടക്ക പട്ടിക
സ്ഥിതിവിവരക്കണക്കുകൾ, ഡാറ്റാ മൈനിംഗ്, മെഷീൻ ലേണിംഗ് തുടങ്ങിയവയിലെ ഡാറ്റ വിശകലനം ചെയ്യുന്നതിനുള്ള വളരെ സാധാരണമായ ഒരു ജോലിയാണ് ഔട്ട്ലൈയറുകൾ കണ്ടെത്തുകയും അവ നീക്കം ചെയ്യുകയും ചെയ്യുന്നത്. കണ്ടെത്തുക. ഈ ലേഖനത്തിൽ, എക്സെൽ -ലെ ഔട്ട്ലറുകൾ എങ്ങനെ നീക്കംചെയ്യാമെന്ന് ഞങ്ങൾ കാണിച്ചുതരാം.
വർക്ക്ബുക്ക് ഡൗൺലോഡ് ചെയ്യുക
നിങ്ങൾക്ക് സൗജന്യ പ്രാക്ടീസ് എക്സൽ വർക്ക്ബുക്ക് ഡൗൺലോഡ് ചെയ്യാം. ഇവിടെ.
Outliers.xlsx നീക്കം ചെയ്യുക
Excel-ലെ ഔട്ട്ലയറുകൾ എന്തൊക്കെയാണ്?
ഒരു ഔട്ട്ലിയർ എന്നത് ഒരു ഡാറ്റാസെറ്റിന്റെ ശരാശരി അല്ലെങ്കിൽ മീഡിയൻ മൂല്യത്തിൽ നിന്ന് വ്യതിചലിക്കുന്ന ഒരു മൂല്യമാണ്. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒരു ഡാറ്റാസെറ്റിലെ ബാക്കി മൂല്യങ്ങളേക്കാൾ ഗണ്യമായി ഉയർന്നതോ താഴ്ന്നതോ ആയ മൂല്യങ്ങളാണ് ഔട്ട്ലയറുകൾ.
ഒരു ക്രിക്കറ്റ് മത്സരത്തെക്കുറിച്ച് ചിന്തിക്കുക, എല്ലാ ബാറ്റർമാരും ഏകദേശം 50 റൺസ് നേടിയെങ്കിലും ഒരു ബാറ്റ്സ്മാൻ മാത്രമാണ് സെഞ്ച്വറി നേടിയത് (100). ) കൂടാതെ മറ്റൊരു ബാറ്റ്സ്മാൻ 0-ന് പുറത്തായി. 100, 0 സ്കോറുകളാണ് ഈ മത്സരത്തിൽ പുറത്തായത്.
ഔട്ട്ലേഴ്സ് പ്രശ്നകരമാണ്, കാരണം ഡാറ്റാ വിശകലനത്തിന്റെ ഫലത്തെ വളച്ചൊടിക്കുകയും തെറ്റിദ്ധരിപ്പിക്കുന്ന ഫലങ്ങൾ ഉണ്ടാകുകയും ചെയ്യും. അതിനാൽ ഒരു സുഗമമായ ഡാറ്റാസെറ്റ് ലഭിക്കാൻ ഔട്ട്ലയറുകൾ കണ്ടെത്തി അവ നീക്കം ചെയ്യുന്നതാണ് നല്ലത്.
Excel-ൽ ഔട്ട്ലിയേഴ്സ് നീക്കംചെയ്യാനുള്ള 3 വഴികൾ
ഈ വിഭാഗത്തിൽ, എങ്ങനെയെന്ന് നിങ്ങൾ പഠിക്കും. നിങ്ങളുടെ ഡാറ്റാസെറ്റിൽ നിന്ന് 3 വ്യത്യസ്ത വഴികളിൽ ഔട്ട്ലിയറുകൾ ഇല്ലാതാക്കുക . ഔട്ട്ലറുകൾ നീക്കംചെയ്യുന്നത് ഒരു തന്ത്രപരമായ പ്രക്രിയയാണ്, അതിനാൽ മുഴുവൻ ലേഖനവും ശ്രദ്ധാപൂർവ്വം വായിക്കുക.
1. ഇല്ലാതെ ശരാശരി കണക്കാക്കാൻ Excel ഫംഗ്ഷൻ ഉപയോഗിക്കുന്നുഔട്ട്ലൈയറുകൾ ഒഴികെയുള്ള ഒരു ഡാറ്റാസെറ്റിന്റെ ശരാശരി കണക്കാക്കാൻ ഔട്ട്ലയറുകൾ
Excel TRIMMEAN ഫംഗ്ഷൻ ഉപയോഗിക്കാം. ഒഴിവാക്കേണ്ട ഡാറ്റ പോയിന്റുകൾ ഒരു ശതമാനമായി വിതരണം ചെയ്യുന്നു. ശതമാന മൂല്യം ഒരു ദശാംശ ഫോർമാറ്റായോ ശതമാനം ഫോർമാറ്റായോ ഇൻപുട്ട് ചെയ്യാം.
ഔട്ട്ലയറുകളില്ലാതെ ശരാശരി കണക്കാക്കുന്നതിനുള്ള വാക്യഘടനയാണ്,
=TRIMMEAN(അറേ, ശതമാനം)ഇവിടെ,
- അറേ = ട്രിം ചെയ്യാനും ശരാശരി ഫലം കണക്കാക്കാനുമുള്ള ഡാറ്റയുടെ ശ്രേണി
- ശതമാനം = ഒഴിവാക്കേണ്ട ഡാറ്റാ പോയിന്റുകളുടെ എണ്ണം
നീക്കംചെയ്ത ഔട്ട്ലറുകൾ ഉപയോഗിച്ച് ഫലങ്ങൾ കണക്കാക്കാൻ ഈ ഫംഗ്ഷൻ എങ്ങനെ നടപ്പിലാക്കാമെന്ന് നോക്കാം.
മുകളിലുള്ള ചിത്രം പരിഗണിക്കുക. ഞങ്ങൾക്ക് സെൽ B5 മുതൽ B14 വരെയുള്ള ഡാറ്റയുണ്ട്. ഇവിടെ മിക്ക സംഖ്യകളും 20-നും 27-നും ഇടയിലാണ്, എന്നാൽ രണ്ട് മൂല്യങ്ങൾ - 0, 100 - ആ മൂല്യങ്ങളിൽ നിന്ന് വളരെ അകലെയാണ്. അതിനാൽ ഇവയാണ് ഞങ്ങളുടെ ഡാറ്റാസെറ്റിലെ ഔട്ട്ലിയേഴ്സ് .
ഞങ്ങളുടെ ഡാറ്റാസെറ്റിന്, Excel TRIMMEAN ഫംഗ്ഷൻ ഉപയോഗിച്ച് ഔട്ട്ലയർ മൂല്യങ്ങളില്ലാതെ ശരാശരി (ശരാശരി) കണക്കാക്കുന്നതിനുള്ള സൂത്രവാക്യം,
=TRIMMEAN(B5:B14,0.2)
ഇവിടെ,
- B5:B14 = ട്രിം ചെയ്യാനും ശരാശരി ഫലം കണക്കാക്കാനുമുള്ള ഡാറ്റയുടെ ശ്രേണി
- 0.2 (അല്ലെങ്കിൽ 20%) = ഒഴിവാക്കേണ്ട ഡാറ്റാ പോയിന്റുകളുടെ എണ്ണം
ഡാറ്റാസെറ്റിലെ ഏതെങ്കിലും സംഖ്യ ബാക്കിയുള്ള ഡാറ്റാസെറ്റിൽ നിന്ന് 20% കുറഞ്ഞാൽ , അപ്പോൾ ആ നമ്പറിനെ ഔട്ട്ലൈയറുകൾ എന്ന് വിളിക്കും.
നിങ്ങളുടെ ഡാറ്റാസെറ്റ് അനുസരിച്ച് ഫോർമുല എഴുതി എന്റർ അമർത്തുകയാണെങ്കിൽ, നിങ്ങൾക്ക് കണക്കാക്കിയ ശരാശരി ലഭിക്കും നിങ്ങളുടെ ഡാറ്റാസെറ്റിനായി. ഞങ്ങളുടെ കാര്യത്തിൽ, സെൽ E6 കണക്കാക്കിയ ശരാശരി അതായത് 23.50 ആണ്.
ഉത്തരം ശരിയാണോ അല്ലയോ എന്ന് പരിശോധിക്കാൻ, ഞങ്ങൾ AVERAGE ഫംഗ്ഷൻ പ്രവർത്തിപ്പിക്കുന്നു സെൽ E5 -ൽ ഇത് B5:B14 ശ്രേണിയിലെ എല്ലാ മൂല്യങ്ങളുടെയും ശരാശരി ( 28.80 ) നൽകുന്നു. കൂടാതെ സെൽ E7 -ൽ, ഔട്ട്ലയർ മൂല്യങ്ങൾ ഉള്ളവ ഒഴികെയുള്ള എല്ലാ സെല്ലുകളും സ്വമേധയാ ഇൻപുട്ട് ചെയ്ത് ഞങ്ങൾ മറ്റൊരു ശരാശരി ഫംഗ്ഷൻ പ്രവർത്തിപ്പിക്കുന്നു, അതിന്റെ ഫലമായി 23.50 റിട്ടേൺ ലഭിച്ചു.
അതിനാൽ, Excel-ൽ ശരാശരി കണക്കാക്കുമ്പോൾ തന്നിരിക്കുന്ന ഡാറ്റാസെറ്റിൽ നിന്നും ഔട്ട്ലറുകൾ നീക്കം ചെയ്യാൻ TRIMMEAN ഫംഗ്ഷന് കഴിയുമെന്ന് നമുക്ക് പറയാം.
കൂടുതൽ വായിക്കുക: എക്സലിൽ ഫോർമുല എങ്ങനെ മായ്ക്കും (7+ രീതികൾ)
2. Excel-ലെ ഡാറ്റാസെറ്റിൽ നിന്നും ലൈൻ ചാർട്ടിൽ നിന്നും ഔട്ട്ലൈയറുകൾ നീക്കം ചെയ്യുക
ഇനിപ്പറയുന്ന ചിത്രം ശ്രദ്ധിക്കുക. ഞങ്ങൾ ഒരു ലൈൻ ഗ്രാഫ് സൃഷ്ടിച്ചതിന്റെ അടിസ്ഥാനത്തിൽ ചില ഡാറ്റയുണ്ട്. ലൈൻ ഗ്രാഫിൽ നിന്ന്, ഡാറ്റ പോയിന്റുകൾ 4, 8 എന്നിവയിൽ നമുക്ക് നമ്മുടെ ഔട്ട്ലറുകൾ ഉണ്ട് എന്ന് എളുപ്പത്തിൽ കാണാൻ കഴിയും.
ഇപ്പോൾ നമുക്ക് എങ്ങനെ സുഗമമാക്കാമെന്ന് നോക്കാം. ഡാറ്റാസെറ്റിൽ നിന്ന് ഔട്ട്ലൈയിംഗ് മൂല്യങ്ങൾ നീക്കം ചെയ്തുകൊണ്ട് ലൈൻ ചാർട്ടിന് പുറത്ത്.
മറ്റൊരു സെല്ലിൽ (ഞങ്ങളുടെ കാര്യത്തിൽ ഇത് സെൽ H6 ആണ്), ഇനിപ്പറയുന്ന ഫോർമുല എഴുതുക,
7> =IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ഇവിടെ,
- C6 = ഡാറ്റാസെറ്റിലെ ആദ്യ ഡാറ്റ സൂക്ഷിക്കുന്ന സെൽ
- C5 = ആദ്യത്തെ ഡാറ്റാ സെല്ലിന് മുകളിലുള്ള സെൽ
- C7 = ആദ്യത്തെ ഡാറ്റാ സെല്ലിന് താഴെയുള്ള സെൽ
- $E$6 = ഡാറ്റാ പോയിന്റുകൾ തമ്മിലുള്ള വ്യത്യാസം .
നോക്കുന്നുഞങ്ങളുടെ ഡാറ്റ, ഒരു ഡാറ്റാ പോയിന്റ് മറ്റുള്ളവയിൽ നിന്ന് 10 യൂണിറ്റുകൾ വ്യത്യാസപ്പെട്ടിരിക്കുമ്പോൾ, ഒരു ഔട്ട്ലിയർ ആയി നിയോഗിക്കപ്പെടുന്നു. അതിനാൽ ഞങ്ങൾ സെൽ E6 ൽ 10 ഇടുകയും അതിനെ ഒരു സമ്പൂർണ സെൽ റഫറൻസ് ആക്കുകയും ചെയ്യുന്നു, അതുവഴി മുഴുവൻ ഡാറ്റാസെറ്റിലൂടെയും സ്കാൻ ചെയ്യുമ്പോഴും കണക്കാക്കുമ്പോഴും ഈ സെൽ പരിഹരിക്കപ്പെടും.<3
എന്റർ അമർത്തിയാൽ, ഫല സെല്ലിൽ H6 ആദ്യ ഡാറ്റ ഇപ്പോഴും ദൃശ്യമാകുന്നത് നിങ്ങൾക്ക് കാണാം. നിങ്ങൾ ഇവിടെ ചെയ്യേണ്ടത്, ഫോർമുല നിർമ്മിക്കുക മാത്രമാണ്, അതുവഴി ബാക്കി സെല്ലുകളിലേക്ക് ഫോർമുല പ്രയോഗിക്കുന്നതിന് ഞങ്ങൾക്ക് ഫിൽ ഹാൻഡിൽ ഡ്രാഗ് ചെയ്യാം.
ഇപ്പോൾ ഫിൽ ഹാൻഡിൽ ഉപയോഗിച്ച് വരി താഴേക്ക് വലിച്ചിടുക, ഔട്ട്ലറുകൾ കൈവശം വച്ചിരുന്ന സെല്ലുകൾ ഇപ്പോൾ #N/A കൊണ്ട് നിറഞ്ഞിരിക്കുന്നതായി നിങ്ങൾ കാണും.
ഇപ്പോൾ ലൈൻ ചാർട്ട് നോക്കൂ, ഇത് ഇപ്പോൾ ഒരു പരന്ന ഗ്രാഫാണ്, അതിൽ ബാഹ്യമായ മൂല്യങ്ങളൊന്നുമില്ല ഫോർമുല ബ്രേക്ക്ഡൗൺ
=IF(
ഫലം എക്സ്ട്രാക്റ്റുചെയ്യുന്ന മൂല്യങ്ങളെ അടിസ്ഥാനമാക്കി ഞങ്ങൾ താരതമ്യം ചെയ്യാൻ പോകുമ്പോൾ, ഞങ്ങൾ ഫോർമുല ആരംഭിക്കുന്നു IF വ്യവസ്ഥ.
=IF(AND(
ഞങ്ങൾ നിലവിലെ ഡാറ്റ പോയിന്റും മുകളിലുള്ള സെല്ലും താഴെയുള്ള സെല്ലും താരതമ്യം ചെയ്യാൻ പോകുന്നു . രണ്ട് താരതമ്യങ്ങളും ശരിയാണെങ്കിൽ, അപ്പോൾ മാത്രമേ ഞങ്ങൾ ഡാറ്റാ പോയിന്റ് ഫലമായി കാണിക്കൂ. അതിനാൽ, "രണ്ട്" താരതമ്യങ്ങളും കൈകാര്യം ചെയ്യേണ്ടതിനാൽ ഞങ്ങൾ കൂടാതെ ഫംഗ്ഷൻ ഉപയോഗിക്കണം.
0> =IF(AND(ABS(നമ്മൾ ഡാറ്റാ പോയിന്റുകൾ കുറയ്ക്കുമ്പോൾ, ചില ഡാറ്റ നെഗറ്റീവ് മൂല്യങ്ങൾ എറിഞ്ഞേക്കാം. ഞങ്ങൾ ചെയ്യുന്നു അല്ലനെഗറ്റീവ് മൂല്യങ്ങൾ എല്ലായ്പ്പോഴും "വ്യത്യാസം 10 ആയിരിക്കുമ്പോൾ ഡാറ്റ നീക്കംചെയ്യൽ" എന്ന വ്യവസ്ഥയ്ക്ക് വിരുദ്ധമായതിനാൽ നെഗറ്റീവ് മൂല്യങ്ങൾ കൈകാര്യം ചെയ്യാൻ ആഗ്രഹിക്കുന്നു. അതിനാൽ ഞങ്ങൾക്ക് എല്ലായ്പ്പോഴും പോസിറ്റീവ് ഫലങ്ങൾ ഉണ്ടെന്ന് ഉറപ്പാക്കാൻ, ഞങ്ങൾ താരതമ്യങ്ങൾ ഒരു സമ്പൂർണ മൂല്യ ഫംഗ്ഷനിൽ പൊതിയേണ്ടതുണ്ട്.
=IF(AND(ABS(C6-C5)> ;$E$6
ഇവിടെ ഞങ്ങൾ ഞങ്ങളുടെ ആദ്യ താരതമ്യം ആരംഭിച്ചു. മുകളിലുള്ള മൂല്യത്തിനൊപ്പം നിലവിലെ മൂല്യം ഞങ്ങൾ ചുരുക്കി, ഫലം സെൽ E6<2-ൽ സംഭരിച്ചിരിക്കുന്ന വ്യത്യാസ നിലയേക്കാൾ വലുതാണോ എന്ന് നോക്കുക> കൂടാതെ സെൽ മൂല്യം ലോക്ക് ചെയ്യാനായി സെല്ലിനെ ഒരു സമ്പൂർണ റഫറൻസ് ആക്കി.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
അടുത്തതായി, കോമ കൊണ്ട് വേർതിരിക്കുന്ന താരതമ്യത്തിന്റെ രണ്ടാം ഭാഗം. അത് നിലവിലെ ഡാറ്റ പോയിന്റിനെ അടുത്ത ഡാറ്റ പോയിന്റുമായി താരതമ്യം ചെയ്യും.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
ഇപ്പോൾ ഞങ്ങൾ ഇടുന്നു ഒരു കോമയും എൻഎ ഫംഗ്ഷൻ രണ്ട് ഉം ഫംഗ്ഷനുകളും ശരിയാണെങ്കിൽ അതിൽ ഇടാൻ തീരുമാനിക്കുക.
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
കൂടാതെ AND ഫംഗ്ഷൻ ശരിയല്ലെങ്കിൽ ഞങ്ങൾ യഥാർത്ഥ ഡാറ്റ പോയിന്റ് IF തെറ്റായ മൂല്യമായി നൽകണം. അതിനാൽ ഞങ്ങൾ ടൈപ്പ് ചെയ്യുന്നു e ഒരു കോമയിലാക്കി സെൽ റഫറൻസ് നമ്പർ C6 നൽകുക.
കൂടുതൽ വായിക്കുക: Excel-ൽ ഡാറ്റ മൂല്യനിർണ്ണയം എങ്ങനെ നീക്കംചെയ്യാം (5 വഴികൾ)
സമാനമായ വായനകൾ
- എക്സലിൽ ഒരു ഹെഡർ എങ്ങനെ നീക്കം ചെയ്യാം (4 രീതികൾ)
- ഡോട്ടഡ് ലൈനുകൾ നീക്കം ചെയ്യുകExcel (5 ദ്രുത വഴികൾ)
- Excel-ൽ നിന്ന് ഗ്രിഡ് എങ്ങനെ നീക്കംചെയ്യാം (6 എളുപ്പവഴികൾ)
- Excel-ൽ ബോർഡറുകൾ നീക്കം ചെയ്യുക (4 ദ്രുത വഴികൾ)
- Excel-ലെ അനുയോജ്യത മോഡ് എങ്ങനെ നീക്കംചെയ്യാം (2 എളുപ്പവഴികൾ)
3. Excel-ൽ ഔട്ട്ലൈയറുകൾ സ്വമേധയാ നീക്കം ചെയ്യുക
Excel-ലെ ഔട്ട്ലൈയറുകൾ ഇല്ലാതാക്കാനുള്ള മറ്റൊരു എളുപ്പവഴി, നിങ്ങളുടെ ഡാറ്റാസെറ്റിന്റെ മൂല്യങ്ങൾ അടുക്കി അതിൽ നിന്ന് മുകളിലും താഴെയുമുള്ള മൂല്യങ്ങൾ നേരിട്ട് ഇല്ലാതാക്കുക എന്നതാണ്.
ക്രമീകരിക്കാൻ. ഡാറ്റ,
- തിരഞ്ഞെടുക്കുക ഡാറ്റാസെറ്റ്.
- അടുക്കുക & എഡിറ്റിംഗ് ഗ്രൂപ്പിൽ ഫിൽട്ടർ ചെയ്ത് ചെറുത് മുതൽ വലുത് വരെ അടുക്കുക അല്ലെങ്കിൽ ഏറ്റവും വലുത് ചെറുത് എന്നതിൽ ഒന്ന് തിരഞ്ഞെടുക്കുക.
<19
- ഞങ്ങളുടെ കാര്യത്തിൽ, ഞങ്ങൾ ചെറുത് മുതൽ വലുത് വരെ അടുക്കുക തിരഞ്ഞെടുത്തു. ഇത് ഞങ്ങളുടെ ഡാറ്റാസെറ്റിലെ സംഖ്യകളെ ആരോഹണ ക്രമത്തിൽ അടുക്കി, ഏറ്റവും ചെറിയവ മുകളിലും ഏറ്റവും വലിയവ താഴെയും സ്ഥാപിച്ചു.
ഇനി ആ ഡാറ്റ സ്വമേധയാ ഇല്ലാതാക്കുക. ഡാറ്റാസെറ്റ് ഔട്ട്ലൈയിംഗ് മൂല്യങ്ങൾ സൗജന്യമാക്കുന്നതിന്.
ഒരു വലിയ ഡാറ്റാഗണത്തിൽ പ്രവർത്തിക്കുമ്പോൾ ഈ പ്രക്രിയ പിന്തുടരാൻ ഞങ്ങൾ ശുപാർശ ചെയ്യുന്നില്ല. നിങ്ങളുടെ ഡാറ്റാസെറ്റ് ചെറുതും കാണാൻ എളുപ്പവുമാകുമ്പോൾ, മാത്രമേ നിങ്ങൾക്ക് ഈ നടപടിക്രമം പ്രയോഗിക്കാൻ കഴിയൂ, അല്ലാത്തപക്ഷം ഇത് നടപ്പിലാക്കരുത്.
കൂടുതൽ വായിക്കുക: എക്സെലിൽ അടുക്കുന്നത് എങ്ങനെ നീക്കംചെയ്യാം ( 3 എളുപ്പവഴികൾ)
ഉപസംഹാരം
Excel-ൽ ഔട്ട്ലിയറുകൾ നീക്കംചെയ്യുന്നത് എങ്ങനെയെന്ന് ഈ ലേഖനം കാണിച്ചുതന്നു. ഈ ലേഖനം നിങ്ങൾക്ക് വളരെ പ്രയോജനപ്രദമായിരുന്നുവെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു. എന്നതുമായി ബന്ധപ്പെട്ട് നിങ്ങൾക്ക് എന്തെങ്കിലും ചോദ്യങ്ങളുണ്ടെങ്കിൽ ചോദിക്കാൻ മടിക്കേണ്ടതില്ലവിഷയം.