Com eliminar els valors atípics a Excel (3 maneres)

  • Comparteix Això
Hugh West

Trobar valors atípics i eliminar-los és una tasca molt habitual per analitzar dades en estadístiques, mineria de dades, aprenentatge automàtic, etc. Hi ha tantes maneres de trobar valors atípics al vostre conjunt de dades, però el procés per eliminar-los no és tan fàcil de trobar. En aquest article, us mostrarem com eliminar els valors atípics a Excel .

Descarregueu el quadern de treball

Podeu descarregar el quadern de pràctica gratuïta d'Excel des de aquí.

Elimineu Outliers.xlsx

Què són els Outliers a Excel?

Un outlier és un valor que s'allunya molt del valor mitjà o mitjà d'un conjunt de dades. En altres paraules, els valors atípics són valors significativament més alts o inferiors que la resta de valors d'un conjunt de dades.

Penseu en un partit de cricket on tots els batedors van anotar al voltant de 50, però només un batedor va anotar un segle (100). ) i un altre batedor va sortir a 0. Les puntuacions de 100 i 0 són els valors atípics d'aquest partit.

Els valors atípics són problemàtics, ja que poden distorsionar el resultat de l'anàlisi de dades i produir resultats enganyosos. Per tant, és millor trobar els valors atípics i eliminar-los per tenir un conjunt de dades suau.

3 maneres d'eliminar els valors atípics a Excel

En aquesta secció, aprendràs a suprimiu els valors atípics del vostre conjunt de dades de 3 maneres diferents. L'eliminació dels valors atípics és un procés complicat, així que llegiu l'article sencer amb atenció.

1. Utilitzar la funció Excel per calcular la mitjana senseValors atípics

Excel La funció TRIMMEAN es pot utilitzar per calcular la mitjana d'un conjunt de dades determinat mentre s'exclouen els valors atípics. Els punts de dades a excloure es proporcionen com a percentatge. El valor del percentatge es pot introduir en format decimal o en format de percentatge.

La sintaxi per calcular la mitjana sense valors atípics és:

=TRIMMEAN(matriu, percentatge)

Aquí,

  • matriu = Interval de dades per retallar i calcular el resultat mitjà
  • per cent = El nombre de punts de dades a excloure

Vegem com implementar aquesta funció per calcular resultats amb valors atípics eliminats.

Considereu la imatge anterior. Tenim dades de la cel·la B5 a la B14 . Aquí la majoria dels números estan entre 20 i 27, però dos valors - 0 i 100 - estan molt lluny d'aquests valors. Per tant, aquests són els valors atípics del nostre conjunt de dades.

Per al nostre conjunt de dades, la fórmula per calcular la mitjana (mitjana) sense els valors atípics amb la funció TRIMMEAN d'Excel és,

=TRIMMEAN(B5:B14,0.2)

Aquí,

  • B5:B14 = Interval de dades per retallar i calcular el resultat mitjà
  • 0,2 (o 20%) = El nombre de punts de dades a excloure

Si qualsevol nombre del conjunt de dades cau un 20% de la resta del conjunt de dades , aleshores aquest nombre s'anomenarà valors atípics.

Si escriviu la fórmula segons el vostre conjunt de dades i premeu Intro , obtindreu la mitjana calculada sense valors atípics. per al vostre conjunt de dades. En el nostre cas, la Cel·la E6 conté la mitjana calculada que és 23,50 .

Per comprovar si la resposta és correcta o no, executem la funció MITJANA. a la Cel·la E5 que retorna la mitjana ( 28,80 ) de tots els valors de l'interval B5:B14 . I a la Cel·la E7 , executem una altra funció MITJANA introduint manualment totes les cel·les, excepte les que contenen valors atípics i, com a resultat, obtenim un retorn de 23,50 .

Així podem dir que la funció TRIMMEAN pot eliminar amb èxit els valors atípics d'un conjunt de dades determinat mentre es calcula la mitjana a Excel.

Llegir més: Com esborrar la fórmula a Excel (7 o més mètodes)

2. Elimineu els valors atípics del conjunt de dades i el gràfic de línies a Excel

Observeu la imatge següent. Tenim algunes dades a partir de les quals hem creat un gràfic de línies. A partir del gràfic de línies, podem veure fàcilment que als punts de dades 4 i 8 tenim els nostres valors atípics .

Ara veurem com podem suavitzar extreu el gràfic de línies eliminant els valors perifèrics del conjunt de dades.

En una altra cel·la (en el nostre cas és Cel·la H6 ), escriviu la fórmula següent,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Aquí,

  • C6 = Cel·la que conté les primeres dades del conjunt de dades
  • C5 = Cel·la a sobre de la primera cel·la de dades
  • C7 = Cel·la a sota de la primera cel·la de dades
  • $E$6 = Diferència entre els punts de dades .

Mirantles nostres dades, sembla que quan un punt de dades difereix 10 unitats dels altres, es designa com a outlier . Per tant, posem 10 a la Cel·la E6 i fem que sigui una Referència absoluta de cel·les de manera que aquesta cel·la s'arregli durant l'exploració i el càlcul de tot el conjunt de dades.

Després de prémer Intro , podeu veure que les primeres dades encara apareixen a la cel·la del resultat H6 . Tot el que heu de fer aquí és, només construir la fórmula perquè puguem arrossegar la Annexa d'ompliment per aplicar la fórmula a la resta de cel·les.

Ara arrossegueu la fila cap avall amb Annexa d'ompliment i veureu que les cel·les que contenien els valors atípics ara s'omplen amb #N/A .

I mireu ara el gràfic de línies, ara és un gràfic aplanat sense cap valor periòdic.

Formula Breakdown

=IF(

A mesura que anem a comparar valors en funció dels quals extreurem el resultat, iniciem la fórmula amb la condició SI .

=IF(AND(

Anem a comparar el punt de dades actual i la cel·la de dalt i la cel·la de sota . I si ambdues comparacions són certes, només aleshores mostrarem el punt de dades com a resultat. Per tant, com que hem de tractar amb les comparacions "Ambdues", hauríem d'utilitzar la funció AND .

=IF(AND(ABS(

Quan restem punts de dades, algunes dades poden generar valors negatius. I ho fem Nou TestamentVoleu tractar amb valors negatius, ja que els valors negatius sempre contradiran la condició d'"eliminar dades quan la diferència sigui 10". Per tant, per assegurar-nos que sempre tenim resultats positius, hem d'embolicar les comparacions en una funció de valor absolut .

=IF(AND(ABS(C6-C5)>) ;$E$6

Aquí vam començar la nostra primera comparació. Simplement restem el valor actual amb el valor anterior i veiem si el resultat és més gran que el nivell de diferència emmagatzemat a la Cel·la E6 i va fer de la cel·la una Referència absoluta per mantenir el valor de la cel·la bloquejat.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

A continuació, la segona part de la comparació que està separada per una coma. Compararà el punt de dades actual amb el següent punt de dades.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Ara posem una coma i determineu posar-hi funció NA si les dues funcions AND són certes.

=IF(AND(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

I si la funció AND no és certa, llavors volem retornar el punt de dades real com el valor IF Fals. Així que escrivim e amb una coma i passeu-hi el número de referència de la cel·la C6 .

Llegir més: Com eliminar la validació de dades a Excel (5 maneres)

Lectures similars

  • Com eliminar una capçalera a Excel (4 mètodes)
  • Elimina les línies de puntsExcel (5 maneres ràpides)
  • Com eliminar la quadrícula d'Excel (6 mètodes fàcils)
  • Eliminar vores a Excel (4 maneres ràpides)
  • Com eliminar el mode de compatibilitat a Excel (2 maneres fàcils)

3. Elimineu els valors atípics manualment a Excel

Una altra manera senzilla d'eliminar els valors atípics a Excel és ordenar els valors del vostre conjunt de dades i suprimir-ne manualment els valors superior i inferior.

Per ordenar-lo. les dades,

  • Seleccioneu el conjunt de dades.
  • Vés a Ordena i amp; Filtreu al grup Edició i seleccioneu Ordena del més petit al més gran o Ordena del més gran al més petit .

  • En el nostre cas, hem seleccionat Ordena del més petit al més gran . Va ordenar els números del nostre conjunt de dades en ordre ascendent, col·locant els més petits a la part superior i els més grans a la part inferior.

Ara només heu de suprimir aquestes dades manualment. per fer que els valors perifèrics del conjunt de dades siguin gratuïts.

No recomanem seguir aquest procés mentre treballeu amb un conjunt de dades gran. Quan el vostre conjunt de dades sigui petit i més fàcil de visualitzar, només aleshores podeu aplicar aquest procediment, en cas contrari, no ho implementeu.

Llegir més: Com eliminar l'ordenació a Excel ( 3 mètodes fàcils)

Conclusió

Aquest article us va mostrar com eliminar els valors atípics a Excel. Espero que aquest article us hagi estat molt profitós. No dubteu a preguntar si teniu cap pregunta sobre eltema.

Hugh West és un entrenador i analista d'Excel molt experimentat amb més de 10 anys d'experiència en el sector. És llicenciat en Comptabilitat i Finances i Màster en Administració i Direcció d'Empreses. Hugh té una passió per l'ensenyament i ha desenvolupat un enfocament pedagògic únic que és fàcil de seguir i entendre. El seu coneixement expert d'Excel ha ajudat a milers d'estudiants i professionals de tot el món a millorar les seves habilitats i a destacar en les seves carreres. A través del seu bloc, Hugh comparteix els seus coneixements amb el món, oferint tutorials d'Excel gratuïts i formació en línia per ajudar les persones i les empreses a assolir tot el seu potencial.