Cómo eliminar valores atípicos en Excel (3 maneras)

  • Compartir Este
Hugh West

Encontrar valores atípicos y eliminarlos es una tarea muy común para analizar datos en estadística, minería de datos, aprendizaje automático, etc. Hay muchas maneras de encontrar valores atípicos en su conjunto de datos, pero el proceso para eliminarlos no es tan fácil de encontrar. En este artículo, le mostraremos cómo eliminar valores atípicos en Excel .

Descargar el cuaderno de ejercicios

Puede descargar gratuitamente el libro de ejercicios de Excel desde aquí.

Eliminar valores atípicos.xlsx

¿Qué son los valores atípicos en Excel?

En valor atípico es un valor que se aleja mucho de la media o la mediana de un conjunto de datos. En otras palabras, los valores atípicos son valores significativamente superiores o inferiores al resto de los valores de un conjunto de datos.

Piensa en un partido de cricket en el que todos los bateadores marcan alrededor de 50 puntos, pero sólo un bateador marca un siglo (100) y otro bateador sale a 0. Esos 100 y 0 puntos son los valores atípicos de este partido.

Los valores atípicos son problemáticos, ya que pueden sesgar el resultado del análisis de datos y producir resultados engañosos, por lo que es mejor detectar los valores atípicos y eliminarlos para obtener un conjunto de datos homogéneo.

3 formas de eliminar valores atípicos en Excel

En esta sección, aprenderá a eliminar valores atípicos La eliminación de valores atípicos es un proceso complicado, así que lea detenidamente todo el artículo.

1. Utilización de la función de Excel para calcular la media sin valores atípicos

Excel Función TRIMMEAN se puede utilizar para calcular la media de un conjunto de datos determinado excluyendo los valores atípicos. Los puntos de datos a excluir se suministran en forma de porcentaje. El valor del porcentaje se puede introducir en formato decimal o en formato de porcentaje.

La sintaxis para calcular la media sin valores atípicos es,

=TRIMMEAN(matriz, porcentaje)

Toma,

  • matriz = Rango de datos a recortar y calcular el resultado medio
  • por ciento = El número de puntos de datos a excluir

Veamos cómo implementar esta función para calcular resultados con valores atípicos eliminados.

Consideremos la imagen anterior. Tenemos datos de Celda B5 a B14 Aquí la mayoría de los números están entre 20 y 27, pero dos valores - 0 y 100 - están muy lejos de esos valores. Así que estos son los valores atípicos en nuestro conjunto de datos.

Para nuestro conjunto de datos, la fórmula para calcular la media (promedio) sin los valores atípicos con Excel TRIMMEAN función es,

=TRIMMEAN(B5:B14,0.2)

Toma,

  • B5:B14 = Rango de datos a recortar y calcular el resultado medio
  • 0.2 (o 20%) = El número de puntos de datos a excluir

Si algún número del conjunto de datos se aleja un 20% del resto, ese número se denominará atípico.

Si escribe la fórmula de acuerdo con su conjunto de datos y pulsa Entre en obtendrá el media calculada sin valores atípicos para su conjunto de datos. En nuestro caso, Célula E6 contiene la media calculada, que es 23.50 .

Para comprobar si la respuesta es correcta o no, ejecutamos la función Función MEDIA en Célula E5 que devuelve la media ( 28.80 ) de todos los valores del intervalo B5:B14 . y en Célula E7 ejecutamos otro MEDIA introduciendo manualmente todas las celdas excepto las que contienen valores atípicos, y obtuvo un resultado de 23.50 como resultado.

Así que podemos decir que el TRIMMEAN puede eliminar con éxito los valores atípicos de un conjunto de datos dado mientras se calcula la media en Excel.

Más información: Cómo Borrar Fórmula en Excel (7+ Métodos)

2. Eliminar valores atípicos de conjuntos de datos y gráficos lineales en Excel

Observe la siguiente imagen. Tenemos algunos datos en base a los cuales creamos un gráfico lineal. A partir del gráfico lineal, podemos ver fácilmente que en puntos de datos 4 y 8 tenemos nuestros valores atípicos .

Ahora veremos cómo suavizar el gráfico de líneas eliminando los valores atípicos del conjunto de datos.

En otra celda (en nuestro caso es Celda H6 ), escribe la siguiente fórmula,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Toma,

  • C6 = Celda que contiene el primer dato del conjunto de datos
  • C5 = Celda situada encima de la primera celda de datos
  • C7 = Celda debajo de la primera celda de datos
  • $E$6 = Diferencia entre puntos de datos.

Observando nuestros datos, parece que cuando un punto de datos es difieren 10 unidades de otros, se designa como valor atípico Así que ponemos 10 en Célula E6 y convertirlo en un Referencia absoluta de celda para que esta celda se fije al escanear y calcular todo el conjunto de datos.

Tras pulsar Entre en puede ver que los primeros datos siguen apareciendo en la celda de resultado H6 Todo lo que tienes que hacer aquí es, sólo para construir la fórmula para que podamos arrastrar el Asa de llenado para aplicar la fórmula al resto de las celdas.

Ahora arrastre la fila hacia abajo con Asa de llenado y verá que las celdas que contenían los valores atípicos ahora están llenas de #N/A .

Y mira ahora el gráfico de líneas, ahora es un gráfico aplanado sin valores atípicos en él.

Desglose de fórmulas

=IF(

Como vamos a comparar valores en función de los cuales extraeremos el resultado, iniciamos la fórmula con el carácter SI estado.

=IF(AND(

Vamos a comparar el punto de datos actual y la celda de arriba y la celda de abajo. Y si ambas comparaciones son verdaderas, sólo entonces mostraremos el punto de datos como resultado. Por lo tanto, ya que necesitamos tratar con "Ambas" comparaciones por lo que debemos utilizar la función Función AND .

=IF(AND(ABS(

Cuando restamos puntos de datos, algunos datos pueden arrojar valores negativos. Y no queremos tratar con valores negativos, ya que los valores negativos siempre contradicen la condición de "eliminar datos cuando la diferencia es 10". Así que para asegurarnos de que siempre tenemos resultados positivos, necesitamos envolver las comparaciones en un método Función de valor absoluto .

=IF(AND(ABS(C6-C5)>$E$6

Aquí empezamos nuestra primera comparación. Simplemente restamos el valor actual con el valor anterior y vemos si el resultado es mayor que el nivel de diferencia almacenado en Célula E6 e hizo de la célula un Referencia absoluta para mantener bloqueado el valor de la celda.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

A continuación, la segunda parte de la comparación, separada por una coma, comparará el punto de datos actual con el siguiente.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Ahora ponemos una coma y determinamos poner Función NA si tanto el Y son verdaderas.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Y si el Y no es verdadera, entonces queremos devolver el punto de datos real como la función SI Valor falso. Así que escribimos una coma y pasamos el número de referencia de la celda C6 ahí dentro.

Más información: Cómo eliminar la validación de datos en Excel (5 maneras)

Lecturas similares

  • Cómo eliminar un encabezado en Excel (4 métodos)
  • Eliminar líneas discontinuas en Excel (5 formas rápidas)
  • Cómo eliminar la cuadrícula de Excel (6 métodos sencillos)
  • Eliminar bordes en Excel (4 formas rápidas)
  • Cómo quitar el modo de compatibilidad en Excel (2 maneras fáciles)

3. Eliminar valores atípicos manualmente en Excel

Otra forma sencilla de eliminar valores atípicos en Excel es ordenar los valores del conjunto de datos y eliminar manualmente los valores superiores e inferiores.

Para ordenar los datos,

  • Seleccione el conjunto de datos.
  • Ir a Ordenar y filtrar en el Edición de y elija Ordenar de menor a mayor o Ordenar de mayor a menor .

  • En nuestro caso, seleccionamos Ordenar de menor a mayor Ordenó los números de nuestro conjunto de datos en orden ascendente, colocando los más pequeños en la parte superior y los más grandes en la inferior.

Ahora basta con eliminar manualmente esos datos para que el conjunto de datos quede libre de valores periféricos.

No recomendamos seguir este proceso cuando se trabaja con un conjunto de datos grande. Cuando su conjunto de datos sea pequeño y más fácil de visualizar, sólo entonces podrá aplicar este procedimiento; de lo contrario, no lo aplique.

Más información: Cómo Eliminar la Ordenación en Excel (3 Métodos Fáciles)

Conclusión

Este artículo muestra cómo eliminar valores atípicos en Excel. Espero que este artículo te haya resultado muy útil. No dudes en preguntar si tienes alguna duda sobre el tema.

Hugh West es un capacitador y analista de Excel altamente experimentado con más de 10 años de experiencia en la industria. Tiene una Licenciatura en Contabilidad y Finanzas y una Maestría en Administración de Empresas. Hugh tiene una pasión por la enseñanza y ha desarrollado un enfoque de enseñanza único que es fácil de seguir y comprender. Su conocimiento experto de Excel ha ayudado a miles de estudiantes y profesionales en todo el mundo a mejorar sus habilidades y sobresalir en sus carreras. A través de su blog, Hugh comparte su conocimiento con el mundo, ofreciendo tutoriales gratuitos de Excel y capacitación en línea para ayudar a las personas y empresas a alcanzar su máximo potencial.