Com trobar outliers utilitzant Z Score a Excel (amb passos ràpids)

  • Comparteix Això
Hugh West

En els càlculs estadístics de probabilitat, la puntuació z té una importància primordial. Les distribucions de dades i els valors atípics en un conjunt de dades es poden determinar amb aquest terme. És possible determinar-los manualment a partir d'un conjunt de dades. Si teniu un conjunt de dades més gran, hi ha diverses eines a la vostra disposició. Excel és un d'ells. Si esteu buscant alguns trucs especials per trobar valors atípics mitjançant la puntuació z a Excel, heu arribat al lloc correcte. Aquest article tractarà cada pas del mètode per trobar valors atípics mitjançant la puntuació z. Seguim la guia completa per aprendre tot això.

Baixeu el quadern de pràctiques

Descarregueu aquest quadern de pràctiques per fer exercici mentre llegiu aquest article. Conté tots els conjunts de dades en diferents fulls de càlcul per a una comprensió clara. Prova-ho mentre segueixes el procés pas a pas.

Troba els valors atípics mitjançant Z Score.xlsx

Què és Z Score?

En les estadístiques, la puntuació z representa la desviació estàndard de la població per a un punt de dades concret. Aquesta mesura ens indica a quina distància es troba un valor específic de la mitjana d'un conjunt en relació a la seva desviació estàndard. (La desviació estàndard és el valor RMS de tots els diferents punts i la mitjana). La fórmula matemàtica per a la puntuació z és

On,

Z = puntuació z

X =valor observat

= valor mitjà

σ = desviació estàndard

QuèÉs Outlier?

Els valors atípics són valors que són significativament diferents dels altres valors d'un conjunt de dades. Una altra manera de dir-ho és que un valor atípic és un valor molt superior o inferior a la mitjana i la mediana del conjunt de dades. En un gràfic d'Excel, podeu considerar els punts de dades que romanen lluny dels altres punts de dades com a valors atípics. Per exemple, considereu un escenari en què tingueu punts totals anotats per 5 jugadors diferents a la temporada de l'NBA. Els punts anotats són 1600, 1400, 300 i 1500. Ara, si traceu un gràfic a Excel, veureu que el punt 300 es troba molt lluny dels altres. Per tant, en aquest 3000 és el valor atípic.

Un valor atípic es considera un valor de puntuació z dins de l'interval de 3 a -3 perquè aquests valors són força distants del valor de la mitjana.

Procediment pas a pas per trobar valors atípics mitjançant la puntuació Z a Excel

A la secció següent, utilitzarem un mètode eficaç i complicat per trobar valors atípics mitjançant la puntuació z a Excel. Determinarem la puntuació z de la mostra calculant la mitjana i les desviacions estàndard de tots els nombres. I després trobarem valors atípics de cada observació. Aquesta secció ofereix detalls amplis sobre aquest mètode. Hauríeu d'aprendre i aplicar tot això per millorar la vostra capacitat de pensament i el vostre coneixement d'Excel. Utilitzem la versió Microsoft Office 365 aquí, però podeu utilitzar qualsevol altra versió segonssegons la vostra preferència.

Pas 1: calcular la mitjana del conjunt de dades

Al principi, trobarem la mitjana del conjunt de dades. Això serà útil per determinar la desviació estàndard i la puntuació z. A ella, fem servir la funció MITJANA per determinar la mitjana de l'observació. Aquesta funció pren una sèrie d'arguments o un rang de valors i retorna la seva mitjana. Anem a seguir els passos per calcular la mitjana del conjunt de dades.

  • En primer lloc, seleccioneu l'interval de cel·les i escriviu la fórmula següent a la cel·la H4 .

=AVERAGE(C5:C20)

  • A continuació, premeu Retorn .
  • Com a conseqüència, tindrà el valor mitjà de totes les dades.

Llegir més: Com trobar valors atípics amb desviació estàndard a Excel ( amb passos ràpids)

Pas 2: Estimar la desviació estàndard

Ara, estimarem la desviació estàndard. Utilitzarem la funció STDEV.P per determinar les desviacions estàndard del conjunt de dades. Aquesta funció retornarà la desviació estàndard d'una sèrie de nombres o rang de valors que pren com a arguments. Anem a seguir els passos per estimar la desviació estàndard.

  • En primer lloc, seleccioneu l'interval de les cel·les i escriviu la fórmula següent a la cel·la H5 .

=STDEV.P(C5:C20)

  • A continuació, premeu Retorn .
  • Com a conseqüència, tindreu la desviació estàndardvalor per a totes les dades.

Llegir més: Com calcular valors atípics a Excel (5 maneres senzilles)

Pas 3: avaluar la puntuació Z

Ara, avaluarem la puntuació z. Per determinar la puntuació z dels valors, en primer lloc, necessitem la diferència del valor de la mitjana i després dividim-la per la desviació estàndard segons la fórmula. Anem a seguir els passos per estimar la puntuació z.

  • En primer lloc, per avaluar la puntuació z, heu d'escriure la fórmula següent a la cel·la D5 .

=(C5-$H$4)/$H$5

  • A continuació, premeu Retorn .
  • Com a resultat, tindrà la puntuació z per al primer valor del conjunt de dades.

  • A continuació, arrossegueu la icona Emplena la maneta per omplir-la. la resta de cel·les de la columna amb la fórmula.
  • Com a conseqüència, obtindreu la puntuació z per a totes les entrades del conjunt de dades.

  • Al nostre conjunt de dades, el valor mitjà és 113,875 i la desviació estàndard és 100,21 . Ara, si tenim en compte el valor específic de $79 , la puntuació z d'aquest valor és -0,347 , el que significa que $79 és 0,347 estàndard. desviacions per sota del valor mitjà o mitjà.
  • En un altre cas, quan el valor és $500 , obtenim la puntuació z 3,85 . Això vol dir que 500 $ són 3,85 desviacions estàndard per sobre del valor mitjà.

Llegiu més: ComTrobeu valors atípics a l'anàlisi de regressió a Excel (3 maneres senzilles)

Pas 4: cerqueu valors atípics del conjunt de dades

Ara descobrirem els valors atípics al nostre conjunt de dades. Es considera que un valor atípic és un valor de puntuació z dins del rang de 3 a -3 , com s'ha esmentat anteriorment. Anem a seguir els passos per esbrinar els valors atípics del conjunt de dades. Aquí, utilitzarem la funció OR per esbrinar si els valors del conjunt de dades contenen valors atípics o no. Si algun dels valors dins de l'interval compleix la condició, el resultat serà VERTADER.

  • En primer lloc, per trobar valors atípics, heu d'escriure la fórmula següent a la cel·la E5 .

=OR((D53))

  • A continuació, premeu Retorn .
  • Com a resultat, descobrireu si el primer valor conté valors atípics o no al conjunt de dades.

  • A continuació, arrossegueu la icona Emplenar el mànec per omplir la resta de cel·les de la columna amb la fórmula.
  • Com a conseqüència, podreu saber si els valors del conjunt de dades contenen valors atípics o no com es mostra a continuació.

A partir del conjunt de dades anterior, podem veure que només la puntuació z d'un id està per sobre del valor de 3. És per això que només obtenim un valor atípic. .

Ara, mostrarem els valors atípics mitjançant un gràfic Dispersió . Hem de seguir el següent procés:

  • En primer lloc, seleccioneu l'interval de cel·les C5:D20 .
  • A continuació, aneu a lapestanya Insereix . Seleccioneu Insereix gràfic de dispersió (X, Y) o gràfic de bombolles, i, finalment, seleccioneu Dispersió .

  • Com a conseqüència, obtindreu el següent gràfic.

  • Per modificar l'estil del gràfic, seleccioneu Gràfic Disseny i, a continuació, seleccioneu l'opció Estil 9 que vulgueu al grup Estils de gràfics .

  • Com a conseqüència, obtindreu el següent gràfic Dispersió .

Llegiu més: Com per trobar valors atípics a Excel (5 maneres útils)

Conclusió

Aquest és el final de la sessió d'avui. Crec fermament que a partir d'ara podreu trobar valors atípics mitjançant la puntuació z a Excel. Si teniu preguntes o recomanacions, compartiu-les a la secció de comentaris següent.

No oblideu consultar el nostre lloc web Exceldemy.com per trobar diversos problemes i solucions relacionats amb Excel. Segueix aprenent nous mètodes i segueix creixent!

Hugh West és un entrenador i analista d'Excel molt experimentat amb més de 10 anys d'experiència en el sector. És llicenciat en Comptabilitat i Finances i Màster en Administració i Direcció d'Empreses. Hugh té una passió per l'ensenyament i ha desenvolupat un enfocament pedagògic únic que és fàcil de seguir i entendre. El seu coneixement expert d'Excel ha ajudat a milers d'estudiants i professionals de tot el món a millorar les seves habilitats i a destacar en les seves carreres. A través del seu bloc, Hugh comparteix els seus coneixements amb el món, oferint tutorials d'Excel gratuïts i formació en línia per ajudar les persones i les empreses a assolir tot el seu potencial.