Cum să găsiți valorile aberante utilizând scorul Z în Excel (cu pași rapizi)

  • Imparte Asta
Hugh West

În calculele statistice de probabilitate, scorul z este de o importanță primordială. Distribuțiile de date și valorile aberante dintr-un set de date pot fi determinate cu acest termen. Este posibil să le determinați manual dintr-un set de date. Dacă aveți un set de date mai mare, aveți la dispoziție mai multe instrumente. Excel este unul dintre ele. Dacă sunteți în căutarea unor trucuri speciale pentru a găsi valori aberante folosind scorul z în Excel,ați ajuns la locul potrivit. Acest articol va discuta fiecare pas al metodei de a găsi valori aberante folosind scorul z. Să urmărim ghidul complet pentru a învăța toate acestea.

Descărcați caietul de practică

Descărcați acest caiet de exerciții pentru a vă exercita în timp ce citiți acest articol. Acesta conține toate seturile de date în diferite foi de calcul pentru o înțelegere clară. Încercați-vă în timp ce parcurgeți procesul pas cu pas.

Găsiți valorile aberante utilizând scorul Z.xlsx

Ce este scorul Z?

În statistică, scorul z reprezintă abaterea standard de la populație pentru un anumit punct de date. Această măsură ne spune cât de departe este o anumită valoare de media unui set în raport cu abaterea sa standard. ( Abaterea standard este valoarea RMS a tuturor punctelor diferite și a mediei). Formula matematică pentru scorul z este următoarea

Unde,

Z = scorul z

X =valoarea observată

= valoarea medie

σ = abaterea standard

Ce este Outlier?

Valorile aberante sunt valori care sunt semnificativ diferite de alte valori dintr-un set de date. Un alt mod de a spune acest lucru este că o valoare aberantă este o valoare care este mult mai mare sau mai mică decât media și mediana setului de date. Într-un grafic Excel, puteți considera ca fiind aberante punctele de date care rămân la mare distanță de celelalte puncte de date. De exemplu, luați în considerare un scenariu în care aveți un total de puncte obținute de 5Punctele marcate sunt 1600, 1400, 300 și 1500. Acum, dacă trasați un grafic în Excel, veți vedea că punctul 300 se află la mare distanță de ceilalți. Deci, în acest caz, 3000 este valoarea aberantă.

O valoare aberantă este considerată a fi o valoare a scorului z cuprinsă în intervalul 3 la -3 deoarece aceste valori sunt destul de îndepărtate de valoarea mediei.

Procedura pas cu pas pentru a găsi valorile aberante utilizând scorul Z în Excel

În secțiunea următoare, vom utiliza o metodă eficientă și complicată pentru a găsi valorile aberante folosind scorul z în Excel. Vom determina scorul z al eșantionului prin calcularea mediei și a abaterilor standard ale tuturor numerelor. Apoi vom găsi valorile aberante ale fiecărei observații. Această secțiune oferă detalii ample despre această metodă. Ar trebui să învățați și să aplicați toate aceste metode pentru a vă îmbunătățicapacitatea de gândire și cunoștințe de Excel. Utilizăm Microsoft Office 365 aici, dar puteți utiliza orice altă versiune, în funcție de preferințele dumneavoastră.

Pasul 1: Calculați media setului de date

La început, vom găsi media setului de date. Acest lucru va fi util pentru a determina abaterea standard și scorul z. Pentru aceasta, folosim funcția AVERAGE pentru a determina media observației. Această funcție primește o serie de argumente sau un interval de valori și returnează media acestora. Să parcurgem pașii pentru a calcula media setului de date.

  • Mai întâi de toate, selectați intervalul de celule și introduceți următoarea formulă în celulă H4 .

=MEDIA(C5:C20)

  • Apoi, apăsați Introduceți .
  • În consecință, veți obține valoarea medie a tuturor datelor.

Citește mai mult: Cum să găsiți valorile aberante cu deviația standard în Excel (cu pași rapizi)

Pasul 2: Estimarea deviației standard

Acum, vom estima abaterea standard. Vom folosi funcția STDEV.P pentru a determina abaterile standard pentru setul de date. Această funcție va returna abaterea standard dintr-o serie de numere sau un interval de valori pe care le ia ca argumente. Să parcurgem pașii pentru a estima abaterea standard.

  • Mai întâi de toate, selectați intervalul de celule și introduceți următoarea formulă în celulă H5 .

=STDEV.P(C5:C20)

  • Apoi, apăsați Introduceți .
  • În consecință, veți avea valoarea deviației standard pentru toate datele.

Citește mai mult: Cum să calculați valorile aberante în Excel (5 moduri simple)

Etapa 3: Evaluarea scorului Z

Acum, vom evalua scorul z. Pentru a determina scorul z al valorilor, în primul rând, avem nevoie de diferența dintre valoare și medie și apoi o împărțim la deviația standard conform formulei. Să parcurgem pașii pentru a estima scorul z.

  • Mai întâi de toate, pentru a evalua scorul z, trebuie să introduceți următoarea formulă în celulă D5 .

=(C5-$H$4)/$H$5

  • Apoi, apăsați Introduceți .
  • Ca rezultat, veți avea scorul z pentru prima valoare din setul de date.

  • În continuare, trageți în jos Mâner de umplere pentru a completa restul celulelor din coloană cu formula.
  • În consecință, veți obține scorul z pentru toate intrările din setul de date.

  • În setul nostru de date, valoarea medie este 113.875 iar abaterea standard este 100.21 Acum, dacă luăm în considerare valoarea specifică a lui $79 , scorul z pentru această valoare este -0.347 ceea ce înseamnă că $79 este 0.347 abateri standard sub media sau valoarea medie.
  • Într-un alt caz, atunci când valoarea este $500 , obținem că scorul z este 3.85 Asta înseamnă... $500 este 3.85 deviații standard peste valoarea medie.

Citește mai mult: Cum să găsiți valorile aberante în analiza de regresie în Excel (3 moduri simple)

Pasul 4: Găsiți valorile aberante din setul de date

Acum vom descoperi valorile aberante din setul nostru de date. Se consideră că o valoare aberantă este o valoare a scorului z cuprinsă în intervalul 3 la -3 , așa cum am menționat mai sus. Să parcurgem pașii pentru a găsi valorile aberante din setul de date. Aici vom folosi funcția OR pentru a afla dacă valorile din setul de date conțin sau nu valori aberante. Dacă oricare dintre valorile din intervalul de valori îndeplinește condiția, atunci rezultatul va fi ADEVĂRAT.

  • Mai întâi de toate, pentru a găsi valorile aberante, trebuie să introduceți următoarea formulă în celulă E5 .

=OR((D53))

  • Apoi, apăsați Introduceți .
  • Ca urmare, veți afla dacă prima valoare conține sau nu valori aberante în setul de date.

  • În continuare, trageți în jos Mâner de umplere pentru a completa restul celulelor din coloană cu formula.
  • În consecință, veți putea ști dacă valorile din setul de date conțin sau nu valori aberante, după cum se arată mai jos.

Din setul de date de mai sus, putem observa că scorul z al unui singur id este peste valoarea 3. De aceea, avem doar un singur outlier.

Acum, vom arăta valorile aberante folosind un Dispersie Trebuie să urmăm următorul proces:

  • În primul rând, selectați intervalul de celule C5:D20 .
  • Apoi, mergeți la Introduceți tab. Selectați Inserați un grafic scatter (X, Y) sau un grafic cu bule, și, în cele din urmă, selectați Dispersie .

  • În consecință, veți obține următorul grafic.

  • Pentru a modifica stilul graficului, selectați Grafic Design și apoi, selectați Stilul 9 de la opțiunea Stiluri de diagramă grup.

  • În consecință, veți obține următoarele Dispersie grafic.

Citește mai mult: Cum să găsiți valorile aberante în Excel (5 moduri utile)

Concluzie

Acesta este sfârșitul sesiunii de astăzi. Cred cu tărie că de acum înainte veți putea găsi valori aberante folosind scorul z în Excel. Dacă aveți întrebări sau recomandări, vă rugăm să le împărtășiți în secțiunea de comentarii de mai jos.

Nu uitați să verificați site-ul nostru Exceldemy.com pentru diverse probleme și soluții legate de Excel. Continuați să învățați noi metode și continuați să vă dezvoltați!

Hugh West este un trainer și analist Excel cu o experiență de peste 10 ani în industrie. Deține o diplomă de licență în contabilitate și finanțe și un master în administrarea afacerilor. Hugh are o pasiune pentru predare și a dezvoltat o abordare unică de predare care este ușor de urmărit și de înțeles. Cunoștințele sale experte despre Excel au ajutat mii de studenți și profesioniști din întreaga lume să-și îmbunătățească abilitățile și să exceleze în cariera lor. Prin blogul său, Hugh își împărtășește cunoștințele lumii, oferind tutoriale gratuite Excel și instruire online pentru a ajuta persoanele și companiile să-și atingă întregul potențial.