Cum să calculați valorile aberante în Excel (5 moduri simple)

  • Imparte Asta
Hugh West

Este posibil să fie necesar să se identifice valorile aberante pentru a efectua calcule statistice asupra datelor dintr-un set de date. Puteți descoperi valorile aberante din seturi de date uriașe folosind Microsoft Excel în numeroase moduri. În această postare, vă vom arăta cum să calculați valorile aberante în Microsoft Excel folosind cinci moduri distincte.

Descărcați caietul de practică

Puteți descărca gratuit caietul de lucru Excel de aici și puteți exersa pe cont propriu.

Găsiți valorile aberante.xlsx

5 abordări practice pentru a calcula valorile aberante în Excel

Outliers sunt valori de date care sunt semnificativ diferite de restul valorilor din setul de date. Cu alte cuvinte, valorile aberante sunt valori extraordinare. Acestea sunt fie excepționale mare sau în mod excesiv scăzut în comparație cu alte valori dintr-un set de date. Găsirea valorilor aberante este vitală în calculele statistice, deoarece acestea au un impact asupra rezultatelor analizei datelor noastre.

De exemplu, aveți un set de date care arată venitul zilnic al douăsprezece persoane. Acum, trebuie să calculați valorile aberante folosind Microsoft Excel. Aici, vă voi arăta cinci abordări simple pentru a face acest lucru.

1. Utilizați Sort & Filtru pentru a calcula valorile aberante în Excel

Puteți calcula valorile aberante dintr-un set mic de date utilizând funcția Sortare & Filtrare Dacă doriți să calculați valorile aberante utilizând funcția de sortare și filtrare, puteți face acest lucru urmând pașii de mai jos.

Pasul 1:

  • În primul rând, selectați în setul de date din Excel antetul de coloană pe care doriți să îl sortați. De exemplu, în setul de date dat, în fișierul cu antetul de coloană numit Venituri zilnice (Celula C40 este ales).

Pasul 2:

  • Apoi, apăsați butonul Acasă de pe panglică și mergeți la rubrica Editare grup.

Pasul 3:

  • După aceea, în Grupul de editare faceți clic pe Sortare & Filtrare și faceți clic pe butonul Personalizat Sortare .

Pasul 4:

  • Apoi, apare o nouă casetă de dialog numită Sortare În caseta de dialog apărută, selectați Daily Venituri în Sortează după picătură în jos și De la cel mai mic la cel mai mare în meniul derulant Order (Comandă). După aceea, faceți clic pe OK .

Pasul 5:

  • În cele din urmă, se va Venituri zilnice ar fi sortată în modul indicat, cu cele mai mici valori în partea de sus și cele mai mari valori în partea de jos. După rularea procedurii, căutați orice neregularități în intervalul de date pentru a determina valorile aberante.

De exemplu, primele două valori din coloană sunt semnificativ mai mici, iar ultimele două valori din coloană sunt substanțial mai mari decât restul valorilor din setul de date, așa cum se arată în rezultatul de mai sus.

Citește mai mult: Cum să găsiți valorile aberante în analiza de regresie în Excel (3 moduri simple)

2. Aplicați funcția QUARTILE pentru a calcula valorile aberante în Excel

Funcția QUARTILE abordarea este un mod mai științific de a calcula valorile aberante în Excel. Puteți utiliza această funcție pentru a împărți seturile de date în patru porțiuni egale. Următoarele valori vor fi returnate de către funcția QUARTILE :

  • The minim valoare.
  • The 1. cuartilă (Q1- cele mai mici 25% dintr-un anumit set de date).
  • The 2. cuartilă (Q2-următoarele 25% din setul de date).
  • The 3. cuartilă (Q3- a doua cea mai mare proporție de 25% din setul de date).
  • The maxim valoare.

Sintaxa de funcția QUARTILE în Excel este:

=QUARTILE(array,quart)

Sintaxa conține următoarele argumente:

  • a rray : intervalul de celule dintr-un anumit set de date pentru care se va calcula valoarea cuartilă.
  • litru: Aceasta specifică valoarea care trebuie returnată.

Pentru calcularea valorilor aberante pentru setul de date de mai sus folosind funcția QUARTILE, urmați pașii de mai jos.

Pasul 1:

  • În primul rând, introduceți următoarea formulă pentru determinarea 1. cuartilă ( Q1 ) este prezentată mai jos.
=QUARTILE($C$5:$C$16,1)

Pasul 2:

  • Și în acest caz, formula de calcul a 3. cuartilă ( Q3 ) este prezentată mai jos.
=QUARTILE($C$5:$C$16,3)

Pasul 3:

  • În al treilea rând, trebuie să determinați IQR, care este Intervalul dintre cuartile (reprezintă 50% a datelor date dintr-un set de date care se încadrează în prima și a treia cuartilă) prin scăderea Q1 (în celulă G4 ) din Q3 (în celulă G5 ). Introduceți următoarea formulă pentru a calcula scăderea.

    =G5-G4

Pasul 4:

  • După ce a găsit IQR, în continuare trebuie să determinați partea superioară și mai jos Deoarece partea superioară și mai jos Scrieți următoarea formulă pentru a calcula limita superioară.

    =G5+(1,5*G6)

Pasul 5:

  • Apoi, pentru a calcula limita inferioară, scrieți următoarea formulă.
=G4-(1.5*G6)

Pasul 6:

  • În cele din urmă, după finalizarea pasului anterior, puteți determina valorile aberante pentru fiecare valoare de date. În foaia de lucru Excel, introduceți următoarea formulă cu funcția OR în celulă D5 .
=OR(C5$G$7)

  • Această formulă va ajuta la identificarea datelor care nu se încadrează în limita intervalului menționat mai sus. După procesare, formula va afișa un Declarație TRUE în cazul în care datele specifice reprezintă o valoare aberantă și FALSE dacă nu este. Faceți dublu clic pe pe AutoFill instrument în celulă C5 pentru a copia formula în restul celulelor din coloana C Astfel, puteți observa o valoare Adevărat în dreptul tuturor valorilor aberante din setul de date.

3. Combinați funcțiile AVERAGE și STDEV.P pentru a calcula valorile aberante din medie și abaterea standard

A abaterea standard (sau σ ) este o măsură pentru a determina cât de distribuite sunt datele în raport cu valoarea medie a întregului set de date. Datele sunt grupate în jurul mediei atunci când abaterea standard este mică, în timp ce datele sunt mai răspândite atunci când abaterea standard este mare. Pentru a calcula valorile aberante folosind metoda Medie și Abaterea standard puteți urma următorii pași.

Pasul 1:

  • În primul rând, utilizați același set de date prezentat la începutul acestui articol și apoi calculați media și abaterea standard. Pentru a calcula media, introduceți următoarea formulă cu funcția AVERAGE în celulă G5 .
=MEDIA(C5:C16)

Pasul 2:

  • Pentru a calcula abaterea standard, introduceți următoarea formulă cu funcția STDEV.P în celulă G6 .
=STDEV.P(C5:C16)

Pasul 3:

  • În continuare, veți calcula limita superioară pentru avansarea ulterioară în proces. În celula G7 , se calculează limita inferioară cu ajutorul următoarei formule.
=G5-(1,25*G6)

Pasul 4:

  • Și în celulă G8 se calculează limita superioară prin următoarea formulă
=G5+(1,5*G6)

Pasul 5:

  • După aceea, pentru a calcula dacă există sau nu valori aberante, introduceți următoarea formulă în celulă D5 .
=OR(C5$G$8)

  • Astfel, formula va returna un ADEVĂRAT dacă datele specifice din celula dorită reprezintă o valoare aberantă și FALSE.
  • Faceți dublu clic pe pe AutoFill instrument în celulă D5 pentru a copia formula în restul celulelor din coloana D Astfel, puteți afla toate valorile aberante rămase în setul de date.

Citește mai mult: Cum să găsiți valorile aberante cu deviația standard în Excel (cu pași rapizi)

4. Introduceți Z-Score pentru a calcula valorile aberante în Excel

The Z-score este una dintre cele mai des utilizate metode de măsurare pentru identificarea valorilor aberante. Această metodă arată cât de departe se află o anumită dată de media unui set de date în raport cu abaterea standard a acesteia. Pentru a calcula valorile aberante utilizând Z-score în Excel puteți vedea pașii descriși mai jos.

Pasul 1:

  • În primul rând, luați setul de date dorit.

Pasul 2:

  • În al doilea rând, în celulă H5, introduceți următoarea formulă pentru calcularea medie pentru datele date.
=MEDIA(C5:C16)

Pasul 3:

  • În al treilea rând, se calculează abaterea standard a setului de date dat în celula H6 prin utilizarea următoarei formule.
=STDEV.P(C5:C16)

Pasul 4:

  • După aceea, trebuie să determinați Z -score pentru fiecare valoare a datelor. Pentru a face acest lucru, utilizați formula de mai jos.
=(C5-$H$5)/$H$6

Pasul 5:

  • După calcularea tuturor Valorile Z, veți vedea că intervalul de Valorile Z este între -1.44 și 13 Deci, considerăm valorile Z-score mai mică de -1,2 sau mai mare de +1.8 pentru limitele aberante.
  • Apoi, introduceți următoarea formulă în celulă E 5 .
=OR((D51.8))

  • În cele din urmă, formula va returna un ADEVĂRAT în cazul în care datele specifice sunt aberante și va returna valoarea FALSE
  • Faceți dublu clic pe pe celulă E5 pentru a utiliza AutoFill pentru a copia formula în restul celulelor din coloana E Astfel, puteți găsi toate valorile aberante rămase în setul dvs. de date.

Citește mai mult: Cum să găsiți valorile aberante utilizând scorul Z în Excel (cu pași rapizi)

5. Îmbinați funcțiile LARGE și SMALL pentru a găsi valorile aberante în Excel

Funcția LARGE și funcția SMALL din Excel au operații opuse. O vom folosi pentru a găsi cele mai mari și, respectiv, cele mai mici date sau valori dintr-un set de date. Această funcție va extrage toate datele dintr-un set de date, găsind cele mai mici și cele mai mari numere. Sunt capabile să găsească al doilea cel mai mic sau cel mai mare, al treilea cel mai mare sau cel mai mic și așa mai departe.

Pasul 1:

  • În primul rând, utilizați următoarea formulă în celulă E5 cu funcția LARGE .
=LARGE($C$5:$C$16,1)

    • Astfel, de la 12 valori, puteți vedea prima cea mai mare valoare, care este 780 .

Pasul 2:

  • După aceea, în celulă G5 , scrieți următoarea formulă pentru a găsi cea mai mică valoare.
=SMALL($C$5:$C$16,1)

  • În cele din urmă, de la 12 puteți vedea valorile 1. cea mai mică valoare 110 .
  • Odată ce ați descoperit toate valorile necesare, puteți evidenția cu ușurință orice valori aberante din setul de date.

Concluzie

Acesta este sfârșitul acestui articol. Sper că ați găsit acest articol util. După ce ați citit acest articol, veți fi capabil să calculați valorile aberante în Excel folosind oricare dintre metode. Vă rugăm să ne împărtășiți orice alte întrebări sau recomandări în secțiunea de comentarii de mai jos.

Hugh West este un trainer și analist Excel cu o experiență de peste 10 ani în industrie. Deține o diplomă de licență în contabilitate și finanțe și un master în administrarea afacerilor. Hugh are o pasiune pentru predare și a dezvoltat o abordare unică de predare care este ușor de urmărit și de înțeles. Cunoștințele sale experte despre Excel au ajutat mii de studenți și profesioniști din întreaga lume să-și îmbunătățească abilitățile și să exceleze în cariera lor. Prin blogul său, Hugh își împărtășește cunoștințele lumii, oferind tutoriale gratuite Excel și instruire online pentru a ajuta persoanele și companiile să-și atingă întregul potențial.