Sisällysluettelo
Poikkeavat arvot voidaan joutua tunnistamaan, jotta voidaan tehdä tilastollisia laskutoimituksia tietokokonaisuuden tiedoille. Voit löytää poikkeavat arvot valtavista tietokokonaisuuksista Microsoft Excelin avulla monin eri tavoin. Tässä kirjoituksessa näytämme, miten voit laskea poikkeavat arvot Microsoft Excelissä viidellä eri tavalla.
Lataa harjoituskirja
Voit ladata ilmaisen Excel-työkirjan täältä ja harjoitella sitä itse.
Löydä poikkeamat.xlsx5 kätevää lähestymistapaa poikkeamien laskemiseen Excelissä
Outliers ovat data-arvoja, jotka poikkeavat merkittävästi aineiston muista data-arvoista. Poikkeavat arvot ovat toisin sanoen poikkeuksellisia arvoja. Ne ovat joko poikkeuksellisen suuria tai poikkeuksellisia. korkea tai liikaa alhainen verrattuna muihin arvoihin aineistossa. Poikkeavien arvojen löytäminen on elintärkeää tilastollisissa laskelmissa, koska ne vaikuttavat tietojen analyysin tuloksiin.
Sinulla on esimerkiksi tietokokonaisuus, joka näyttää kahdentoista henkilön päivittäiset tulot. Nyt sinun on laskettava poikkeamat Microsoft Excelin avulla. Näytän tässä viisi helppoa tapaa tehdä se.
1. Käytä lajittelua ja suodatusta Excelin poikkeamien laskemiseen.
Voit laskea poikkeamat pienestä aineistosta hyödyntämällä Lajittele & suodata Jos haluat laskea poikkeamat lajittelu- ja suodatustoiminnon avulla, voit tehdä sen noudattamalla seuraavia ohjeita.
Vaihe 1:
- Valitse ensin Excelin tietokokonaisuudestasi se sarakeotsikko, jonka haluat lajitella. Esimerkiksi annetussa tietokokonaisuudessa tiedoston sarakeotsikko nimeltä Päivittäiset tulot (Cell C40 valitaan).
Vaihe 2:
- Paina sitten Etusivu välilehti nauhassa ja siirry kohtaan Muokkaaminen ryhmä.
Vaihe 3:
- Sen jälkeen Muokkausryhmä klikkaa Lajittele & suodata komentoa ja napsauta Custom Lajittele .
Vaihe 4:
- Tämän jälkeen avautuu uusi valintaikkuna nimeltä Lajittele Aukeaa. Valitse avautuvassa valintaikkunassa Päivittäin Tulot vuonna Lajittelu pudotusvalikko ja Pienimmästä suurimpaan pudotusvalikosta Järjestys. Napsauta sen jälkeen painiketta OK .
Vaihe 5:
- Lopuksi Päivittäiset tulot sarake lajitellaan ilmoitetulla tavalla siten, että pienimmät arvot ovat ylhäällä ja suurimmat arvot alhaalla. Kun olet suorittanut menettelyn, etsi epäsäännöllisyyksiä tietovälissä, jotta voit määrittää poikkeavat arvot.
Esimerkiksi sarakkeen kaksi ensimmäistä arvoa ovat huomattavasti pienempiä ja sarakkeen kaksi viimeistä arvoa huomattavasti suurempia kuin muut datasarjan arvot, kuten yllä olevasta tuloksesta käy ilmi.
Lue lisää: Miten löytää poikkeavia arvoja regressioanalyysissä Excelissä (3 helppoa tapaa)
2. Sovelletaan QUARTILE-funktiota poikkeamien laskemiseen Excelissä.
QUARTILE-toiminto lähestymistapa on tieteellisempi tapa laskea poikkeavat arvot Excelissä. Voit käyttää tätä funktiota, kun haluat jakaa tietosarjasi neljään yhtä suureen osaan. Seuraavat arvot palautetaan funktiolla QUARTILE-funktio :
- The vähintään arvo.
- The 1. kvartiili (Q1 - tietystä tietokokonaisuudesta alin 25 %).
- The 2. kvartiili (Q2 - aineiston alimmat 25 prosenttia).
- The Kolmas kvartiili (Q3 - aineiston toiseksi korkein 25 %).
- The maksimi arvo.
Syntaksi QUARTILE-toiminto Excelissä on:
=QUARTILE(array,quart)
Syntaksi sisältää seuraavat argumentit:
- a rray : tietyn tietokokonaisuuden solualue, jolle lasketaan kvartiiliarvo.
- neljännes: Tämä määrittää, mikä arvo palautetaan.
Poikkeavien arvojen laskemiseksi edellä esitetystä tietokokonaisuudesta käyttämällä QUARTILE-toiminto, noudata alla olevia ohjeita.
Vaihe 1:
- Kirjoita ensiksi seuraava kaava, jolla määritetään 1. kvartiili ( Q1 ) on esitetty jäljempänä.
=QUARTILE($C$5:$C$16,1)
Vaihe 2:
- Tässäkin tapauksessa kaava, jolla lasketaan Kolmas kvartiili ( Q3 ) on esitetty jäljempänä.
=QUARTILE($C$5:$C$16,3)
Vaihe 3:
- Kolmanneksi sinun on määritettävä IQR, joka on Kvartiilien välinen vaihteluväli (se edustaa 50% annetuista tiedoista, jotka kuuluvat ensimmäiseen ja kolmanteen kvartiiliin) vähentämällä siitä Q1 (solussa G4 ) alkaen Q3 (solussa G5 ). Kirjoita seuraava kaava vähennyksen laskemiseksi.
=G5-G4
Vaihe 4:
- Löydettyään IQR, Seuraavaksi on määritettävä ylempi ja alempi Koska ylempi ja alempi raja sisältäisi suurimman osan aineiston tiedoista. Kirjoita seuraava kaava ylärajan laskemiseksi.
=G5+(1,5*G6)
Vaihe 5:
- Tämän jälkeen alarajan laskemiseksi kirjoitetaan seuraava kaava.
=G4-(1,5*G6)
Vaihe 6:
- Kun olet viimeistellyt edellisen vaiheen, voit määrittää kunkin tietoarvon poikkeamat. Kirjoita excel-taulukkoon seuraava kaava, jossa on seuraavat tiedot OR-funktio solussa D5 .
=OR(C5$G$7)
- Tämä kaava auttaa tunnistamaan ne tiedot, jotka eivät kuulu edellä mainittuun vaihteluvälirajaan. Käsittelyn jälkeen kaava näyttää seuraavanlaisen kuvan TRUE Statement jos kyseinen tieto on poikkeava ja FALSE jos se ei ole. Kaksoisnapsauta on AutoFill työkalu solussa C5 kopioida kaava muihin soluihin sarake C Näin voit havaita True-arvon kaikkien aineistossasi olevien poikkeavien arvojen vieressä.
3. Yhdistä AVERAGE- ja STDEV.P-funktiot poikkeamien laskemiseksi keskiarvosta ja keskihajonnasta.
A keskihajonta (tai σ ) on mittari, jolla määritetään, kuinka hajallaan data on koko datajoukon keskiarvoon nähden. Data on ryhmittynyt keskiarvon ympärille, kun keskihajonta on pieni, kun taas data on hajanaisempaa, kun keskihajonta on suuri. Laskettaessa poikkeavia arvoja käyttäen apuna käytetään Keskiarvo ja Keskihajonta voit seurata seuraavia ohjeita.
Vaihe 1:
- Käytä ensin samaa tietokokonaisuutta, joka on esitetty tämän artikkelin alussa, ja laske sitten keskiarvo ja keskihajonta. Keskiarvon laskemiseksi kirjoita seuraava kaava, jossa on AVERAGE-toiminto solussa G5 .
=KESKIARVO(C5:C16)
Vaihe 2:
- Keskihajonnan laskemiseksi on käytettävä seuraavaa kaavaa, jossa on mukana STDEV.P-funktio solussa G6 .
=STDEV.P(C5:C16)
Vaihe 3:
- Seuraavaksi lasketaan prosessin etenemisen yläraja. Solussa G7 , laske alaraja seuraavan kaavan avulla.
=G5-(1,25*G6)
Vaihe 4:
- Ja solussa G8 lasketaan yläraja seuraavan kaavan avulla
=G5+(1,5*G6)
Vaihe 5:
- Tämän jälkeen voit laskea, onko poikkeamia olemassa vai ei, kirjoittamalla soluun seuraavan kaavan. D5 .
=OR(C5$G$8)
- Näin ollen kaava palauttaa TRUE arvo, jos halutussa solussa oleva tietty tieto on poikkeava ja jos VÄÄRIN.
- Kaksoisnapsauta on AutoFill työkalu solussa D5 kopioidaksesi kaavan muihin soluihin kohdassa sarake D Näin voit löytää kaikki jäljellä olevat poikkeamat tietokokonaisuudestasi.
Lue lisää: Kuinka löytää poikkeamat Excelin keskihajonnan avulla (nopeilla vaiheilla)
4. Lisää Z-pistemäärä Excelin poikkeavien arvojen laskemiseksi.
The Z-pisteet on yksi yleisimmin käytetyistä mittareista poikkeavien arvojen tunnistamiseksi. Tämä menetelmä osoittaa, kuinka kaukana tietty tieto on tietokokonaisuuden keskiarvosta suhteessa sen keskihajontaan. Laskettaessa poikkeavia arvoja käyttämällä Z-pisteet Excelissä näet alla kuvatut vaiheet.
Vaihe 1:
- Ota ensin haluttu tietokokonaisuus.
Vaihe 2:
- Toiseksi, solussa H5, Kirjoita seuraava kaava, jolla lasketaan keskiarvo annettujen tietojen osalta.
=KESKIARVO(C5:C16)
Vaihe 3:
- Kolmanneksi lasketaan keskihajonta annetun tietokokonaisuuden solussa H6 seuraavan kaavan avulla.
=STDEV.P(C5:C16)
Vaihe 4:
- Sen jälkeen sinun on määritettävä Z -tulos jokaista data-arvoa varten. Tätä varten käytetään alla olevaa kaavaa.
=(C5-$H$5)/$H$6).
Vaihe 5:
- Laskettuaan kaikki Z-arvot, huomaat, että vaihteluväli Z-arvot on välillä -1.44 ja 13 Tarkastelemme siis seuraavia arvoja Z-pisteet pienempi kuin -1,2 tai suurempi kuin +1.8 poikkeamien raja-arvoja varten.
- Kirjoita sitten seuraava kaava soluun E 5 .
=OR((D51.8))
- Lopuksi kaava palauttaa TRUE arvo, jos tietty tieto on poikkeava, ja palauttaa arvon FALSE
- Kaksoisnapsauta solussa E5 käyttää AutoFill työkalun täyttökahvaa kopioidaksesi kaavan muihin soluihin vuonna sarake E Näin voit löytää kaikki jäljellä olevat poikkeamat tietokokonaisuudestasi.
Lue lisää: Miten löytää poikkeavat käyttämällä Z-pistemäärää Excelissä (nopeilla vaiheilla)
5. LARGE- ja SMALL-funktioiden yhdistäminen poikkeavien arvojen löytämiseksi Excelissä
LARGE-toiminto ja SMALL-toiminto Excelissä on päinvastaiset operaatiot. Käytämme sitä löytääkseen vastaavasti suurimman ja pienimmän datan tai arvon tietosarjassa. Tämä funktio vetää kaikki datan sisältämät tiedot ja löytää pienimmät ja suurimmat luvut. Ne pystyvät löytämään toiseksi pienimmän tai suurimman, kolmanneksi suurimman tai pienimmän ja niin edelleen.
Vaihe 1:
- Käytä ensin seuraavaa kaavaa solussa E5 kanssa LARGE-toiminto .
=LARGE($C$5:$C$16,1)
- Näin ollen, alkaen 12 arvot, näet 1. suurimman arvon, joka on 780 .
Vaihe 2:
- Tämän jälkeen solussa G5 , kirjoita seuraava kaava pienimmän arvon löytämiseksi.
=SMALL($C$5:$C$16,1)
- Lopuksi, alkaen 12 arvot, voit nähdä 1. pienin arvo 110 .
- Kun olet saanut selville kaikki tarvittavat arvot, voit helposti osoittaa mahdolliset poikkeamat tietokokonaisuudessa.
Päätelmä
Tämä on tämän artikkelin loppu. Toivottavasti tämä artikkeli on hyödyllinen. Kun olet lukenut tämän artikkelin, voit laskea poikkeamat Excelissä käyttämällä mitä tahansa menetelmää. Jaa mahdolliset lisäkysymykset tai suositukset kanssamme alla olevassa kommenttiosassa.