Turinys
Norint atlikti statistinius duomenų rinkinio duomenų skaičiavimus, gali prireikti nustatyti išskirtines reikšmes. Išskirtines reikšmes iš didžiulių duomenų rinkinių galite aptikti naudodami "Microsoft Excel" įvairiais būdais. Šiame pranešime parodysime, kaip apskaičiuoti išskirtines reikšmes "Microsoft Excel" naudojant penkis skirtingus būdus.
Atsisiųsti praktikos sąsiuvinį
Nemokamą "Excel" sąsiuvinį galite atsisiųsti iš čia ir praktikuotis savarankiškai.
Find Outliers.xlsx5 patogūs būdai, kaip apskaičiuoti nukrypimus "Excel" programoje
Išsiskyrimai tai duomenų reikšmės, kurios labai skiriasi nuo kitų duomenų rinkinio reikšmių. Kitaip tariant, išskirtinės reikšmės - tai ypatingos reikšmės. didelis arba pernelyg mažas lyginant su kitomis duomenų rinkinio vertėmis. Atvirkštinių verčių paieška yra labai svarbūs atliekant statistinius skaičiavimus, nes jie turi įtakos mūsų duomenų analizės rezultatams.
Pavyzdžiui, turite duomenų rinkinį, kuriame nurodytos dvylikos žmonių dienos pajamos. Dabar jums reikia apskaičiuoti nuokrypius naudojant "Microsoft Excel" programą. Čia pateiksiu penkis paprastus būdus, kaip tai padaryti.
1. Naudokite rūšiavimą ir filtravimą, kad apskaičiuotumėte išskirtines reikšmes "Excel" programoje
Iš mažo duomenų rinkinio galite apskaičiuoti išskirtines reikšmes naudodami Rūšiuoti ir filtruoti Excel komanda. Jei norite apskaičiuoti nuokrypius naudodami rūšiavimo ir filtravimo funkciją, galite tai padaryti atlikdami toliau nurodytus veiksmus.
1 žingsnis:
- Pirmiausia "Excel" duomenų rinkinyje pasirinkite stulpelio antraštę, kurią norite rūšiuoti. Pavyzdžiui, pateiktame duomenų rinkinyje failo stulpelio antraštė pavadinta Dienos pajamos (Cell C40 pasirenkama).
2 žingsnis:
- Tada paspauskite Pagrindinis juostos skirtuką ir eikite į Redagavimas grupė.
3 veiksmas:
- Po to Redagavimo grupė spustelėkite Rūšiuoti ir filtruoti komandą ir spustelėkite Pasirinktinis Rūšiuoti .
4 veiksmas:
- Tada bus atidarytas naujas dialogo langas, pavadintas Rūšiuoti Atsidarys langas. Atsidariusiame dialogo lange pasirinkite Kasdien Pajamos į Rūšiuoti pagal išskleidžiamajame sąraše ir Nuo mažiausio iki didžiausio užsakymo išskleidžiamajame sąraše. Po to spustelėkite GERAI .
5 veiksmas:
- Galiausiai Dienos pajamos stulpelis būtų surūšiuotas taip, kaip nurodyta, t. y. mažiausios reikšmės būtų viršuje, o didžiausios - apačioje. Atlikę procedūrą, ieškokite bet kokių duomenų intervalo netolygumų, kad nustatytumėte išskirtines reikšmes.
Pavyzdžiui, pirmosios dvi stulpelio reikšmės yra gerokai mažesnės, o paskutinės dvi stulpelio reikšmės yra gerokai didesnės už likusias duomenų rinkinio reikšmes, kaip parodyta pirmiau pateiktame rezultate.
Skaityti daugiau: Kaip "Excel" programoje atlikti regresinę analizę (3 paprasti būdai)
2. Taikykite QUARTILE funkciją, kad apskaičiuotumėte išskirtines reikšmes "Excel" programoje
Funkcija QUARTILE metodas - tai moksliškesnis būdas apskaičiuoti nuokrypius "Excel" programoje. Šią funkciją galite naudoti duomenų rinkiniams padalyti į keturias lygias dalis. Šias vertes grąžins funkcija QUARTILE :
- Svetainė minimalus vertė.
- Svetainė 1. kvartilis (Q1 - mažiausi 25 % tam tikro duomenų rinkinio).
- Svetainė 2. kvartilis (Q2 - kitas mažiausias 25 % duomenų rinkinio).
- Svetainė 3. kvartilis (Q3 - antrasis pagal dydį 25 % duomenų rinkinio).
- Svetainė didžiausias vertė.
Sintaksė funkcija QUARTILE "Excel" programoje yra:
=QUARTILE(masyvas,kvartalas)
Sintaksėje pateikiami šie argumentai:
- a rray : tam tikro duomenų rinkinio ląstelių intervalą, kuriam apskaičiuosite kvartilio vertę.
- kvartalas: Nurodoma, kokia reikšmė turėtų būti grąžinama.
Pirmiau pateikto duomenų rinkinio nuokrypiams apskaičiuoti naudojant funkcija QUARTILE, atlikite toliau nurodytus veiksmus.
1 žingsnis:
- Pirmiausia įveskite šią formulę, kad nustatytumėte 1. kvartilį ( Q1 ) pateikiama toliau.
= KVARTILĖ($C$5:$C$16,1)
2 žingsnis:
- Čia vėlgi naudojama formulė, pagal kurią apskaičiuojama 3. kvartilį ( Q3 ) pateikiama toliau.
= KVARTILĖ($C$5:$C$16,3)
3 veiksmas:
- Trečia, turite nustatyti IQR, kuris yra Tarp kvartilių diapazonas (tai yra 50% duotų duomenų, kurie patenka į pirmą ir trečią kvartilį, intervalą), atimant Q1 (langelyje G4 ) iš Q3 (langelyje G5 ). Atimčiai apskaičiuoti įveskite šią formulę.
=G5-G4
4 veiksmas:
- Suradus IQR, toliau reikia nustatyti viršutinė ir mažesnis Kadangi viršutinė ir mažesnis riba apimtų didžiąją dalį duomenų rinkinio duomenų. Užrašykite šią formulę viršutinei ribai apskaičiuoti.
=G5+(1,5*G6)
5 veiksmas:
- Tada, norėdami apskaičiuoti apatinę ribą, užrašykite šią formulę.
=G4-(1,5*G6)
6 veiksmas:
- Galiausiai, baigę ankstesnį žingsnį, galite nustatyti kiekvienos duomenų vertės nuokrypius. Excel darbalapyje įveskite šią formulę su OR funkcija ląstelėje D5 .
=OR(C5$G$7)
- Ši formulė padės nustatyti duomenis, kurie nepatenka į pirmiau minėtą intervalo ribą. Apdorojus formulę bus parodyta TRUE teiginys jei konkretūs duomenys yra nukrypstantys ir FALSE jei taip nėra. Dukart spustelėkite apie Automatinis pildymas įrankis ląstelėje C5 kopijuoti formulę į likusias langelių C stulpelis . Taigi, prie visų duomenų rinkinyje esančių nukrypimų galite pastebėti reikšmę True.
3. Sujunkite AVERAGE ir STDEV.P funkcijas, kad pagal vidurkį ir standartinį nuokrypį apskaičiuotumėte nukrypimus
A standartinis nuokrypis (arba σ ) - tai metrika, pagal kurią nustatoma, kaip duomenys pasiskirstę visos duomenų aibės vidutinės vertės atžvilgiu. Kai standartinis nuokrypis mažas, duomenys grupuojami aplink vidurkį, o kai standartinis nuokrypis didelis, duomenys yra labiau išsibarstę. Vidutinis ir Standartinis nuokrypis galite atlikti šiuos veiksmus.
1 žingsnis:
- Pirmiausia naudokite tą patį šio straipsnio pradžioje pateiktą duomenų rinkinį ir apskaičiuokite vidurkį bei standartinį nuokrypį. Norėdami apskaičiuoti vidurkį, įveskite šią formulę su funkcija AVERAGE ląstelėje G5 .
= VIDURKIS(C5:C16)
2 žingsnis:
- Norėdami apskaičiuoti standartinį nuokrypį, įterpkite šią formulę su STDEV.P funkcija ląstelėje G6 .
=STDEV.P(C5:C16)
3 veiksmas:
- Toliau apskaičiuosite viršutinę ribą, iki kurios galima toliau tęsti procesą. Ląstelėje G7 , apatinę ribą apskaičiuokite pagal šią formulę.
=G5-(1,25*G6)
4 veiksmas:
- Ir ląstelėje G8 apskaičiuokite viršutinę ribą pagal šią formulę
=G5+(1,5*G6)
5 veiksmas:
- Po to, norėdami apskaičiuoti, ar yra nukrypimų, ar ne, ląstelėje įveskite šią formulę D5 .
=OR(C5$G$8)
- Taigi formulė grąžins TRUE reikšmė, jei tam tikri duomenys norimoje ląstelėje yra nukrypimas ir KLAIDINGA.
- Dukart spustelėkite apie Automatinis pildymas įrankis ląstelėje D5 nukopijuoti formulę į likusias langelių D stulpelis . Taip galite sužinoti visas likusias duomenų rinkinio išskirtines reikšmes.
Skaityti daugiau: Kaip "Excel" programoje rasti nukrypimus naudojant standartinį nuokrypį (greiti žingsniai)
4. Įterpkite Z-skaičių, kad apskaičiuotumėte išskirtines reikšmes "Excel" programoje
Svetainė Z-score yra vienas iš dažniausiai naudojamų rodiklių, skirtų nukrypimams nustatyti. Šis metodas parodo, kiek konkretūs duomenys yra nutolę nuo duomenų aibės vidurkio, atsižvelgiant į jų standartinį nuokrypį. Norint apskaičiuoti nukrypimus naudojant Z-score "Excel" programoje galite matyti toliau aprašytus veiksmus.
1 žingsnis:
- Pirmiausia paimkite norimą duomenų rinkinį.
2 žingsnis:
- Antra, ląstelėje H5, įveskite šią formulę, kad apskaičiuotumėte vidurkis duotiems duomenims.
= VIDURKIS(C5:C16)
3 veiksmas:
- Trečia, apskaičiuokite standartinis nuokrypis duoto duomenų rinkinio ląstelėje H6 pagal šią formulę.
=STDEV.P(C5:C16)
4 veiksmas:
- Po to turite nustatyti Z -score kiekvienai duomenų vertei. Tam naudojama toliau pateikta formulė.
=(C5-$H$5)/$H$6
5 veiksmas:
- Apskaičiavus visus Z vertės, pamatysite, kad Z vertės yra tarp -1.44 ir 13 . Taigi, atsižvelgiame į reikšmes Z-score mažiau kaip -1,2 arba daugiau kaip +1.8 nukrypimų riboms.
- Tada ląstelėje įveskite šią formulę E 5 .
=OR((D51.8))
- Galiausiai formulė grąžins TRUE reikšmė, jei konkretūs duomenys yra nukrypimas, ir bus grąžinta FALSE
- Dukart spustelėkite ląstelėje E5 naudoti Automatinis pildymas įrankio užpildymo rankeną, kad nukopijuotumėte formulę į likusias E stulpelis . Taigi, galite rasti visas likusias duomenų rinkinio išskirtines reikšmes.
Skaityti daugiau: Kaip "Excel" programoje rasti išskirtines reikšmes naudojant Z balą (greiti žingsniai)
5. Sujungti LARGE ir SMALL funkcijas, kad "Excel" rastumėte išskirtines reikšmes
DIDŽIOJI funkcija ir funkcija SMALL Excel programoje atlieka priešingas operacijas. Naudosime jas atitinkamai didžiausiems ir mažiausiems duomenims arba reikšmėms duomenų rinkinyje rasti. Ši funkcija ištrauks visus duomenų rinkinio duomenis, ras mažiausius ir didžiausius skaičius. Jos gali rasti antrąjį mažiausią arba didžiausią, trečiąjį didžiausią arba mažiausią ir taip toliau.
1 žingsnis:
- Pirmiausia ląstelėje naudokite šią formulę E5 su funkcija LARGE .
=LARGE($C$5:$C$16,1)
- Taigi, nuo 12 reikšmes, galite matyti pirmąją didžiausią reikšmę, kuri yra 780 .
2 žingsnis:
- Po to ląstelėje G5 , užrašykite šią formulę, kad rastumėte mažiausią reikšmę.
=SMALL($C$5:$C$16,1)
- Galiausiai, iš 12 reikšmes, galite matyti 1. mažiausia vertė 110 .
- Kai nustatysite visas reikiamas reikšmes, galėsite nesunkiai nurodyti visas duomenų rinkinyje esančias išskirtines reikšmes.
Išvada
Tai yra šio straipsnio pabaiga. Tikiuosi, kad šis straipsnis jums buvo naudingas. Perskaitę šį straipsnį, galėsite apskaičiuoti nuokrypius "Excel" programoje naudodami bet kurį iš metodų. Toliau pateiktame komentarų skyriuje pasidalykite su mumis bet kokiomis papildomomis užklausomis ar rekomendacijomis.