Paano Kalkulahin ang Mga Outlier sa Excel (5 Madaling Paraan)

  • Ibahagi Ito
Hugh West

Maaaring kailangang tukuyin ang mga outlier upang magawa ang mga istatistikal na pagkalkula sa data mula sa isang set ng data. Maaari kang tumuklas ng mga outlier mula sa malalaking dataset gamit ang Microsoft Excel sa maraming paraan. Sa post na ito, ipapakita namin sa iyo kung paano kalkulahin ang mga outlier sa Microsoft Excel gamit ang limang natatanging paraan.

I-download ang Practice Workbook

Maaari mong i-download ang libreng Excel workbook mula dito at magsanay nang mag-isa .

Hanapin ang Mga Outlier.xlsx

5 Mga Magagamit na Diskarte sa Pagkalkula ng Mga Outlier sa Excel

Ang mga Outlier ay mga halaga ng data na makabuluhang naiiba sa iba pang mga halaga ng data sa dataset. Ang mga outlier, sa madaling salita, ay hindi pangkaraniwang mga halaga. Ang mga ito ay maaaring pambihirang mataas o labis na mababa kumpara sa iba pang mga halaga sa isang set ng data. Ang paghahanap ng mga outlier ay mahalaga sa istatistikal na pagkalkula dahil may epekto ang mga ito sa mga natuklasan ng aming pagsusuri ng data.

Halimbawa, mayroon kang set ng data na nagpapakita ng pang-araw-araw na kita ng labindalawang tao. Ngayon, kailangan mong kalkulahin ang mga outlier gamit ang Microsoft Excel. Dito, ipapakita ko sa iyo ang limang madaling paraan para magawa ito.

1. Gamitin ang Pagbukud-bukurin & I-filter para Kalkulahin ang Mga Outlier sa Excel

Maaari mong kalkulahin ang mga outlier mula sa isang maliit na set ng data sa pamamagitan ng paggamit ng Pagbukud-bukurin & Filter command sa Excel. Kung gusto mong kalkulahin ang mga outlier gamit ang pag-uuri at filter na function, magagawa mo ito sa pamamagitan ng pagsunod sahakbang sa ibaba.

Hakbang 1:

  • Una, piliin ang header ng column sa iyong dataset ng excel na gusto mong ayusin. Halimbawa, sa ibinigay na set ng data, sa header ng column ng file na pinangalanang Pang-araw-araw na Kita (Cell C40 ay pinili).

Hakbang 2:

  • Pagkatapos, pindutin ang Home tab sa ribbon at pumunta sa Pag-edit grupo.

Hakbang 3:

  • Pagkatapos nito, sa Pangkat sa pag-edit i-click ang Pagbukud-bukurin & I-filter ang command at i-click ang Custom Pag-uri-uriin .

Hakbang 4:

  • Pagkatapos, magbubukas ang isang bagong dialog box na pinangalanang Pagbukud-bukurin . Sa pop-up na dialog box, piliin ang Araw-araw Kita sa Pagbukud-bukurin ayon sa drop-down at Pinakamaliit hanggang Pinakamalaki sa drop-down na Order. Pagkatapos nito, i-click ang OK .

Hakbang 5:

  • Sa wakas, ang column na Pang-araw-araw na Kita ay pagbubukud-bukod sa paraang nakasaad, na may pinakamababang halaga sa itaas at pinakamaraming halaga sa ibaba. Pagkatapos patakbuhin ang pamamaraan, hanapin ang anumang mga iregularidad sa hanay ng data upang matukoy ang mga outlier.

Halimbawa, ang unang dalawang value sa column ay makabuluhang mas mababa at ang ang huling dalawang value sa column ay higit na mataas kaysa sa iba pang value sa set ng data, tulad ng ipinapakita saresulta sa itaas.

Magbasa Nang Higit Pa: Paano Maghanap ng Mga Outlier sa Pagsusuri ng Pagbabalik sa Excel (3 Madaling Paraan)

2. Ilapat ang QUARTILE Function sa Kalkulahin ang Mga Outlier sa Excel

Ang QUARTILE function na diskarte ay isang mas siyentipikong paraan upang makalkula ang mga outlier sa Excel. Maaari mong gamitin ang function na ito upang hatiin ang iyong mga set ng data sa apat na pantay na bahagi. Ang mga sumusunod na value ay ibabalik ng QUARTILE function :

  • Ang minimum value.
  • Ang 1st quartile (Q1- pinakamababang 25% ng ibinigay na dataset).
  • Ang 2nd quartile (Q2-next pinakamababang 25% ng dataset).
  • Ang 3rd quartile (Q3- pangalawang pinakamataas na 25% ng dataset).
  • Ang maximum value.

Ang syntax ng QUARTILE function sa Excel ay:

=QUARTILE( array,quart)

Ang syntax ay naglalaman ng mga sumusunod na argumento:

  • a rray : ang cell range ng isang ibinigay set ng data kung saan mo kakalkulahin ang quartile value.
  • quart: Tinutukoy nito kung aling value ang dapat ibalik.

Para sa pagkalkula ng mga outlier para sa dataset sa itaas gamit ang ang QUARTILE function, sundin ang mga hakbang sa ibaba.

Hakbang 1:

  • Una, i-type ang sumusunod na formula para sa pagtukoy ng 1st quartile ( Q1 ) ay ibinigay sa ibaba.
=QUARTILE($C$5:$C$16,1)

Hakbang 2:

  • Ditomuli, ang formula para kalkulahin ang 3rd quartile ( Q3 ) ay ibinigay sa ibaba.
=QUARTILE($C$5:$C$16,3)

Hakbang 3:

  • Pangatlo, kailangan mong tukuyin ang IQR, na ang Inter-Quartile Range (kinakatawan nito ang 50% ng ibinigay na data mula sa hanay ng data set na nasa una at ikatlong quartile) sa pamamagitan ng pagbabawas ng Q1 (sa cell G4 ) mula sa Q3 (sa cell G5 ). I-type ang sumusunod na formula para kalkulahin ang pagbabawas.

    =G5-G4

Hakbang 4:

  • Pagkatapos mahanap ang IQR, susunod na kailangan mong tukuyin ang itaas at ibaba Dahil ang itaas na at ibabang limitasyon ay maglalaman ng karamihan ng data sa loob ang data set. Isulat ang sumusunod na formula para kalkulahin ang pinakamataas na limitasyon.

    =G5+(1.5*G6)

Hakbang 5:

  • Pagkatapos, upang kalkulahin ang mas mababang limitasyon, isulat ang sumusunod na formula.
=G4-(1.5*G6)

Hakbang 6:

  • Sa wakas, pagkatapos tapusin ang nakaraang hakbang, matutukoy mo ang mga outlier para sa bawat data halaga. Sa excel worksheet, i-type ang sumusunod na formula na may ang OR function sa cell D5 .
=OR(C5$G$7)

  • Tumutulong ang formula na ito upang matukoy ang data na hindi pasok sa nabanggit na limitasyon sa hanay. Matapos iproseso angAng formula ay magpapakita ng TRUE Statement kung ang partikular na data ay outlier at FALSE kung hindi. I-double click sa AutoFill tool sa cell C5 para kopyahin ang formula sa iba pang mga cell sa column C . Kaya, maaari mong obserbahan ang isang True value sa tabi ng lahat ng outlier sa iyong dataset.

3. Pagsamahin ang AVERAGE at STDEV.P Function para Kalkulahin ang mga Outlier mula sa Mean at Standard Deviation

A Ang standard deviation (o σ ) ay isang sukatan para sa pagtukoy kung paano ibinahagi ang data patungkol sa mean value ng buong set ng data. Nakapangkat ang data sa paligid ng mean kapag mababa ang standard deviation, habang mas lumalaganap ang data kapag mataas ang standard deviation. Upang kalkulahin ang mga outlier gamit ang Mean at Standard Deviation maaari mong sundin ang mga sumusunod na hakbang.

Hakbang 1:

  • Una, gamitin ang parehong dataset na ipinapakita sa simula ng artikulong ito at pagkatapos ay kalkulahin ang mean at standard deviation. Upang kalkulahin ang mean, i-type ang sumusunod na formula na may ang AVERAGE function sa cell G5 .
=AVERAGE(C5:C16)

Hakbang 2:

  • Upang kalkulahin ang standard deviation, ipasok ang sumusunod na formula na may ang STDEV .P function sa cell G6 .
=STDEV.P(C5:C16)

Hakbang 3:

  • Susunod, kakalkulahin mo angitaas na limitasyon para sa karagdagang pagsulong sa proseso. Sa cell G7 , kalkulahin ang mas mababang limitasyon sa pamamagitan ng paggamit ng sumusunod na formula.
=G5-(1.25*G6)

Hakbang 4:

  • At sa cell G8 kalkulahin ang pinakamataas na limitasyon mula sa sumusunod na formula
=G5+(1.5*G6)

Hakbang 5:

  • Pagkatapos noon , upang kalkulahin kung mayroong anumang outlier o wala, i-type ang sumusunod na formula sa cell D5 .
=OR(C5$G$8)

  • Kaya, magbabalik ang formula ng TRUE value kung ang partikular na data sa gustong cell ay outlier at FALSE.
  • I-double click sa tool na AutoFill sa cell D5 upang kopyahin ang formula sa iba pang mga cell sa column D . Kaya, malalaman mo ang lahat ng natitirang outlier sa iyong dataset.

Magbasa Nang Higit Pa: Paano Maghanap ng Mga Outlier na may Standard Deviation sa Excel (na may Mabilis na Mga Hakbang)

4. Ipasok ang Z-Score upang Kalkulahin ang Mga Outlier sa Excel

Ang Z-score ay isa sa mga pinakamadalas na ginagamit na sukatan para sa pagkilala sa mga outlier. Ipinapakita ng paraang ito kung gaano kalayo ang isang partikular na data sa mean ng isang dataset kaugnay ng standard deviation nito. Upang kalkulahin ang mga outlier gamit ang Z-score sa Excel, makikita mo ang mga hakbang na inilalarawan sa ibaba.

Hakbang 1:

  • Una, kunin ang gustong set ng data.

Hakbang2:

  • Pangalawa, sa cell H5, i-type ang sumusunod na formula para sa pagkalkula ng mean para sa ibinigay na data.
=AVERAGE(C5:C16)

Hakbang 3:

  • Pangatlo, kalkulahin ang standard deviation ng ibinigay na dataset sa cell H6 sa pamamagitan ng paggamit ng sumusunod na formula.
=STDEV.P(C5:C16)

Hakbang 4:

  • Pagkatapos noon , kailangan mong tukuyin ang Z -score para sa bawat value ng data. Upang gawin ito, ginagamit mo ang formula na ibinigay sa ibaba.
=(C5-$H$5)/$H$6

Hakbang 5:

  • Pagkatapos kalkulahin ang lahat ng Z-values, makikita mo na ang range ng Z-values ay nasa pagitan ng -1.44 at 13 . Kaya, isinasaalang-alang namin ang mga value ng Z-score na mas mababa sa -1.2 o higit pa sa +1.8 para sa mga outlier na limitasyon.
  • Pagkatapos, i-type ang sumusunod na formula sa cell E 5 .
=OR((D51.8))

  • Sa wakas, magbabalik ang formula ng TRUE value kung outlier ang partikular na data at magbabalik ng FALSE
  • I-double click sa cell E5 upang gamitin ang AutoFill tool fill handle para kopyahin ang formula sa iba pang mga cell sa column E . Kaya, mahahanap mo ang lahat ng natitirang outlier sa iyong dataset.

Magbasa Nang Higit Pa: Paano Maghanap ng Mga Outlier Gamit ang Z Score sa Excel (na may Mabilis naMga Hakbang)

5. Pagsamahin ang MALAKI at MALIIT na Function para Maghanap ng Mga Outlier sa Excel

Ang LARGE function at ang SMALL function sa Excel magkaroon ng kabaligtaran na mga operasyon. Gagamitin namin ito upang mahanap ang pinakamalaki at pinakamaliit na data o mga halaga sa isang set ng data, ayon sa pagkakabanggit. Hilahin ng function na ito ang lahat ng data sa loob ng isang set ng data, hahanapin ang pinakamaliit at pinakamalaking numero. Nagagawa nilang mahanap ang pangalawa sa pinakamaliit o pinakamalaki, ang pangatlo sa pinakamalaki o pinakamaliit, at iba pa.

Hakbang 1:

  • Una, gamitin ang sumusunod na formula sa cell E5 na may ang LARGE function .
=LARGE($C$5:$C$16,1)

    • Kaya, mula sa 12 mga value, makikita mo ang 1st pinakamalaking value na 780 .

Hakbang 2:

  • Pagkatapos nito, sa cell G5 , isulat ang sumusunod na formula upang mahanap ang pinakamaliit na value.
=SMALL($C$5:$C$16,1)

  • Sa wakas, mula sa 12 mga value, makikita mo ang 1st pinakamaliit na value 110 .
  • Kapag nalaman mo na ang lahat ng kinakailangang value, madali mong matutukoy ang anumang outlier sa dataset.

Konklusyon

Iyan na ang katapusan ng artikulong ito. Umaasa ako na nakatulong sa iyo ang artikulong ito. Pagkatapos basahin ang artikulong ito, magagawa mong kalkulahin ang mga outlier sa Excel gamit ang alinman sa mga pamamaraan. Mangyaring ibahagi ang anumang karagdagang mga query o rekomendasyon sakami sa comments section sa ibaba.

Si Hugh West ay isang napakaraming Excel trainer at analyst na may higit sa 10 taong karanasan sa industriya. May hawak siyang Bachelor's degree sa Accounting and Finance at Master's degree sa Business Administration. Si Hugh ay may hilig sa pagtuturo at nakabuo ng kakaibang diskarte sa pagtuturo na madaling sundin at maunawaan. Ang kanyang dalubhasang kaalaman sa Excel ay nakatulong sa libu-libong mag-aaral at propesyonal sa buong mundo na mapabuti ang kanilang mga kasanayan at maging mahusay sa kanilang mga karera. Sa pamamagitan ng kanyang blog, ibinahagi ni Hugh ang kanyang kaalaman sa mundo, nag-aalok ng mga libreng Excel tutorial at online na pagsasanay upang matulungan ang mga indibidwal at negosyo na maabot ang kanilang buong potensyal.