Агуулгын хүснэгт
Өгөгдлийн багцын өгөгдөл дээр статистик тооцоолол хийхийн тулд хэт давсан үзүүлэлтүүдийг тодорхойлох шаардлагатай байж болно. Та Microsoft Excel ашиглан асар том өгөгдлийн багцаас гадуурх утгыг олон янзаар олж мэдэх боломжтой. Энэ нийтлэлд бид Microsoft Excel программ дээр 5 өөр арга ашиглан хэтийн утгыг хэрхэн тооцохыг харуулах болно.
Дадлага хийх ажлын номыг татаж авах
Та Excel програмыг эндээс үнэгүй татаж аваад бие даан дадлага хийх боломжтой. .
Outliers.xlsx
Excel дээр хэт их утгыг тооцоолох 5 хялбар арга
Зөрчлийн үзүүлэлтүүд нь өгөгдлийн утгууд юм. өгөгдлийн багц дахь бусад өгөгдлийн утгуудаас эрс ялгаатай. Өөрөөр хэлбэл хэт давсан үзүүлэлтүүд нь ер бусын үнэт зүйлс юм. Эдгээр нь өгөгдлийн багц дахь бусад утгуудтай харьцуулахад онцгой өндөр эсвэл хэт бага байна. Зөрчлийг олох нь манай өгөгдлийн шинжилгээний үр дүнд нөлөөлдөг тул статистикийн тооцоололд амин чухал юм.
Жишээ нь, танд арван хоёр хүний өдрийн орлогыг харуулсан мэдээллийн багц байна. Одоо та Microsoft Excel-ийг ашиглан хэт их утгыг тооцоолох хэрэгтэй. Энд би танд үүнийг хийхэд хялбар таван аргыг харуулах болно.
1. Sort & Excel дээр хэт их утгыг тооцоолох шүүлтүүр
Та Ангилах & Excel-ийн шүүлтүүр команд. Хэрэв та эрэмбэлэх, шүүх функцийг ашиглан гадуурх утгыг тооцоолохыг хүсвэл дараахыг дагаж хийж болнодоорх алхмууд.
Алхам 1:
- Эхлээд эрэмбэлэхийг хүсэж буй Excel-ийн датасетийн баганын толгой хэсгийг сонгоно уу. Жишээлбэл, өгөгдсөн өгөгдлийн багц дахь файлын баганын толгой хэсэгт Өдрийн орлого ( C40 нүдийг сонгосон).
Алхам 2:
- Дараа нь Нүүр хуудас <7 дээр дарна уу> туузан дээрх таб болон Засварлах бүлэг рүү очно уу.
Алхам 3:
- Үүний дараа Засварлах бүлэгт Ангилах & Filter командыг хийгээд Захиалгат Ангилах дээр дарна уу.
4-р алхам:
- Дараа нь Ангилах нэртэй шинэ харилцах цонх нээгдэнэ. Гарч ирэх харилцах цонхноос Эрэмбэлэх <7 хэсгээс Өдөр тутмын Орлого -г сонго> унадаг цэс ба Багагаас хамгийн том хүртэл гэсэн цэсийг дарааллаар сонгоно. Үүний дараа OK дарна уу.
Алхам 5:
- Эцэст нь Өдрийн орлого баганыг хамгийн бага утгыг дээд талд, хамгийн их утгыг доод талд байрлуулахаар эрэмбэлэх болно. Процедурыг ажиллуулсны дараа хэт утгыг тодорхойлохын тулд өгөгдлийн мужид ямар нэгэн зөрчил байгаа эсэхийг шалгана уу.
Жишээ нь, баганын эхний хоёр утга нь мэдэгдэхүйц бага бөгөөд багана дахь сүүлийн хоёр утга нь өгөгдлийн багц дахь бусад утгуудаас хамаагүй өндөр байнадээрх үр дүн.
Дэлгэрэнгүй унших: Excel-д регрессийн шинжилгээ хийхдээ гадуурх утгыг хэрхэн олох вэ (3 хялбар арга)
2. QUARTILE функцийг ашиглах Excel дээр хэт их утгыг тооцоолох
QUARTILE функц арга нь Excel-д хэт их утгыг тооцоолох илүү шинжлэх ухааны арга юм. Та энэ функцийг ашиглан өгөгдлийн багцаа дөрвөн тэнцүү хэсэгт хувааж болно. Дараах утгуудыг QUARTILE функцээр буцаана:
- хамгийн бага утга.
- 1-р квартил (Q1- өгөгдсөн мэдээллийн багцын хамгийн бага 25%).
- 2-р квартил (2-р улирал-дараагийн). өгөгдлийн багцын хамгийн бага 25%).
- 3-р квартиль (Q3- өгөгдлийн багцын хоёр дахь хамгийн өндөр 25%).
- хамгийн их утга.
Excel дээрх QUARTILE функцийн синтакс нь:
=QUARTILE( массив,кварт)
Синтакс нь дараах аргументуудыг агуулна:
- a rray : өгөгдсөн нүдний муж Квартилийн утгыг тооцоолох өгөгдлийн багц.
- кварт: Энэ нь ямар утгыг буцаахыг зааж өгнө.
Дээрх өгөгдлийн багцын хэт утгыг QUARTILE функцийг ашиглан тооцоолохын тулд доорх алхмуудыг дагана уу.
Алхам 1:
- Эхлээд доор өгөгдсөн 1-р квартилыг ( Q1 ) тодорхойлох дараах томъёог бичнэ үү.
=QUARTILE($C$5:$C$16,1)
Алхам 2:
- Энддахин 3-р квартилыг ( Q3 ) тооцоолох томъёог доор өгөв.
=QUARTILE($C$5:$C$16,3)
Алхам 3:
- Гуравдугаарт, та IQR, -г тодорхойлох ёстой. Квартил хоорондын муж (энэ нь эхний болон гуравдахь квартилуудад хамаарах өгөгдлийн багцын мужаас өгөгдсөн өгөгдлийн 50% -г илэрхийлдэг) Q1 -г хасч ( G4 нүдэнд) Q3 -аас ( G5 нүдэнд). Хасалтыг тооцоолохын тулд дараах томьёог бичнэ үү.
=G5-G4
Алхам 4:
- IQR, -г олсны дараа та дээд болон тодорхойлох хэрэгтэй. доод Учир нь дээд ба доод хязгаар нь доторх ихэнх өгөгдлийг агуулна. өгөгдлийн багц. Дээд хязгаарыг тооцоолохдоо дараах томьёог бичнэ үү.
=G5+(1.5*G6)
5-р алхам:
- Дараа нь доод хязгаарыг тооцоолохын тулд дараах томьёог бичнэ.
=G4-(1.5*G6)
Алхам 6:
- Эцэст нь өмнөх алхмыг дуусгасны дараа та өгөгдөл бүрийн хэтийн утгыг тодорхойлж болно. үнэ цэнэ. Excel-ийн ажлын хуудасны D5 нүдэнд ЭСВЭЛ функц -тай дараах томьёог бичнэ үү.
=OR(C5$G$7)
- Энэ томъёо нь дээр дурдсан хязгаарт багтахгүй өгөгдлийг тодорхойлоход тусална. Боловсруулсны дараатомьёо нь хэрэв тодорхой өгөгдөл нь хэт давчуу бол ҮНЭН мэдэгдэл , үгүй бол ХУДАЛ -г харуулна. C5 нүдний Автоматаар бөглөх хэрэгслээр давхар товшоод томьёог бусад нүд рүү хуулна уу. С баганад. Тиймээс та өөрийн өгөгдлийн багц дахь бүх хазайлтуудын хажууд True утгыг ажиглаж болно.
3. Дундаж ба стандарт хазайлтаас хэтэрсэн утгыг тооцоолохын тулд AVERAGE болон STDEV.P функцуудыг нэгтгэнэ үү
A стандарт хазайлт (эсвэл σ ) нь нийт өгөгдлийн багцын дундаж утгын талаарх өгөгдөл хэрхэн тархаж байгааг тодорхойлох хэмжүүр юм. Өгөгдлийг стандарт хазайлт бага үед дундаж утгаараа бүлэглэдэг бол стандарт хазайлт өндөр үед өгөгдөл илүү тархдаг. Дундж болон Стандарт хазайлт -г ашиглан хэтийн утгыг тооцоолохын тулд та дараах алхмуудыг хийж болно.
Алхам 1:
- Эхлээд энэ өгүүллийн эхэнд үзүүлсэн өгөгдлийн багцыг ашиглаад дараа нь дундаж болон стандарт хазайлтыг тооцоол. Дундаж утгыг тооцоолохын тулд G5 нүдэнд ДУНДЖ функц бүхий дараах томьёог бичнэ үү.
=AVERAGE(C5:C16)
Алхам 2:
- Стандарт хазайлтыг тооцоолохын тулд STDEV-тэй дараах томьёог оруулна уу. G6 нүдэнд .P функц .
=STDEV.P(C5:C16)
3-р алхам:
- Дараа нь та тооцоолноүйл явцыг цаашид ахиулах дээд хязгаар. G7 нүдэнд доорх томьёог ашиглан доод хязгаарыг тооцоол.
=G5-(1.25*G6)
4-р алхам:
- Мөн G8 нүдэнд дээд хязгаарыг дараах томьёогоор тооцоол
=G5+(1.5*G6)
5-р алхам:
- Үүний дараа , ямар нэгэн давсан үзүүлэлт байгаа эсэхийг тооцоолохын тулд D5 нүдэнд дараах томьёог бичнэ үү.
=OR(C5$G$8)
- Тиймээс, хэрэв хүссэн нүдэн дэх тодорхой өгөгдөл нь хэт давчуу, байвал томъёо нь ҮНЭН утгыг буцаана. ХУДАЛ.
- D5 <7 нүдний Автоматаар дүүргэх хэрэгсэл дээр давхар товшино уу >томьёог D баганын үлдсэн нүднүүдэд хуулах. Ингэснээр та өөрийн өгөгдлийн багц дахь үлдэгдэл бүх үлдэгдлийг олж мэдэх боломжтой.
Дэлгэрэнгүй унших: Excel дээр стандарт хазайлттай хэтийн утгыг хэрхэн олох вэ (хурдан алхмуудын тусламжтайгаар)
4. Excel-д хэт их утгыг тооцоолохын тулд Z-оноо оруулах
Z-оноо нь хамгийн их ашиглагддаг хэмжүүрүүдийн нэг юм. хэт давсан үзүүлэлтүүдийг тодорхойлох. Энэ арга нь тодорхой өгөгдөл нь стандарт хазайлттай харьцуулахад өгөгдлийн багцын дунджаас хэр хол байгааг харуулдаг. Excel дээр Z-оноо ашиглан хэт давсан үзүүлэлтийг тооцоолохын тулд та доор тайлбарласан алхмуудыг харж болно.
Алхам 1:
- Эхлээд хүссэн дата багцаа аваарай.
Алхам2:
- Хоёрдугаарт, H5 нүдэнд дундаж <-г тооцоолох дараах томьёог бичнэ үү. 7>өгөгдлийн хувьд.
=AVERAGE(C5:C16)
3-р алхам:
- Гуравдугаарт, дараах томьёог ашиглан H6 нүдэнд өгөгдсөн өгөгдлийн багцын стандарт хазайлтыг тооцоол.
=STDEV.P(C5:C16)
4-р алхам:
- Үүний дараа , та өгөгдлийн утга бүрийн Z оноо -г тодорхойлох хэрэгтэй. Үүнийг хийхийн тулд та доорх томьёог ашиглана уу.
=(C5-$H$5)/$H$6
5-р алхам:
- Бүх Z-утгууд -ийг тооцоолсны дараа Z-утгын хүрээ байгааг харах болно> нь -1.44 ба 13 хооронд байна. Тиймээс бид хэт давсан хязгаарын хувьд Z-оноо -1.2-оос бага эсвэл +1.8 -ээс их утгыг авч үзнэ.
- Дараа нь E 5 нүдэнд дараах томьёог бичнэ үү.
=OR((D51.8))
- Эцэст нь томьёо нь тодорхой өгөгдөл нь хэт давсан үзүүлэлт бол ҮНЭН утгыг буцаана ХУДАЛ
- E5 нүдэн дээр давхар товшино уу Автоматаар бөглөх Е баганын бусад нүднүүдэд томьёог хуулах хэрэгслээр дүүргэх бариул. Тиймээс та өгөгдлийн олонлогоос үлдэгдэл бүх утгыг олох боломжтой.
Дэлгэрэнгүй унших: Excel дээр Z оноог ашиглан хэрхэн хэт давчуу утгыг олох вэ (Шуурхай програмтай).Алхамууд)
5. ТОМ ба ЖИЖИГ функцуудыг нэгтгэж Excel-ийн хэтийн утгыг олох
Excel дээрх ТОМ функц ба ЖИЖИГ функц эсрэг үйлдэлтэй. Бид үүнийг өгөгдлийн багц дахь хамгийн том, хамгийн бага өгөгдөл эсвэл утгыг олоход ашиглах болно. Энэ функц нь өгөгдлийн багц доторх бүх өгөгдлийг татаж, хамгийн бага, хамгийн том тоог олох болно. Тэд хоёр дахь хамгийн жижиг эсвэл хамгийн том, гурав дахь том эсвэл хамгийн жижиг гэх мэтийг олох боломжтой.
Алхам 1:
- Эхлээд E5 нүдэнд ТОМ функцтэй дараах томьёог ашиглана.
=LARGE($C$5:$C$16,1)
-
- Тиймээс 12 утгаас та <6 гэсэн 1-р хамгийн том утгыг харж болно> 780 .
Алхам 2:
- Үүний дараа G5 нүдэнд хамгийн бага утгыг олохын тулд дараах томьёог бичнэ үү.
=SMALL($C$5:$C$16,1)
- Эцэст нь 12 утгаас та 1-ийг харж болно. хамгийн бага утга 110 .
- Та шаардлагатай бүх утгыг олж мэдсэнийхээ дараа өгөгдлийн багц дахь аливаа хэт утгыг хялбархан зааж өгч болно.
Дүгнэлт
Ингээд энэ нийтлэл дуусч байна. Энэ нийтлэл танд хэрэг болно гэж найдаж байна. Энэ нийтлэлийг уншсаны дараа та Excel-ийн аль нэг аргыг ашиглан хэтийн утгыг тооцоолох боломжтой болно. Бусад асуулт, зөвлөмжийг бусадтай хуваалцана уубиднийг доорх сэтгэгдлийн хэсэгт бичнэ үү.