Բովանդակություն
Տվյալների հավաքածուի տվյալների վրա վիճակագրական հաշվարկներ կատարելու համար հնարավոր է, որ անհրաժեշտ լինի պարզել արտանետումները: Microsoft Excel-ի միջոցով դուք կարող եք հայտնաբերել արտանետումներ հսկայական տվյալների հավաքածուներից բազմաթիվ ձևերով: Այս գրառման մեջ մենք ձեզ ցույց կտանք, թե ինչպես կարելի է հաշվարկել Outliers-ը Microsoft Excel-ում՝ օգտագործելով հինգ տարբեր եղանակներ:
Ներբեռնեք Practice Workbook
Դուք կարող եք ներբեռնել Excel-ի անվճար աշխատանքային գիրքն այստեղից և ինքնուրույն զբաղվել: .
Գտեք Outliers.xlsx
5 հարմար մոտեցում Excel-ում ծայրամասերը հաշվարկելու համար
Outliers տվյալների արժեքներ են որոնք զգալիորեն տարբերվում են տվյալների հավաքածուի մնացած տվյալների արժեքներից: Այլ կերպ ասած, արտասովոր արժեքներ են: Դրանք կամ բացառիկ բարձր են կամ չափազանց ցածր համեմատած տվյալների հավաքածուի այլ արժեքների հետ: Առաջնորդների գտնելը կենսական նշանակություն ունի վիճակագրական հաշվարկներում, քանի որ դրանք ազդում են մեր տվյալների վերլուծության արդյունքների վրա:
Օրինակ, դուք ունեք տվյալների հավաքածու, որը ցույց է տալիս տասներկու հոգու օրական եկամուտը: Այժմ դուք պետք է հաշվարկեք ծայրամասերը՝ օգտագործելով Microsoft Excel-ը: Այստեղ ես ձեզ ցույց կտամ դա անելու հինգ հեշտ մոտեցում:
1. Օգտագործեք Տեսակավորում & Զտել՝ Excel-ում ծայրամասերը հաշվարկելու համար
Դուք կարող եք հաշվարկել ծայրամասերը փոքր տվյալների հավաքածուից՝ օգտագործելով Sort & Filter հրամանը Excel-ում: Եթե ցանկանում եք հաշվարկել ծայրամասերը՝ օգտագործելով տեսակավորման և զտման գործառույթը, կարող եք դա անել՝ հետևելով հետևյալինքայլերը ստորև:
Քայլ 1.
- Սկզբում ընտրեք սյունակի վերնագիրը ձեր Excel-ի տվյալների բազայում, որը ցանկանում եք տեսակավորել: Օրինակ՝ տվյալ տվյալների հավաքածուում ֆայլի սյունակի վերնագրում Օրական եկամուտ (ընտրված է C40 բջջը):
Քայլ 2.
- Այնուհետև սեղմեք Տուն ներդիր ժապավենի վրա և անցեք Խմբագրման խմբին:
Քայլ 3.
- Դրանից հետո Խմբագրման խմբում սեղմեք Տեսակավորել & Զտել հրամանը և սեղմել Պատվերով Տեսակավորել ։
Քայլ 4.
- Այնուհետև կբացվի նոր երկխոսության տուփ Sort անունով: Բացվող երկխոսության վանդակում ընտրեք Օրական Եկամուտ Տեսակավորել ըստ բացվող և Ամենափոքրից ամենամեծը Պատվերի բացվող ցանկում: Դրանից հետո սեղմեք OK :
Քայլ 5.
- Վերջապես, Օրական եկամուտ սյունակը կդասավորվի նշված եղանակով, ամենացածր արժեքները վերևում և ամենամեծ արժեքները ներքևում: Ընթացակարգն իրականացնելուց հետո փնտրեք տվյալների տիրույթում ցանկացած անկանոնություն, որպեսզի որոշեք ծայրամասերը:
Օրինակ, սյունակի առաջին երկու արժեքները զգալիորեն ցածր են, և Սյունակի վերջին երկու արժեքները զգալիորեն ավելի բարձր են, քան տվյալների հավաքածուի մնացած արժեքները, ինչպես ցույց է տրվածվերը նշված արդյունքը:
Կարդալ ավելին. Ինչպես գտնել Outliers in Regression Analysis in Excel-ում (3 հեշտ եղանակ)
2. Կիրառել QUARTILE ֆունկցիան Հաշվարկել Outliers-ը Excel-ում
QUARTILE ֆունկցիան մոտեցումը Excel-ում ծայրամասերը հաշվարկելու ավելի գիտական միջոց է: Դուք կարող եք օգտագործել այս գործառույթը՝ ձեր տվյալների հավաքածուները չորս հավասար մասերի բաժանելու համար: Հետևյալ արժեքները կվերադարձվեն QUARTILE ֆունկցիան .
- նվազագույն արժեքը։
- 6> 1-ին քառորդը (Q1 - տվյալ տվյալների բազայի ամենացածր 25%-ը):
- 2-րդ քառորդը (Q2-հաջորդը տվյալների շտեմարանի ամենացածր 25%-ը):
- 3-րդ քառորդիլը (3-րդ եռամսյակը՝ տվյալների հավաքածուի երկրորդ ամենաբարձր 25%-ը):
- առավելագույն արժեքը:
Excel-ում QUARTILE ֆունկցիայի շարահյուսությունը հետևյալն է.
=QUARTILE( զանգված, քառակուսի)
Շարահյուսությունը պարունակում է հետևյալ արգումենտները.
- a ray . տվյալի բջիջների տիրույթը տվյալների հավաքածու, որի համար դուք կհաշվարկեք քառորդային արժեքը:
- քառորդ` Սա նշում է, թե որ արժեքը պետք է վերադարձվի:
Վերոնշյալ տվյալների շտեմարանի ծայրամասերը հաշվարկելու համար QUARTILE ֆունկցիան օգտագործելով, հետևեք ստորև նշված քայլերին:
Քայլ 1.
- Սկզբում մուտքագրեք ստորև բերված 1-ին քառատիլը ( Q1 ) որոշելու հետևյալ բանաձևը:
=QUARTILE($C$5:$C$16,1)
Քայլ 2.
- Ահակրկին, 3-րդ քառորդը ( Q3 ) հաշվարկելու բանաձևը տրված է ստորև։
=QUARTILE($C$5:$C$16,3)
Քայլ 3.
- Երրորդ, դուք պետք է որոշեք IQR, որը Միջքառորդական միջակայքը (այն ներկայացնում է տրված տվյալների 50% տվյալների մի շարք տվյալների շարքից, որոնք մտնում են առաջին և երրորդ քառորդների մեջ) հանելով Q1 ( G4 բջիջում) Q3 -ից ( G5 բջիջում): Մուտքագրեք հետևյալ բանաձևը՝ հանումը հաշվելու համար. 0> Քայլ 4.
- IQR-ն գտնելուց հետո, հաջորդում դուք պետք է որոշեք վերին և ստորին Քանի որ վերին և ստորին սահմանը պարունակում է տվյալների մեծ մասը տվյալների հավաքածուն։ Վերին սահմանը հաշվելու համար գրե՛ք հետևյալ բանաձևը>
Քայլ 5.
- Այնուհետև ստորին սահմանը հաշվարկելու համար գրեք հետևյալ բանաձևը.
=G4-(1.5*G6)
Քայլ 6.
- Վերջապես, նախորդ քայլն ավարտելուց հետո դուք կարող եք որոշել յուրաքանչյուր տվյալների համար ծայրամասերը արժեքը։ Excel-ի աշխատաթերթում մուտքագրեք հետևյալ բանաձևը OR ֆունկցիան բջիջում D5 ։
=OR(C5$G$7)
- Այս բանաձևը կօգնի բացահայտել այն տվյալները, որոնք չեն գտնվում վերը նշված տիրույթի սահմաններում: Մշակելուց հետոբանաձևը ցույց կտա ՃԻՇՏ հայտարարություն , եթե կոնկրետ տվյալներն արտաքուստ են, և FALSE եթե ոչ: Կրկնակի սեղմեք AutoFill գործիքի վրա C5 բջիջում` բանաձեւը մնացած բջիջներում պատճենելու համար: C սյունակում: Այսպիսով, դուք կարող եք դիտարկել True արժեքը ձեր տվյալների բազայի բոլոր ծայրամասերի կողքին:
3. Միավորել AVERAGE և STDEV.P ֆունկցիաները միջինից և ստանդարտ շեղումից ելակետերը հաշվարկելու համար
A ստանդարտ շեղումը (կամ σ ) չափիչ է` որոշելու, թե ինչպես են բաշխված տվյալները` կապված ամբողջ տվյալների հավաքածուի միջին արժեքի հետ: Տվյալները խմբավորվում են միջինի շուրջ, երբ ստանդարտ շեղումը ցածր է, մինչդեռ տվյալները ավելի տարածված են, երբ ստանդարտ շեղումը բարձր է: Եզրակացությունները հաշվարկելու համար միջին և Ստանդարտ շեղումը կարող եք հետևել հետևյալ քայլերին:
Քայլ 1.
- Սկզբում օգտագործեք այս հոդվածի սկզբում ցուցադրված նույն տվյալների բազան, այնուհետև հաշվարկեք միջին և ստանդարտ շեղումը: Միջինը հաշվարկելու համար մուտքագրեք հետևյալ բանաձևը ՄԻՋԻՆ ֆունկցիան G5 բջիջում։
=AVERAGE(C5:C16)
Քայլ 2.
- Ստանդարտ շեղումը հաշվարկելու համար տեղադրեք հետևյալ բանաձևը STDEV-ով .P ֆունկցիան բջիջում G6 ։
=STDEV.P(C5:C16)
Քայլ 3.
- Այնուհետև դուք կհաշվարկեքվերին սահմանը գործընթացի հետագա առաջխաղացման համար: G7 բջիջում հաշվարկեք ստորին սահմանը՝ օգտագործելով հետևյալ բանաձևը.
=G5-(1.25*G6)
Քայլ 4.
- Եվ G8 բջջում հաշվարկեք վերին սահմանը հետևյալ բանաձևից
=G5+(1.5*G6)
Քայլ 5.
- Դրանից հետո , հաշվարկելու համար, թե արդյոք կան որևէ ծայրաստիճան, թե ոչ, մուտքագրեք հետևյալ բանաձևը D5 բջիջում։
=OR(C5$G$8)
- Այսպիսով, բանաձևը կվերադարձնի ՃԻՇՏ արժեքը, եթե ցանկալի բջիջում հատուկ տվյալներն արտաքուստ են և FALSE:
- Կրկնակի սեղմեք Autofill գործիքի վրա D5 <7 բջիջում>բանաձևը D սյունակի մնացած բջիջներում պատճենելու համար: Այսպիսով, դուք կարող եք պարզել ձեր տվյալների շտեմարանում մնացած բոլոր ծայրամասերը:
Կարդալ ավելին. Ինչպես գտնել ստանդարտ շեղումներ Excel-ում (Արագ քայլերով)
4. Տեղադրեք Z-Score-ը Excel-ում ծայրամասերը հաշվարկելու համար
Z-score -ը ամենահաճախ օգտագործվող չափիչներից մեկն է արտանետումների բացահայտում: Այս մեթոդը ցույց է տալիս, թե ինչքան հեռու է տվյալ տվյալը տվյալների բազայի միջինից՝ կապված դրա ստանդարտ շեղման հետ: Excel-ում Z-score -ի օգնությամբ հաշվարկելու համար դուք կարող եք տեսնել ստորև նկարագրված քայլերը:
Քայլ 1.
- Սկզբում վերցրեք ցանկալի տվյալների հավաքածուն:
Քայլ2:
- Երկրորդը, H5 բջիջում, գրեք հետևյալ բանաձևը միջինը տվյալ տվյալների համար:
=AVERAGE(C5:C16)
Քայլ 3.
- Երրորդ, հաշվարկեք ստանդարտ շեղումը H6 բջիջի տվյալ տվյալների բազայի ստանդարտ շեղումը ` օգտագործելով հետևյալ բանաձևը:
=STDEV.P(C5:C16)
Քայլ 4.
- Դրանից հետո , դուք պետք է որոշեք Z -սկորը յուրաքանչյուր տվյալների արժեքի համար: Դա անելու համար դուք օգտագործում եք ստորև տրված բանաձևը:
=(C5-$H$5)/$H$6
Քայլ 5.
- Բոլոր Z արժեքները հաշվարկելուց հետո կտեսնեք, որ Z արժեքների միջակայքը գտնվում է -1,44 և 13 միջև: Այսպիսով, մենք համարում ենք Z գնահատականի արժեքները -1,2-ից պակաս կամ +1,8 -ից ավելի արտաքին սահմանների համար:
- Այնուհետև մուտքագրեք հետևյալ բանաձևը E 5 բջիջում:
=OR((D51.8))
- Վերջապես, բանաձևը կվերադարձնի TRUE արժեքը, եթե կոնկրետ տվյալները արտաքինից դուրս են և կվերադարձնեն FALSE
- Կրկնակի սեղմեք E5 բջջի վրա Ավտոլրացումն օգտագործելու համար գործիքների լրացման բռնակ` բանաձեւը E սյունակի մնացած բջիջներում պատճենելու համար: Այսպիսով, դուք կարող եք գտնել ձեր տվյալների շտեմարանում մնացած բոլոր արտանետումները:
Կարդալ ավելին.Քայլեր)
5. Միավորել LARGE և SMALL ֆունկցիաները Excel-ում ծայրամասեր գտնելու համար
LARGE ֆունկցիան և ՓՈՔՐ ֆունկցիան Excel-ում ունեն հակադիր գործողություններ. Մենք կօգտագործենք այն տվյալների հավաքածուի մեջ համապատասխանաբար ամենամեծ և ամենափոքր տվյալները կամ արժեքները գտնելու համար: Այս ֆունկցիան կբերի բոլոր տվյալները տվյալների հավաքածուի մեջ՝ գտնելով ամենափոքր և ամենամեծ թվերը: Նրանք կարողանում են գտնել երկրորդ ամենափոքրը կամ ամենամեծը, երրորդը կամ ամենափոքրը և այլն:
Քայլ 1.
- Սկզբում օգտագործեք հետևյալ բանաձևը E5 բջջում LARGE ֆունկցիայի հետ ։
=LARGE($C$5:$C$16,1)
-
- Այսպիսով, 12 արժեքներից կարող եք տեսնել 1-ին ամենամեծ արժեքը, որը <6 է։> 780 .
Քայլ 2.
- Դրանից հետո G5 բջիջում գրեք հետևյալ բանաձևը` ամենափոքր արժեքը գտնելու համար:
=SMALL($C$5:$C$16,1)
- Վերջապես, 12 արժեքներից կարող եք տեսնել 1-ին ամենափոքր արժեքը 110 ։
- Հենց որ պարզեք բոլոր պահանջվող արժեքները, այնուհետև կարող եք հեշտությամբ մատնանշել տվյալների շտեմարանում առկա ցանկացած այլ արժեք։
Եզրակացություն
Սա այս հոդվածի վերջն է: Հուսով եմ, որ այս հոդվածը օգտակար է ձեզ համար: Այս հոդվածը կարդալուց հետո դուք կկարողանաք հաշվարկել ծայրամասերը Excel-ում՝ օգտագործելով մեթոդներից որևէ մեկը: Խնդրում ենք կիսվել ցանկացած լրացուցիչ հարցումներով կամ առաջարկություններովմեզ ներքևում գտնվող մեկնաբանությունների բաժնում:
- IQR-ն գտնելուց հետո, հաջորդում դուք պետք է որոշեք վերին և ստորին Քանի որ վերին և ստորին սահմանը պարունակում է տվյալների մեծ մասը տվյալների հավաքածուն։ Վերին սահմանը հաշվելու համար գրե՛ք հետևյալ բանաձևը>