Ինչպես հեռացնել Outliers Excel-ում (3 եղանակ)

  • Կիսվել Սա
Hugh West

Անցած գծեր գտնելը և դրանք հեռացնելը շատ տարածված խնդիր է վիճակագրության, տվյալների արդյունահանման, մեքենայական ուսուցման և այլնի տվյալների վերլուծության համար: Կան շատ եղանակներ, որոնցով դուք կարող եք գտնել ծայրամասեր ձեր տվյալների բազայում, բայց դրանք հեռացնելու գործընթացն այնքան էլ հեշտ չէ: գտնել. Այս հոդվածում մենք ձեզ ցույց կտանք, թե ինչպես կարելի է հեռացնել Excel-ում արտանետումները :

Ներբեռնել աշխատանքային գիրքը

Դուք կարող եք ներբեռնել անվճար պրակտիկայի Excel աշխատանքային գիրքը այստեղից: այստեղ:

Հեռացնել Outliers.xlsx

Ի՞նչ է Outliers-ը Excel-ում:

A Outlier արժեք է, որը շատ հեռու է տվյալների բազայի միջինից կամ միջին արժեքից: Այլ կերպ ասած, արտաքուստ արժեքներն այն արժեքներն են, որոնք զգալիորեն ավելի բարձր կամ ցածր են, քան տվյալների հավաքածուի մնացած արժեքները:

Մտածեք կրիկետի խաղի մասին, որտեղ բոլոր հարվածողները հավաքել են մոտ 50 միավոր, բայց միայն մեկ բեթսմենը վաստակել է մեկ դար (100): ) և մեկ այլ բաթսմեն դուրս եկավ 0-ին: 100-ը և 0-ն այս խաղում ամենակարևորներն են:

Անթերցումները խնդրահարույց են, քանի որ դրանք կարող են շեղել տվյալների վերլուծության արդյունքը և ստանալ ապակողմնորոշիչ արդյունքներ: Այսպիսով, ավելի լավ է գտնել ծայրամասերը և հեռացնել դրանք՝ հարթ տվյալների բազա ունենալու համար:

Excel-ում Outliers-ը հեռացնելու 3 եղանակ

Այս բաժնում դուք կսովորեք, թե ինչպես ջնջեք արտանետումները ձեր տվյալների բազայից 3 տարբեր եղանակներով: Արտաքին կետերը հեռացնելը բարդ գործընթաց է, ուստի ուշադիր կարդացեք ամբողջ հոդվածը:

1. Օգտագործելով Excel ֆունկցիան՝ առանց միջինը հաշվարկելուOutliers

Excel TRIMMEAN ֆունկցիան կարող է օգտագործվել տվյալ տվյալների բազայի միջինը հաշվարկելու համար` բացառելով արտաքին ցուցանիշները: Բացառվող տվյալների միավորները տրամադրվում են որպես տոկոս: Տոկոսային արժեքը կարող է մուտքագրվել որպես տասնորդական ձևաչափ կամ տոկոսային ձևաչափ:

Շարահյուսությունը առանց ծայրամասերի միջինը հաշվարկելու համար է,

=TRIMMEAN(զանգված, տոկոս)

Այստեղ,

  • զանգված = Տվյալների միջակայքը կտրելու և միջին արդյունքը հաշվարկելու համար
  • տոկոս = բացառվող տվյալների կետերի թիվը

Եկեք տեսնենք, թե ինչպես կարելի է իրականացնել այս ֆունկցիան` արդյունքները հաշվելու համար հեռացված ծայրամասերով:

Դիտարկենք վերը նշված պատկերը: Մենք ունենք տվյալներ B5 բջիջից մինչև B14 : Այստեղ թվերի մեծ մասը գտնվում է 20-ից 27-ի միջև, սակայն երկու արժեք՝ 0 և 100 , շատ հեռու են այդ արժեքներից: Այսպիսով, սրանք մեր տվյալների բազայի անկատարները են:

Մեր տվյալների բազայի համար Excel-ի TRIMMEAN ֆունկցիայի միջոցով միջինը (միջին) հաշվարկելու բանաձևը հետևյալն է. 3> =TRIMMEAN(B5:B14,0.2)

Այստեղ,

  • B5:B14 = Միջին արդյունքը կտրելու և հաշվարկելու համար տվյալների շրջանակը
  • 0.2 (կամ 20%) = Տվյալների բացառման կետերի թիվը

Եթե տվյալների շտեմարանում որևէ թիվ 20%-ով պակասում է տվյալների հավաքածուի մնացած մասից , ապա այդ թիվը կկոչվի outliers:

Եթե գրեք բանաձևը ըստ ձեր տվյալների բազայի և սեղմեք Enter , ապա կստանաք հաշվարկված միջինը` առանց ծայրամասերի: ձեր տվյալների բազայի համար: Մեր դեպքում, E6 բջիջը պահում է հաշվարկված միջինը, որը 23,50 է:

Ստուգելու համար, արդյոք պատասխանը ճիշտ է, թե ոչ, մենք գործարկում ենք ՄԻՋԻՆ ֆունկցիան: E5 բջիջում , որը վերադարձնում է B5:B14 տիրույթի բոլոր արժեքների միջինը ( 28.80 ): Եվ E7 բջիջում մենք գործարկում ենք ևս մեկ ՄԻՋԻՆ ֆունկցիա` ձեռքով մուտքագրելով բոլոր բջիջները, բացառությամբ նրանց, որոնք ունեն արտաքին արժեքներ, և արդյունքում ստացանք 23,50 վերադարձ:

Այսպիսով, մենք կարող ենք ասել, որ TRIMMEAN ֆունկցիան կարող է հաջողությամբ հեռացնել outliers տվյալ տվյալների բազայից` միջինը հաշվարկելիս Excel-ում:

Կարդալ ավելին` Ինչպես մաքրել բանաձևը Excel-ում (7+ մեթոդ)

2. Հեռացրեք Outliers-ը Dataset-ից և Line Chart-ից Excel-ում

Ուշադրություն դարձրեք հետևյալ նկարին: Մենք ունենք որոշ տվյալներ, որոնց հիման վրա ստեղծել ենք գծային գրաֆիկ։ Գծային գրաֆիկից մենք հեշտությամբ կարող ենք տեսնել, որ տվյալների 4-րդ և 8-րդ կետերում մենք ունենք մեր ծայրամասերը :

Այժմ մենք կտեսնենք, թե ինչպես կարող ենք հարթել դուրս գծային գծապատկերը՝ հեռացնելով ծայրամասային արժեքները տվյալների հավաքածուից:

Մեկ այլ բջիջում (մեր դեպքում դա Cell H6 է), գրեք հետևյալ բանաձևը,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Այստեղ,

  • C6 = Բջջ, որը պահում է տվյալների հավաքածուի առաջին տվյալները
  • C5 = Առաջին տվյալների բջիջի վերևում գտնվող բջիջը
  • C7 = Բջիջը առաջին տվյալների բջիջից ներքև
  • $E$6 = Տարբերությունը տվյալների կետերի միջև .

Նայելովմեր տվյալները, թվում է, որ երբ տվյալների կետը տարբերվում է 10 միավորով մյուսներից, նշանակվում է որպես առանձնական : Այսպիսով, մենք դնում ենք 10 Cell E6 և այն դարձնում ենք Բացարձակ բջջային հղում , որպեսզի այս բջիջը ֆիքսվի ամբողջ տվյալների բազան սկանավորելիս և հաշվարկելիս:

Enter սեղմելուց հետո դուք կարող եք տեսնել, որ առաջին տվյալները դեռ հայտնվում են արդյունքի բջիջում H6 : Այն ամենը, ինչ դուք պետք է անեիք այստեղ, պարզապես կառուցեք բանաձևը, որպեսզի մենք կարողանանք քաշել Լրացնել բռնակը ` բանաձևը կիրառելու մնացած բջիջների վրա:

Այժմ տողը ներքև քաշեք Լրացնել բռնակով և կտեսնեք, որ այն բջիջները, որոնք պահում էին ծայրամասերը, այժմ լցված են #N/A -ով:

Եվ հիմա նայեք գծային գծապատկերին, սա այժմ հարթեցված գծապատկեր է՝ առանց որևէ ծայրամասային արժեքների:

Բանաձևի բաշխում

=IF(

Քանի որ մենք պատրաստվում ենք համեմատել արժեքները, որոնց հիման վրա մենք կհանենք արդյունքը, մենք սկսում ենք բանաձևը IF պայմանը։

=IF(AND(

Մենք պատրաստվում ենք համեմատել ընթացիկ տվյալների կետը և վերևի բջիջը և ներքևի բջիջը Եվ եթե երկու համեմատություններն էլ ճշմարիտ են, միայն այդ դեպքում մենք արդյունքում ցույց կտանք տվյալների կետը: Այսպիսով, քանի որ մենք պետք է գործ ունենանք «Երկու» համեմատությունների հետ, ուստի մենք պետք է օգտագործենք AND ֆունկցիան :

=IF(AND(ABS(

Երբ մենք հանում ենք տվյալների միավորները, որոշ տվյալներ կարող են բացասական արժեքներ գցել: Եվ մենք անում ենք ոչցանկանում եք գործ ունենալ բացասական արժեքների հետ, քանի որ բացասական արժեքները միշտ կհակասեն «տվյալների հեռացման պայմանին, երբ տարբերությունը 10 է»: Այսպիսով, որպեսզի համոզվենք, որ մենք միշտ դրական արդյունքներ ունենք, մենք պետք է համեմատությունները փաթաթենք Բացարձակ արժեքի ֆունկցիայի մեջ :

=IF(AND(ABS(C6-C5)> ;$E$6

Այստեղ մենք սկսեցինք մեր առաջին համեմատությունը: Մենք պարզապես հանում ենք ընթացիկ արժեքը վերը նշված արժեքով և տեսնում ենք արդյոք արդյունքը ավելի մեծ է, քան Cell E6<2-ում պահվող տարբերության մակարդակը:> և բջիջը դարձրեց Բացարձակ հղում ` բջիջի արժեքը կողպված պահելու համար:

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

Հաջորդը՝ համեմատության երկրորդ մասը, որն առանձնացված է ստորակետով: Այն կհամեմատի ընթացիկ տվյալների կետը հաջորդ տվյալների կետի հետ:

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Այժմ մենք դնում ենք ստորակետով և որոշեք այնտեղ դնել NA ֆունկցիան , եթե երկու AND ֆունկցիաները ճշմարիտ են:

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Եվ եթե AND ֆունկցիան ճիշտ չէ, ապա մենք ցանկանում եք վերադարձնել իրական տվյալների կետը որպես IF False արժեք: Այսպիսով, մենք մուտքագրում ենք e ստորակետով և այնտեղ փոխանցեք բջիջի հղման համարը C6 :

Կարդալ ավելին. Ինչպես հեռացնել տվյալների վավերացումը Excel-ում (5 եղանակ)

Նման ընթերցումներ

  • Ինչպես հեռացնել վերնագիրը Excel-ում (4 մեթոդ)
  • Հեռացրեք կետավոր գծերըExcel (5 Արագ ուղիներ)
  • Ինչպես հեռացնել Grid-ը Excel-ից (6 հեշտ մեթոդ)
  • Հեռացնել սահմանները Excel-ում (4 արագ եղանակ)
  • Ինչպես հեռացնել համատեղելիության ռեժիմը Excel-ում (2 հեշտ եղանակ)

3. Հեռացնել Outliers-ը ձեռքով Excel-ում

Excel-ում արտանետումները վերացնելու մեկ այլ հեշտ միջոց է պարզապես տեսակավորել ձեր տվյալների հավաքածուի արժեքները և ձեռքով ջնջել վերին և ստորին արժեքները դրանից:

Տեսակավորելու համար: տվյալները,

  • Ընտրեք տվյալների բազան:
  • Գնացեք Տեսակավորել & Զտեք Խմբագրում խմբում և ընտրեք Տեսակավորել ամենափոքրից ամենամեծը կամ Տեսակավորել ամենամեծից փոքրից :

  • Մեր դեպքում մենք ընտրել ենք Տեսակավորել ամենափոքրից ամենամեծը : Այն դասակարգել է մեր տվյալների հավաքածուի թվերը աճման կարգով՝ ամենափոքրերը տեղադրելով վերևում, իսկ ամենամեծերը՝ ներքևում:

Այժմ պարզապես ձեռքով ջնջեք այդ տվյալները։ տվյալների հավաքածուի ծայրամասային արժեքներն անվճար դարձնելու համար:

Մենք խորհուրդ չենք տալիս հետևել այս գործընթացին մեծ տվյալների բազայի հետ աշխատելիս: Երբ ձեր տվյալների շտեմարանը փոքր է և ավելի հեշտ է դիտել, միայն այդ դեպքում կարող եք կիրառել այս ընթացակարգը, այլապես մի իրականացրեք սա:

Կարդալ ավելին. Ինչպես հեռացնել տեսակավորումը Excel-ում ( 3 Հեշտ մեթոդ)

Եզրակացություն

Այս հոդվածը ցույց տվեց, թե ինչպես կարելի է հեռացնել ծայրամասերը Excel-ում: Հուսով եմ, որ այս հոդվածը շատ օգտակար է եղել ձեզ համար: Ազատ զգալ հարցրեք, եթե ունեք հարցեր կապվածթեմա.

Հյու Ուեսթը բարձր փորձառու Excel-ի մարզիչ և վերլուծաբան է, որն ունի ավելի քան 10 տարվա փորձ այս ոլորտում: Նա հաշվապահական հաշվառման և ֆինանսների բակալավրի և բիզնեսի կառավարման մագիստրոսի կոչում է ստացել: Հյուը կիրք ունի դասավանդելու նկատմամբ և մշակել է ուսուցման յուրահատուկ մոտեցում, որը հեշտ է հետևել և հասկանալ: Excel-ի նրա փորձագիտական ​​գիտելիքներն օգնել են հազարավոր ուսանողների և մասնագետների ամբողջ աշխարհում բարելավել իրենց հմտությունները և առաջադիմել իրենց կարիերայում: Իր բլոգի միջոցով Հյուն կիսվում է իր գիտելիքներով աշխարհի հետ՝ առաջարկելով Excel-ի անվճար ձեռնարկներ և առցանց ուսուցում, որոնք կօգնեն անհատներին և ձեռնարկություններին հասնել իրենց ողջ ներուժին: