Բովանդակություն
Անցած գծեր գտնելը և դրանք հեռացնելը շատ տարածված խնդիր է վիճակագրության, տվյալների արդյունահանման, մեքենայական ուսուցման և այլնի տվյալների վերլուծության համար: Կան շատ եղանակներ, որոնցով դուք կարող եք գտնել ծայրամասեր ձեր տվյալների բազայում, բայց դրանք հեռացնելու գործընթացն այնքան էլ հեշտ չէ: գտնել. Այս հոդվածում մենք ձեզ ցույց կտանք, թե ինչպես կարելի է հեռացնել Excel-ում արտանետումները :
Ներբեռնել աշխատանքային գիրքը
Դուք կարող եք ներբեռնել անվճար պրակտիկայի Excel աշխատանքային գիրքը այստեղից: այստեղ:
Հեռացնել Outliers.xlsx
Ի՞նչ է Outliers-ը Excel-ում:
A Outlier արժեք է, որը շատ հեռու է տվյալների բազայի միջինից կամ միջին արժեքից: Այլ կերպ ասած, արտաքուստ արժեքներն այն արժեքներն են, որոնք զգալիորեն ավելի բարձր կամ ցածր են, քան տվյալների հավաքածուի մնացած արժեքները:
Մտածեք կրիկետի խաղի մասին, որտեղ բոլոր հարվածողները հավաքել են մոտ 50 միավոր, բայց միայն մեկ բեթսմենը վաստակել է մեկ դար (100): ) և մեկ այլ բաթսմեն դուրս եկավ 0-ին: 100-ը և 0-ն այս խաղում ամենակարևորներն են:
Անթերցումները խնդրահարույց են, քանի որ դրանք կարող են շեղել տվյալների վերլուծության արդյունքը և ստանալ ապակողմնորոշիչ արդյունքներ: Այսպիսով, ավելի լավ է գտնել ծայրամասերը և հեռացնել դրանք՝ հարթ տվյալների բազա ունենալու համար:
Excel-ում Outliers-ը հեռացնելու 3 եղանակ
Այս բաժնում դուք կսովորեք, թե ինչպես ջնջեք արտանետումները ձեր տվյալների բազայից 3 տարբեր եղանակներով: Արտաքին կետերը հեռացնելը բարդ գործընթաց է, ուստի ուշադիր կարդացեք ամբողջ հոդվածը:
1. Օգտագործելով Excel ֆունկցիան՝ առանց միջինը հաշվարկելուOutliers
Excel TRIMMEAN ֆունկցիան կարող է օգտագործվել տվյալ տվյալների բազայի միջինը հաշվարկելու համար` բացառելով արտաքին ցուցանիշները: Բացառվող տվյալների միավորները տրամադրվում են որպես տոկոս: Տոկոսային արժեքը կարող է մուտքագրվել որպես տասնորդական ձևաչափ կամ տոկոսային ձևաչափ:
Շարահյուսությունը առանց ծայրամասերի միջինը հաշվարկելու համար է,
=TRIMMEAN(զանգված, տոկոս)Այստեղ,
- զանգված = Տվյալների միջակայքը կտրելու և միջին արդյունքը հաշվարկելու համար
- տոկոս = բացառվող տվյալների կետերի թիվը
Եկեք տեսնենք, թե ինչպես կարելի է իրականացնել այս ֆունկցիան` արդյունքները հաշվելու համար հեռացված ծայրամասերով:
Դիտարկենք վերը նշված պատկերը: Մենք ունենք տվյալներ B5 բջիջից մինչև B14 : Այստեղ թվերի մեծ մասը գտնվում է 20-ից 27-ի միջև, սակայն երկու արժեք՝ 0 և 100 , շատ հեռու են այդ արժեքներից: Այսպիսով, սրանք մեր տվյալների բազայի անկատարները են:
Մեր տվյալների բազայի համար Excel-ի TRIMMEAN ֆունկցիայի միջոցով միջինը (միջին) հաշվարկելու բանաձևը հետևյալն է. 3> =TRIMMEAN(B5:B14,0.2)
Այստեղ,
- B5:B14 = Միջին արդյունքը կտրելու և հաշվարկելու համար տվյալների շրջանակը
- 0.2 (կամ 20%) = Տվյալների բացառման կետերի թիվը
Եթե տվյալների շտեմարանում որևէ թիվ 20%-ով պակասում է տվյալների հավաքածուի մնացած մասից , ապա այդ թիվը կկոչվի outliers:
Եթե գրեք բանաձևը ըստ ձեր տվյալների բազայի և սեղմեք Enter , ապա կստանաք հաշվարկված միջինը` առանց ծայրամասերի: ձեր տվյալների բազայի համար: Մեր դեպքում, E6 բջիջը պահում է հաշվարկված միջինը, որը 23,50 է:
Ստուգելու համար, արդյոք պատասխանը ճիշտ է, թե ոչ, մենք գործարկում ենք ՄԻՋԻՆ ֆունկցիան: E5 բջիջում , որը վերադարձնում է B5:B14 տիրույթի բոլոր արժեքների միջինը ( 28.80 ): Եվ E7 բջիջում մենք գործարկում ենք ևս մեկ ՄԻՋԻՆ ֆունկցիա` ձեռքով մուտքագրելով բոլոր բջիջները, բացառությամբ նրանց, որոնք ունեն արտաքին արժեքներ, և արդյունքում ստացանք 23,50 վերադարձ:
Այսպիսով, մենք կարող ենք ասել, որ TRIMMEAN ֆունկցիան կարող է հաջողությամբ հեռացնել outliers տվյալ տվյալների բազայից` միջինը հաշվարկելիս Excel-ում:
Կարդալ ավելին` Ինչպես մաքրել բանաձևը Excel-ում (7+ մեթոդ)
2. Հեռացրեք Outliers-ը Dataset-ից և Line Chart-ից Excel-ում
Ուշադրություն դարձրեք հետևյալ նկարին: Մենք ունենք որոշ տվյալներ, որոնց հիման վրա ստեղծել ենք գծային գրաֆիկ։ Գծային գրաֆիկից մենք հեշտությամբ կարող ենք տեսնել, որ տվյալների 4-րդ և 8-րդ կետերում մենք ունենք մեր ծայրամասերը :
Այժմ մենք կտեսնենք, թե ինչպես կարող ենք հարթել դուրս գծային գծապատկերը՝ հեռացնելով ծայրամասային արժեքները տվյալների հավաքածուից:
Մեկ այլ բջիջում (մեր դեպքում դա Cell H6 է), գրեք հետևյալ բանաձևը,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Այստեղ,
- C6 = Բջջ, որը պահում է տվյալների հավաքածուի առաջին տվյալները
- C5 = Առաջին տվյալների բջիջի վերևում գտնվող բջիջը
- C7 = Բջիջը առաջին տվյալների բջիջից ներքև
- $E$6 = Տարբերությունը տվյալների կետերի միջև .
Նայելովմեր տվյալները, թվում է, որ երբ տվյալների կետը տարբերվում է 10 միավորով մյուսներից, նշանակվում է որպես առանձնական : Այսպիսով, մենք դնում ենք 10 Cell E6 և այն դարձնում ենք Բացարձակ բջջային հղում , որպեսզի այս բջիջը ֆիքսվի ամբողջ տվյալների բազան սկանավորելիս և հաշվարկելիս:
Enter սեղմելուց հետո դուք կարող եք տեսնել, որ առաջին տվյալները դեռ հայտնվում են արդյունքի բջիջում H6 : Այն ամենը, ինչ դուք պետք է անեիք այստեղ, պարզապես կառուցեք բանաձևը, որպեսզի մենք կարողանանք քաշել Լրացնել բռնակը ` բանաձևը կիրառելու մնացած բջիջների վրա:
Այժմ տողը ներքև քաշեք Լրացնել բռնակով և կտեսնեք, որ այն բջիջները, որոնք պահում էին ծայրամասերը, այժմ լցված են #N/A -ով:
Եվ հիմա նայեք գծային գծապատկերին, սա այժմ հարթեցված գծապատկեր է՝ առանց որևէ ծայրամասային արժեքների:
Բանաձևի բաշխում
=IF(
Քանի որ մենք պատրաստվում ենք համեմատել արժեքները, որոնց հիման վրա մենք կհանենք արդյունքը, մենք սկսում ենք բանաձևը IF պայմանը։
=IF(AND(
Մենք պատրաստվում ենք համեմատել ընթացիկ տվյալների կետը և վերևի բջիջը և ներքևի բջիջը Եվ եթե երկու համեմատություններն էլ ճշմարիտ են, միայն այդ դեպքում մենք արդյունքում ցույց կտանք տվյալների կետը: Այսպիսով, քանի որ մենք պետք է գործ ունենանք «Երկու» համեմատությունների հետ, ուստի մենք պետք է օգտագործենք AND ֆունկցիան :
=IF(AND(ABS(
Երբ մենք հանում ենք տվյալների միավորները, որոշ տվյալներ կարող են բացասական արժեքներ գցել: Եվ մենք անում ենք ոչցանկանում եք գործ ունենալ բացասական արժեքների հետ, քանի որ բացասական արժեքները միշտ կհակասեն «տվյալների հեռացման պայմանին, երբ տարբերությունը 10 է»: Այսպիսով, որպեսզի համոզվենք, որ մենք միշտ դրական արդյունքներ ունենք, մենք պետք է համեմատությունները փաթաթենք Բացարձակ արժեքի ֆունկցիայի մեջ :
=IF(AND(ABS(C6-C5)> ;$E$6
Այստեղ մենք սկսեցինք մեր առաջին համեմատությունը: Մենք պարզապես հանում ենք ընթացիկ արժեքը վերը նշված արժեքով և տեսնում ենք արդյոք արդյունքը ավելի մեծ է, քան Cell E6<2-ում պահվող տարբերության մակարդակը:> և բջիջը դարձրեց Բացարձակ հղում ` բջիջի արժեքը կողպված պահելու համար:
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
Հաջորդը՝ համեմատության երկրորդ մասը, որն առանձնացված է ստորակետով: Այն կհամեմատի ընթացիկ տվյալների կետը հաջորդ տվյալների կետի հետ:
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Այժմ մենք դնում ենք ստորակետով և որոշեք այնտեղ դնել NA ֆունկցիան , եթե երկու AND ֆունկցիաները ճշմարիտ են:
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Եվ եթե AND ֆունկցիան ճիշտ չէ, ապա մենք ցանկանում եք վերադարձնել իրական տվյալների կետը որպես IF False արժեք: Այսպիսով, մենք մուտքագրում ենք e ստորակետով և այնտեղ փոխանցեք բջիջի հղման համարը C6 :
Կարդալ ավելին. Ինչպես հեռացնել տվյալների վավերացումը Excel-ում (5 եղանակ)
Նման ընթերցումներ
- Ինչպես հեռացնել վերնագիրը Excel-ում (4 մեթոդ)
- Հեռացրեք կետավոր գծերըExcel (5 Արագ ուղիներ)
- Ինչպես հեռացնել Grid-ը Excel-ից (6 հեշտ մեթոդ)
- Հեռացնել սահմանները Excel-ում (4 արագ եղանակ)
- Ինչպես հեռացնել համատեղելիության ռեժիմը Excel-ում (2 հեշտ եղանակ)
3. Հեռացնել Outliers-ը ձեռքով Excel-ում
Excel-ում արտանետումները վերացնելու մեկ այլ հեշտ միջոց է պարզապես տեսակավորել ձեր տվյալների հավաքածուի արժեքները և ձեռքով ջնջել վերին և ստորին արժեքները դրանից:
Տեսակավորելու համար: տվյալները,
- Ընտրեք տվյալների բազան:
- Գնացեք Տեսակավորել & Զտեք Խմբագրում խմբում և ընտրեք Տեսակավորել ամենափոքրից ամենամեծը կամ Տեսակավորել ամենամեծից փոքրից :
- Մեր դեպքում մենք ընտրել ենք Տեսակավորել ամենափոքրից ամենամեծը : Այն դասակարգել է մեր տվյալների հավաքածուի թվերը աճման կարգով՝ ամենափոքրերը տեղադրելով վերևում, իսկ ամենամեծերը՝ ներքևում:
Այժմ պարզապես ձեռքով ջնջեք այդ տվյալները։ տվյալների հավաքածուի ծայրամասային արժեքներն անվճար դարձնելու համար:
Մենք խորհուրդ չենք տալիս հետևել այս գործընթացին մեծ տվյալների բազայի հետ աշխատելիս: Երբ ձեր տվյալների շտեմարանը փոքր է և ավելի հեշտ է դիտել, միայն այդ դեպքում կարող եք կիրառել այս ընթացակարգը, այլապես մի իրականացրեք սա:
Կարդալ ավելին. Ինչպես հեռացնել տեսակավորումը Excel-ում ( 3 Հեշտ մեթոդ)
Եզրակացություն
Այս հոդվածը ցույց տվեց, թե ինչպես կարելի է հեռացնել ծայրամասերը Excel-ում: Հուսով եմ, որ այս հոդվածը շատ օգտակար է եղել ձեզ համար: Ազատ զգալ հարցրեք, եթե ունեք հարցեր կապվածթեմա.