Како да се отстранат outliers во Excel (3 начини)

  • Споделете Го Ова
Hugh West

Наоѓањето на оддалечените и нивното отстранување е многу вообичаена задача за анализа на податоците во статистиката, ископувањето податоци, машинското учење итн. најдете. Во оваа статија, ќе ви покажеме како да отстранувате оддалечености во Excel .

Преземете работна книга

Можете да ја преземете бесплатната практична работна книга на Excel од овде.

Отстрани Outliers.xlsx

Што се Outliers во Excel?

A outliers е вредност што отпаѓа многу од средната или средната вредност на базата на податоци. Со други зборови, оддалечените се вредности кои се значително повисоки или пониски од останатите вредности во базата на податоци.

Помислете на натпревар во крикет каде што сите тепачи постигнале околу 50, но само еден батсмен постигнал цел век (100 ) и уште еден батсмен излегол на 0. Резултатите од 100 и 0 се најистакнатите на овој натпревар.

Излезните точки се проблематични бидејќи можат да го искриват резултатот од анализата на податоците и да доведат до погрешни резултати. Затоа, подобро е да ги пронајдете надворешноста и да ги отстраните за да имате рамномерна база на податоци.

3 начини да ги отстраните надворешните вредности во Excel

Во овој дел, ќе научите како да бришете ги оддалечените од вашата база на податоци на 3 различни начини. Отстранувањето на надворешноста е тежок процес, затоа внимателно прочитајте ја целата статија.

1. Користење на функцијата Excel за пресметување на просекот безOutliers

Excel TRIMMEAN функцијата може да се користи за пресметување на просекот на дадена база на податоци додека се исклучуваат outliers. Податоците за исклучување се доставуваат како процент. Процентуалната вредност може да се внесе како децимален формат или формат на проценти.

Синтаксата за пресметување на средната вредност без оддалеченост е,

=TRIMMEAN(низа, проценти)

Овде,

  • низа = Опсег на податоци за намалување и пресметување на просечниот резултат
  • процент = број на податочни точки што треба да се исклучат

Ајде да видиме како да ја имплементираме оваа функција за да ги пресметаме резултатите со отстранети оддалечени.

Разгледајте ја горната слика. Имаме податоци од Ќелија B5 до B14 . Овде повеќето од броевите се помеѓу 20 и 27, но две вредности - 0 и 100 - се далеку од тие вредности. Значи, ова се оддалечените вредности во нашата база на податоци.

За нашата база на податоци, формулата за пресметување на средната вредност (просек) без исфрлените вредности со функцијата Excel TRIMMEAN е,

=TRIMMEAN(B5:B14,0.2)

Тука,

  • B5:B14 = Опсег на податоци за скратување и пресметување на просечниот резултат
  • 0,2 (или 20%) = Бројот на точки на податоци што треба да се исклучат

Ако некој број во сетот падне за 20% од остатокот од сетот на податоци , тогаш тој број ќе се нарече оддалечени.

Ако ја напишете формулата според вашата база на податоци и притиснете Enter , ќе ја добиете пресметената средна вредност без оддалеченост за вашата база на податоци. Во нашиот случај, Ќелијата E6 ја има пресметаната средина што е 23,50 .

За да провериме дали одговорот е точен или не, ја извршуваме функцијата ПРОСЕК во Ќелија E5 која го враќа просекот ( 28,80 ) на сите вредности во опсегот B5:B14 . И во Ќелија E7 , извршуваме друга функција ПРОСЕЧНА со рачно внесување на сите ќелии, освен оние што ги чуваат вредностите на оддалеченост, и како резултат добивме враќање од 23,50 .

Значи, можеме да кажеме дека функцијата TRIMMEAN може успешно да отстрани оддалеченост од дадена база на податоци додека го пресметува просекот во Excel.

Прочитај повеќе: Како да ја исчистите формулата во Excel (7+ методи)

2. Отстранете ги Outliers од збир на податоци и линиски графикон во Excel

Забележете ја следнава слика. Имаме некои податоци врз основа на кои направивме линиски график. Од линискиот график, лесно можеме да видиме дека во податочните точки 4 и 8 ги имаме нашите оддалечени .

Сега ќе видиме како можеме да го изедначиме извадете го линискиот графикон со отстранување на оддалечените вредности од збирката податоци.

Во друга ќелија (во нашиот случај тоа е Ќелија H6 ), напишете ја следнава формула,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Тука,

  • C6 = Ќелија која ги содржи првите податоци во базата на податоци
  • C5 = Ќелија над првата податочна ќелија
  • C7 = Ќелија под првата податочна ќелија
  • $E$6 = Разлика помеѓу точките на податоци .

Гледајќи вонашите податоци, се чини дека кога податочната точка е се разликува 10 единици од другите, се означени како оддалечени . Така, ставаме 10 во Ќелија E6 и ја правиме Апсолутна референца за ќелија така што оваа ќелија ќе биде фиксирана додека се скенира и пресметува низ целата база на податоци.

По притискање на Enter , можете да видите дека првите податоци сè уште се појавуваат во резултатската ќелија H6 . Сè што требаше да направите овде е само да ја конструирате формулата за да можеме да ја повлечеме Рачка за пополнување за да ја примениме формулата на останатите ќелии.

Сега повлечете го редот надолу со Рачка за пополнување и ќе видите дека ќелиите што ги држеле оддалечените сега се исполнети со #N/A .

И погледнете го линискиот графикон сега, ова сега е срамнет графикон без никакви оддалечени вредности во него.

Разбивање на формулата

=IF(

Додека ќе ги споредиме вредностите врз основа на кои ќе го извлечеме резултатот, ја иницираме формулата со условот IF .

=IF(AND(

Ќе ја споредиме моменталната податочна точка и ќелијата горе и ќелијата долу И ако и двете споредби се вистинити, само тогаш ќе ја прикажеме точката на податоци како резултат. 0> =IF(AND(ABS(

Кога ги одземаме точките на податоци, некои податоци може да исфрлат негативни вредности. несакате да се справите со негативните вредности бидејќи негативните вредности секогаш ќе се контрадикторни со условот за „отстранување на податоците кога разликата е 10“. Значи, за да се увериме дека секогаш имаме позитивни резултати, треба да ги завиткаме споредбите во функцијата Апсолутна вредност .

=IF(AND(ABS(C6-C5)> ;$E$6

Овде ја започнавме нашата прва споредба. Едноставно ја одземаме моменталната вредност со горната вредност и гледаме дали резултатот е поголем од нивото на разлика складирано во Cell E6 и ја направија ќелијата Апсолутна референца за да ја задржи вредноста на ќелијата заклучена.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6 -C7)>$E$6)

Следно, вториот дел од споредбата кој е одделен со запирка. Ќе ја спореди моменталната податочна точка со следната податочна точка.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Сега ставаме запирка и одреди да ставиш NA функција таму ако и двете функции AND се вистинити.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

И ако функцијата AND не е вистина тогаш ние сакате да ја вратите вистинската податочна точка како IF Неточна вредност e во запирка и префрлете го референтниот број на ќелијата C6 таму.

Прочитајте повеќе: Како да се отстрани валидацијата на податоците во Excel (5 начини)

Слични читања

  • Како да се отстрани заглавие во Excel (4 методи)
  • Отстранете ги точките воExcel (5 брзи начини)
  • Како да се отстрани Grid од Excel (6 лесни методи)
  • Отстранете ги границите во Excel (4 брзи начини)
  • Како да се отстрани режимот на компатибилност во Excel (2 лесни начини)

3. Рачно отстранете ги Outliers во Excel

Друг лесен начин за елиминирање на outliers во Excel е, само подредете ги вредностите на вашата база на податоци и рачно избришете ги горните и долните вредности од него.

За сортирање податоците,

  • Изберете базата на податоци.
  • Одете во Сортирај & засилувач; Филтрирајте во групата Уредување и изберете или Средете од најмала до најголема или Средете ја најголемата до најмалата .

  • Во нашиот случај, избравме Подреди од најмала до најголема . Ги подреди броевите во нашата база на податоци во растечки редослед, ставајќи ги најмалите на врвот и најголемите на дното.

Сега само рачно избришете ги тие податоци за да се направат подалечните вредности на податочните податоци бесплатни.

Не препорачуваме да го следите овој процес додека работите со голема база на податоци. Кога вашата база на податоци е мала и полесна за прегледување, само тогаш можете да ја примените оваа постапка, инаку не го спроведувајте ова.

Прочитајте повеќе: Како да се отстрани сортирање во Excel ( 3 лесни методи)

Заклучок

Оваа статија ви покажа како да отстранете оддалечени во Excel. Се надевам дека овој напис беше многу корисен за вас. Слободно прашајте дали имате какви било прашања во врска сотема.

Хју Вест е високо искусен тренер и аналитичар на Excel со повеќе од 10 години искуство во индустријата. Има диплома за сметководство и финансии и магистер по бизнис администрација. Хју има страст за предавање и има развиено уникатен пристап на наставата кој е лесен за следење и разбирање. Неговото стручно познавање на Excel им помогна на илјадници студенти и професионалци ширум светот да ги подобрат своите вештини и да се истакнат во нивните кариери. Преку својот блог, Хју го споделува своето знаење со светот, нудејќи бесплатни упатства за Excel и онлајн обука за да им помогне на поединците и бизнисите да го достигнат својот целосен потенцијал.