Како да се пресметаат надворешните вредности во Excel (5 лесни начини)

  • Споделете Го Ова
Hugh West

Можеби ќе треба да се идентификуваат надворешноста за да се направат статистички пресметки на податоците од збир на податоци. Можете да откриете оддалеченост од огромни збирки на податоци користејќи Microsoft Excel на многу начини. Во оваа објава, ќе ви покажеме како да пресметате оддалечености во Microsoft Excel користејќи пет различни начини.

Преземете ја работната книга за вежбање

Можете да ја преземете бесплатната работна книга на Excel од овде и да вежбате сами .

Најди Outliers.xlsx

5 практични пристапи за пресметување на outliers во Excel

Outliers се вредности на податоци кои се значително различни од останатите вредности на податоците во сетот на податоци. Оддалечените, со други зборови, се извонредни вредности. Тие се или исклучително високи или претерано ниски во споредба со другите вредности во множеството податоци. Наоѓањето на оддалеченост е од витално значење во статистичките пресметки бидејќи тие имаат влијание врз наодите од нашата анализа на податоци.

На пример, имате збир на податоци што го прикажува дневниот приход на дванаесет луѓе. Сега, треба да ги пресметате оддалечените со помош на Microsoft Excel. Еве, ќе ви покажам пет лесни пристапи за да го направите тоа.

1. Користете Sort & Филтрирајте за пресметување на оддалечените вредности во Excel

Можете да пресметате оддалеченост од мал сет на податоци со користење на Сортирај & засилувач; Команда Filter во Excel. Ако сакате да пресметате оддалеченост користејќи ја функцијата сортирање и филтрирање, можете да го направите тоа следејќи гочекори подолу.

Чекор 1:

  • Прво, изберете го заглавието на колоната во вашата база на податоци на Excel што сакате да го подредите. На пример, во дадениот сет на податоци, во заглавието на колоната на датотеката со име Дневен приход (избрана е ќелија C40 ).

Чекор 2:

  • Потоа, притиснете го Дома картичката на лентата и одете во групата Уредување .

Чекор 3:

  • После тоа, во групата Уредување кликнете на Сортирај & засилувач; Filter командата и кликнете на Custom Sort .

Чекор 4:

  • Потоа, ќе се отвори ново поле за дијалог со име Sort . Во прозорецот за дијалог што се појавува, изберете Дневен Приход во Подреди по паѓачкото и Најмал до најголем во паѓачкото мени Ред. После тоа, кликнете OK .

Чекор 5:

  • Конечно, колоната Дневен приход би била подредена на наведениот начин, со најниски вредности на врвот и најголеми вредности на дното. Откако ќе ја извршите процедурата, побарајте какви било неправилности во опсегот на податоци за да ги одредите надворешните вредности.

На пример, првите две вредности во колоната се значително помали и последните две вредности во колоната се значително повисоки од останатите вредности во множеството податоци, како што е прикажано вогоренаведениот резултат.

Прочитајте повеќе: Како да пронајдете оддалеченост во анализата на регресија во Excel (3 лесни начини)

2. Примени ја функцијата QUARTILE на Пресметајте исклучоци во Excel

Пристапот QUARTILE функција е понаучен начин за пресметување на оддалечените вредности во Excel. Можете да ја користите оваа функција за да ги поделите вашите збирки податоци на четири еднакви делови. Следниве вредности ќе бидат вратени со функцијата QUARTILE :

  • минималната вредност.
  • 6> 1-ви квартила (Q1 - најниски 25% од дадена база на податоци).
  • 2-та квартал (Q2-следна најниски 25% од збирката податоци).
  • 3-та квартил (Q3- втор највисок 25% од сетот).
  • На максимална вредност.

Синтаксата на функцијата QUARTILE во Excel е:

=QUARTILE( низа, quart)

Синтаксата ги содржи следните аргументи:

  • a ray : опсегот на ќелиите на дадена збир на податоци за кои ќе ја пресметате вредноста на кварталот.
  • quart: Ова одредува која вредност треба да се врати.

За пресметување на надворешните вредности за горната база на податоци користејќи функцијата QUARTILE, следете ги чекорите подолу.

Чекор 1:

  • Прво, напишете ја следната формула за одредување на 1-ви квартил ( Q1 ) е даден подолу.
=QUARTILE($C$5:$C$16,1)

Чекор 2:

  • Тукаповторно, формулата за пресметување на 3-тиот квартил ( Q3 ) е дадена подолу.
=QUARTILE($C$5:$C$16,3)

Чекор 3:

  • Трето, треба да го одредите IQR, што е Меѓу-кварталниот опсег (тоа претставува 50% од дадените податоци од опсегот на множество податоци што спаѓаат во првиот и третиот квартал) со одземање Q1 (во ќелијата G4 ) од Q3 (во ќелијата G5 ). Внесете ја следната формула за да го пресметате одземањето.

    =G5-G4

Чекор 4:

  • Откако ќе го пронајдете IQR, следно треба да го одредите горниот и долна Бидејќи горната и долната граница би ги содржи повеќето од податоците во множеството податоци. Запишете ја следната формула за да ја пресметате горната граница.

    =G5+(1.5*G6)

Чекор 5:

  • Потоа, за да се пресмета долната граница, запишете ја следната формула.
=G4-(1.5*G6)

Чекор 6:

  • Конечно, откако ќе го завршите претходниот чекор, можете да одредите оддалеченост за секој податок вредност. Во работниот лист на Excel, напишете ја следнава формула со функцијата ИЛИ во ќелијата D5 .
=OR(C5$G$7)

  • Оваа формула ќе помогне да се идентификуваат податоците кои не спаѓаат во горенаведениот опсег на опсег. По обработката наформулата ќе прикаже ВИСТИНА изјава ако конкретните податоци се надворешно и НЕТОЧНО ако не е. Двоен клик на алатката Автоматско пополнување во ќелијата C5 за да ја копирате формулата во останатите ќелии во колона В . Така, можете да ја набљудувате вистинската вредност до сите оддалечени во вашата база на податоци.

3. Комбинирајте ги функциите AVERAGE и STDEV.P за пресметување на оддалечените од средната вредност и стандардното отстапување

A стандардното отстапување (или σ ) е метрика за одредување на тоа колку се дистрибуирани податоците во однос на средната вредност на целото множество податоци. Податоците се групирани околу средната вредност кога стандардното отстапување е ниско, додека податоците се повеќе распространети кога стандардната девијација е висока. За да ги пресметате оддалечените вредности користејќи ги Средноста и Стандардното отстапување , можете да ги следите следните чекори.

Чекор 1:

  • Прво, користете ја истата база на податоци прикажана на почетокот на овој напис, а потоа пресметајте ја просечната и стандардната девијација. За да ја пресметате средната вредност, напишете ја следнава формула со функцијата AVERAGE во ќелијата G5 .
=AVERAGE(C5:C16)

Чекор 2:

  • За да се пресмета стандардната девијација, вметнете ја следнава формула со STDEV .P функција во ќелијата G6 .
=STDEV.P(C5:C16)

Чекор 3:

  • Следно, ќе го пресметатегорната граница за понатамошен напредок во процесот. Во ќелијата G7 , пресметајте ја долната граница користејќи ја следнава формула.
=G5-(1.25*G6)

Чекор 4:

  • И во ќелијата G8 пресметајте ја горната граница од следнава формула
=G5+(1.5*G6)

Чекор 5:

  • После тоа , за да пресметате дали постојат некои оддалечени или не, напишете ја следнава формула во ќелијата D5 .
=OR(C5$G$8)

  • Така, формулата ќе врати TRUE вредност ако конкретните податоци во саканата ќелија се оддалечени и НЕТОЧНО.
  • Двоен-клик на алатката Автоматско пополнување во ќелијата D5 да ја копирате формулата во останатите ќелии во колоната D . Така, можете да ги дознаете сите преостанати оддалечености во вашата база на податоци.

Прочитајте повеќе: Како да најдете откачени вредности со стандардно отстапување во Excel (со брзи чекори)

4. Вметнете Z-оценка за пресметување на оддалечените вредности во Excel

Z-оценката е една од најчесто користените метрики за идентификување на оддалечените. Овој метод покажува колку одреден податок е оддалечен од средната вредност на збирката податоци во однос на нејзиното стандардно отстапување. За да се пресметаат оддалечените вредности користејќи Z-резултат во Excel, можете да ги видите чекорите опишани подолу.

Чекор 1:

  • Прво, земете го саканиот сет на податоци.

Чекор2:

  • Второ, во ќелијата H5, напишете ја следнава формула за пресметување на средната вредност за дадените податоци.
=AVERAGE(C5:C16)

Чекор 3:

  • Трето, пресметајте го стандардното отстапување на дадената база на податоци во ќелијата H6 со користење на следнава формула.
=STDEV.P(C5:C16)

Чекор 4:

  • После тоа , треба да ја одредите Z -оценката за секоја вредност на податоците. За да го направите ова, ја користите формулата дадена подолу.
=(C5-$H$5)/$H$6

Чекор 5:

  • Откако ќе ги пресметате сите Z-вредности, ќе видите дека опсегот на Z-вредности е помеѓу -1,44 и 13 . Значи, сметаме вредности на Z-резултат помали од -1,2 или повеќе од +1,8 за оддалечените граници.
  • Потоа, напишете ја следната формула во ќелијата E 5 .
=OR((D51.8))

  • Конечно, формулата ќе врати TRUE вредност ако конкретните податоци се оддалечени и ќе се врати FALSE
  • Двоен-клик на ќелијата E5 за да го користите Автоматско пополнување рачка за полнење на алатката за да ја копирате формулата во останатите ќелии во колоната E . Така, можете да ги најдете сите преостанати откачени вредности во вашата база на податоци.

Прочитајте повеќе: Како да најдете откачени вредности користејќи Z Score во Excel (со QuickЧекори)

5. Спојте ги функциите LARGE и SMALL за да пронајдете оддалечени страници во Excel

Функцијата LARGE и функцијата SMALL во Excel имаат спротивни операции. Ќе го користиме за да ги најдеме најголемите и најмалите податоци или вредности во збир на податоци, соодветно. Оваа функција ќе ги повлече сите податоци во множество податоци, наоѓајќи ги најмалите и најголемите броеви. Тие можат да го најдат вториот најмал или најголем, трет по големина или најмал, итн.

Чекор 1:

  • Прво, користете ја следната формула во ќелијата E5 со функцијата LARGE .
=LARGE($C$5:$C$16,1)

    • Така, од 12 вредности, можете да ја видите првата најголема вредност која е 780 .

Чекор 2:

  • Потоа, во ќелијата G5 , запишете ја следнава формула за да ја пронајдете најмалата вредност.
=SMALL($C$5:$C$16,1)

  • Конечно, од 12 вредности, можете да ја видите 1-та најмалата вредност 110 .
  • Откако ќе ги дознаете сите потребни вредности, тогаш можете лесно да ги посочите сите одвоени вредности во базата на податоци.

Заклучок

Тоа е крајот на оваа статија. Се надевам дека овој напис ви е корисен. Откако ќе ја прочитате оваа статија, ќе можете да пресметате оддалечености во Excel користејќи кој било од методите. Ве молиме споделете какви било дополнителни прашања или препораки сонас во делот за коментари подолу.

Хју Вест е високо искусен тренер и аналитичар на Excel со повеќе од 10 години искуство во индустријата. Има диплома за сметководство и финансии и магистер по бизнис администрација. Хју има страст за предавање и има развиено уникатен пристап на наставата кој е лесен за следење и разбирање. Неговото стручно познавање на Excel им помогна на илјадници студенти и професионалци ширум светот да ги подобрат своите вештини и да се истакнат во нивните кариери. Преку својот блог, Хју го споделува своето знаење со светот, нудејќи бесплатни упатства за Excel и онлајн обука за да им помогне на поединците и бизнисите да го достигнат својот целосен потенцијал.