Преглед садржаја
Можда ће бити потребно да се идентификују одступници да би се извршила статистичка израчунавања података из скупа података. Можете да откријете изузетне вредности из огромних скупова података користећи Мицрософт Екцел на бројне начине. У овом посту ћемо вам показати како да израчунате ванредне вредности у Мицрософт Екцел-у на пет различитих начина.
Преузмите радну свеску за вежбу
Овде можете преузети бесплатну Екцел радну свеску и вежбати сами .
Пронађи Оутлиерс.клск
5 практичних приступа за израчунавање излазних вредности у Екцел-у
Оутлиерс су вредности података које се значајно разликују од осталих вредности података у скупу података. Другим речима, изванредне вредности су изузетне вредности. Оне су или изузетно високе или претерано ниске у поређењу са другим вредностима у скупу података. Проналажење изузетака је од виталног значаја у статистичким прорачунима јер они утичу на налазе наше анализе података.
На пример, имате скуп података који приказује дневни приход дванаест људи. Сада морате да израчунате одступања користећи Мицрософт Екцел. Овде ћу вам показати пет лаких приступа да то урадите.
1. Користите Сорт &амп; Филтер за израчунавање одступања у Екцел-у
Можете израчунати одступања из малог скупа података коришћењем Сорт &амп; Наредба Филтер у Екцел-у. Ако желите да израчунате одступања користећи функцију сортирања и филтрирања, то можете учинити тако што ћете пратитикораци у наставку.
Корак 1:
- Прво, изаберите заглавље колоне у скупу података Екцел-а које желите да сортирате. На пример, у датом скупу података, у заглављу колоне датотеке под називом Дневни приход (изабрана је ћелија Ц40 ).
Корак 2:
- Затим притисните Почетна картицу на траци и идите на групу Уређивање .
3. корак:
- Након тога, у групи Уређивање кликните на Сорт &амп; Филтер команду и кликните на Прилагођено Сорт .
4. корак:
- Затим ће се отворити нови оквир за дијалог под називом Сорт . У искачућем дијалогу изаберите Дневно Приход у Сортирај по падајући мени и Најмањи до највећи у падајућем менију Ред. Након тога кликните на ОК .
Корак 5:
- Коначно, колона Дневни приход била би сортирана на наведени начин, са најнижим вредностима на врху и највећим вредностима на дну. Након што покренете процедуру, потражите било какве неправилности у опсегу података да бисте одредили одступања.
На пример, прве две вредности у колони су знатно ниже и последње две вредности у колони су знатно веће од осталих вредности у скупу података, као што је приказано уизнад резултата.
Прочитајте више: Како пронаћи оутлиерс у регресионој анализи у Екцел-у (3 лака начина)
2. Примените функцију КУАРТИЛЕ на Израчунавање одступања у Екцел-у
Приступ функције КУАРТИЛЕ је научнији начин за израчунавање одступања у Екцел-у. Ову функцију можете користити да поделите своје скупове података на четири једнака дела. Следеће вредности ће вратити функција КУАРТИЛЕ :
- минимална вредност.
- 1. квартил (К1- најнижих 25% датог скупа података).
- 2. квартил (К2-следећи најнижих 25% скупа података).
- 3. квартил (К3- други највиших 25% скупа података).
- максимална вредност.
Синтакса функције КУАРТИЛЕ у Екцел-у је:
=КУАРТИЛЕ( арраи,куарт)
Синтакса садржи следеће аргументе:
- а рраи : опсег ћелија датог скуп података за који ћете израчунати вредност квартила.
- кварт: Ово одређује која вредност треба да се врати.
За израчунавање одступања за горњи скуп података помоћу функције КУАРТИЛЕ, следите доле наведене кораке.
Корак 1:
- Прво, откуцајте следећу формулу за одређивање 1. квартила ( К1 ) која је дата испод.
=QUARTILE($C$5:$C$16,1)
Корак 2:
- Овдеопет, формула за израчунавање 3. квартила ( К3 ) је дата испод.
=QUARTILE($C$5:$C$16,3)
Корак 3:
- Треће, морате одредити ИКР, који је Интер-квартилни опсег (представља 50% датих података из опсега скупа података који спадају у први и трећи квартил) одузимањем К1 (у ћелији Г4 ) из К3 (у ћелији Г5 ). Унесите следећу формулу да бисте израчунали одузимање.
=G5-G4
Корак 4:
- Након проналаска ИКР, следеће морате да одредите горњи и доња Зато што би горња и доња граница садржала већину података унутар скуп података. Запишите следећу формулу да бисте израчунали горњу границу.
=G5+(1.5*G6)
Корак 5:
- Затим, да бисте израчунали доњу границу, запишите следећу формулу.
=G4-(1.5*G6)
Корак 6:
- Коначно, након што завршите претходни корак, можете одредити ванредне вредности за сваки податак вредност. У Екцел радни лист откуцајте следећу формулу са функцијом ИЛИ у ћелији Д5 .
=OR(C5$G$7)
- Ова формула ће помоћи да се идентификују подаци који не спадају у горе поменуту границу опсега. Након обраде,формула ће показати ТРУЕ наредбу ако су специфични подаци ван граница и ФАЛСЕ ако нису. Двапут кликните на алатку Аутоматско попуњавање у ћелији Ц5 да бисте копирали формулу у остале ћелије у колони Ц . Дакле, можете да посматрате вредност Труе поред свих одступања у вашем скупу података.
3. Комбинујте АВЕРАГЕ и СТДЕВ.П функције да бисте израчунали одступнике од средње вредности и стандардне девијације
А стандардна девијација (или σ ) је метрика за одређивање колико су подаци распоређени у односу на средњу вредност целог скупа података. Подаци се групишу око средње вредности када је стандардна девијација ниска, док су подаци више распрострањени када је стандардна девијација висока. Да бисте израчунали ванредне вредности помоћу средње вредности и стандардне девијације , можете да пратите следеће кораке.
Корак 1:
- Прво, користите исти скуп података приказан на почетку овог чланка, а затим израчунајте средњу вредност и стандардну девијацију. Да бисте израчунали средњу вредност, откуцајте следећу формулу са просечном функцијом у ћелији Г5 .
=AVERAGE(C5:C16)
Корак 2:
- Да бисте израчунали стандардну девијацију, уметните следећу формулу са СТДЕВ .П функција у ћелији Г6 .
=STDEV.P(C5:C16)
Корак 3:
- Следеће ћете израчунатигорња граница за даље напредовање у процесу. У ћелији Г7 , израчунајте доњу границу користећи следећу формулу.
=G5-(1.25*G6)
Корак 4:
- И у ћелији Г8 израчунајте горњу границу из следеће формуле
=G5+(1.5*G6)
Корак 5:
- Након тога , да бисте израчунали да ли постоје одступања или не, откуцајте следећу формулу у ћелију Д5 .
=OR(C5$G$8)
- Дакле, формула ће вратити вредност ТРУЕ ако су специфични подаци у жељеној ћелији ван граница и ФАЛСЕ.
- Двапут кликните на алатку Аутоматско попуњавање у ћелији Д5 да бисте копирали формулу у остале ћелије у колони Д . Дакле, можете сазнати све преостале одступања у вашем скупу података.
Прочитајте више: Како пронаћи одступнике са стандардном девијацијом у Екцел-у (са брзим корацима)
4. Убаците З-сцоре за израчунавање одступања у Екцел-у
З-сцоре је једна од најчешће коришћених метрика за идентификацију одступања. Овај метод показује колико је одређени податак удаљен од средње вредности скупа података у односу на његову стандардну девијацију. Да бисте израчунали излазне вредности користећи З-сцоре у Екцел-у, можете видети доле описане кораке.
Корак 1:
- Прво, узмите жељени скуп података.
Корак2:
- Друго, у ћелију Х5, укуцајте следећу формулу за израчунавање средње вредности за дате податке.
=AVERAGE(C5:C16)
Корак 3:
- Треће, израчунајте стандардну девијацију датог скупа података у ћелији Х6 користећи следећу формулу.
=STDEV.P(C5:C16)
Корак 4:
- Након тога , морате да одредите З -сцоре за сваку вредност података. Да бисте то урадили користите формулу дату испод.
=(C5-$H$5)/$H$6
Корак 5:
- Након израчунавања свих З-вредности, видећете да је опсег З-вредности је између -1,44 и 13 . Дакле, узимамо у обзир вредности З-сцоре мање од -1,2 или веће од +1,8 за ванредне границе.
- Затим унесите следећу формулу у ћелију Е 5 .
=OR((D51.8))
- Коначно, формула ће вратити вредност ТРУЕ ако су специфични подаци изван вредности и вратиће ФАЛСЕ
- Двапут кликните на ћелију Е5 да бисте користили Аутоматско попуњавање ручица за попуњавање алата за копирање формуле у остале ћелије у колони Е . Тако можете пронаћи све преостале одступања у свом скупу података.
Прочитајте више: Како пронаћи одступнике користећи З резултат у Екцел-у (са брзимКораци)
5. Спојите ВЕЛИКЕ и МАЛЕ функције да бисте пронашли одступнике у Екцел-у
ВЕЛИКА функција и МАЛА функција у Екцел-у имају супротне операције. Користићемо га да пронађемо највеће и најмање податке или вредности у скупу података, респективно. Ова функција ће повући све податке унутар скупа података, проналазећи најмањи и највећи бројеви. Они су у стању да пронађу други најмањи или највећи, трећи највећи или најмањи и тако даље.
Корак 1:
- Прво, користите следећу формулу у ћелији Е5 са великом функцијом .
=LARGE($C$5:$C$16,1)
-
- Дакле, из 12 вредности, можете видети прву највећу вредност која је 780 .
2. корак:
- Након тога, у ћелију Г5 , запишите следећу формулу да бисте пронашли најмању вредност.
=SMALL($C$5:$C$16,1)
- Коначно, од 12 вредности, можете видети 1. најмања вредност 110 .
- Када сазнате све тражене вредности, можете лако да укажете на све одступнике у скупу података.
Закључак
То је крај овог чланка. Надам се да ће вам овај чланак бити од помоћи. Након што прочитате овај чланак, моћи ћете да израчунате одступања у Екцел-у користећи било коју од метода. Молимо поделите сва додатна питања или препоруке санас у одељку за коментаре испод.