Змест
Для правядзення статыстычных вылічэнняў на даных з набору даных можа спатрэбіцца вызначыць выкіды. Вы можаце знайсці выкіды з велізарных набораў даных з дапамогай Microsoft Excel рознымі спосабамі. У гэтай публікацыі мы пакажам вам, як вылічыць выкіды ў Microsoft Excel, выкарыстоўваючы пяць розных спосабаў.
Спампуйце вучэбны сшытак
Вы можаце загрузіць бясплатны сшытак Excel адсюль і практыкавацца самастойна .
Знайсці Outliers.xlsx
5 зручных падыходаў для вылічэння выкідаў у Excel
Выкіды гэта значэнні даных якія значна адрозніваюцца ад астатніх значэнняў даных у наборы даных. Іншымі словамі, выкіды - гэта незвычайныя значэнні. Яны або выключна высокія або празмерна нізкія у параўнанні з іншымі значэннямі ў наборы даных. Выяўленне выкідаў жыццёва важна ў статыстычных разліках, паколькі яны ўплываюць на вынікі нашага аналізу даных.
Напрыклад, у вас ёсць набор даных, які паказвае штодзённы даход дванаццаці чалавек. Цяпер вам трэба вылічыць выкіды з дапамогай Microsoft Excel. Тут я пакажу вам пяць простых спосабаў зрабіць гэта.
1. Выкарыстоўвайце Sort & Фільтр для вылічэння выкідаў у Excel
Вы можаце вылічыць выкіды з невялікага набору даных, выкарыстоўваючы Сартаваць & Каманда Filter у Excel. Калі вы хочаце вылічыць выкіды з дапамогай функцыі сартавання і фільтрацыі, вы можаце зрабіць гэта, прытрымліваючыся інструкцыйкрокі ніжэй.
Крок 1:
- Спачатку абярыце загаловак слупка ў вашым наборы даных Excel, які вы хочаце адсартаваць. Напрыклад, у дадзеным наборы даных у загалоўку слупка файла пад назвай Дзённы даход (выбіраецца ячэйка C40 ).
Крок 2:
- Затым націсніце Дадому укладка на стужцы і перайдзіце да групы Рэдагаванне .
Крок 3:
- Пасля гэтага ў групе Рэдагаванне націсніце Сартаваць & Каманда Filter і націсніце Custom Sort .
Крок 4:
- Затым адкрыецца новае дыялогавае акно з назвай Сартаваць . Ва ўсплываючым дыялогавым акне абярыце Штодзённы Даход у Сартаваць па і ад найменшага да самага вялікага у выпадальным спісе «Парадак». Пасля гэтага націсніце ОК .
Крок 5:
- Нарэшце, слупок Дзённы даход будзе адсартаваны такім чынам, з найменшымі значэннямі ўверсе і самымі вялікімі ўнізе. Пасля выканання працэдуры шукайце любыя парушэнні ў дыяпазоне даных, каб вызначыць выкіды.
Напрыклад, першыя два значэнні ў слупку значна ніжэйшыя, а апошнія два значэнні ў слупку значна вышэйшыя за астатнія значэнні ў наборы даных, як паказана ўпрыведзены вышэй вынік.
Дадатковая інфармацыя: Як знайсці выкіды ў рэгрэсійным аналізе ў Excel (3 простыя спосабы)
2. Ужыць функцыю QUARTILE да Вылічыце выкіды ў Excel
Функцыя QUARTILE - гэта больш навуковы спосаб вылічыць выкіды ў Excel. Вы можаце выкарыстоўваць гэтую функцыю, каб падзяліць наборы дадзеных на чатыры роўныя часткі. Наступныя значэнні будуць вернуты функцыяй QUARTILE :
- мінімальнае значэнне.
- 1-ы квартыль (Q1- найменшыя 25% дадзенага набору даных).
- 2-і квартыль (Q2-наступны самыя нізкія 25% набору даных).
- 3-ці квартыль (Q3- другія па велічыні 25% набору даных).
- максімальнае значэнне.
Сінтаксіс функцыі КВАРТЫЛЬ у Excel:
=КВАРТИЛЬ( array,quart)
Сінтаксіс змяшчае наступныя аргументы:
- a rray : дыяпазон ячэек зададзенага набор даных, для якога вы будзеце разлічваць значэнне квартыля.
- кварт: Указвае, якое значэнне павінна быць вернута.
Каб вылічыць выкіды для прыведзенага вышэй набору даных з дапамогай функцыі QUARTILE, выканайце наступныя дзеянні.
Крок 1:
- Па-першае, увядзіце наступную формулу для вызначэння 1-га квартыля ( Q1 ), прыведзенага ніжэй.
=QUARTILE($C$5:$C$16,1)
Крок 2:
- Тутформула для разліку 3-га квартыля ( Q3 ) прыведзена ніжэй.
=QUARTILE($C$5:$C$16,3)
Крок 3:
- Па-трэцяе, вы павінны вызначыць IQR, які Міжквартыльны дыяпазон (ён прадстаўляе 50% дадзеных з дыяпазону набору даных, які трапляе ў першы і трэці квартылі) шляхам аднімання Q1 (у ячэйцы G4 ) з Q3 (у ячэйцы G5 ). Увядзіце наступную формулу, каб вылічыць адніманне.
=G5-G4
Крок 4:
- Пасля знаходжання IQR, далей вы павінны вызначыць верхні і ніжняя Таму што верхняя і ніжняя ліміты будуць утрымліваць большую частку даных у межах набор даных. Запішыце наступную формулу для разліку верхняй мяжы.
=G5+(1.5*G6)
Крок 5:
- Затым, каб вылічыць ніжнюю мяжу, запішыце наступную формулу.
=G4-(1.5*G6)
Крок 6:
- Нарэшце, пасля завяршэння папярэдняга кроку вы можаце вызначыць выкіды для кожнага данага значэнне. На аркушы Excel увядзіце наступную формулу з дапамогай функцыі АБО ў ячэйцы D5 .
=OR(C5$G$7)
- Гэта формула дапаможа ідэнтыфікаваць даныя, якія не ўваходзяць у межы вышэйзгаданага дыяпазону. Пасля апрацоўкі стформула пакажа TRUE Statement , калі канкрэтныя даныя з'яўляюцца выкідам, і FALSE калі гэта не так. Двойчы пстрыкніце на інструменце аўтазапаўнення ў ячэйцы C5, каб скапіяваць формулу ў астатнія ячэйкі у слупку C . Такім чынам, вы можаце назіраць сапраўднае значэнне побач з усімі выкідамі ў вашым наборы даных.
3. Аб'яднайце функцыі AVERAGE і STDEV.P для вылічэння выкідаў на аснове сярэдняга і стандартнага адхілення
A стандартнае адхіленне (ці σ ) - гэта метрыка для вызначэння размеркавання даных адносна сярэдняга значэння ўсяго набору даных. Калі стандартнае адхіленне нізкае, даныя групуюцца вакол сярэдняга значэння, а калі стандартнае адхіленне высокае, даныя больш разрозненыя. Каб вылічыць выкіды з дапамогай сярэдняга і стандартнага адхілення , вы можаце выканаць наступныя крокі.
Крок 1:
- Спачатку выкарыстоўвайце той жа набор даных, паказаны ў пачатку гэтага артыкула, а затым вылічыце сярэдняе значэнне і стандартнае адхіленне. Каб вылічыць сярэдняе значэнне, увядзіце наступную формулу з функцыяй AVERAGE у ячэйцы G5 .
=AVERAGE(C5:C16)
Крок 2:
- Каб вылічыць стандартнае адхіленне, устаўце наступную формулу з STDEV Функцыя .P у ячэйцы G6 .
=STDEV.P(C5:C16)
Крок 3:
- Далей вы вылічыцеверхняя мяжа для далейшага прасоўвання ў працэсе. У ячэйцы G7 вылічыце ніжнюю мяжу, выкарыстоўваючы наступную формулу.
=G5-(1.25*G6)
Крок 4:
- І ў ячэйцы G8 вылічыце верхнюю мяжу па наступнай формуле
=G5+(1.5*G6)
Крок 5:
- Пасля гэтага , каб вылічыць, ці існуюць якія-небудзь выкіды, увядзіце наступную формулу ў ячэйку D5 .
=OR(C5$G$8)
- Такім чынам, формула верне значэнне TRUE калі канкрэтныя даныя ў патрэбнай ячэйцы з'яўляюцца выкідам і ХЛУСНЯ.
- Двойчы пстрыкніце на інструменце Аўтазапаўнення ў ячэйцы D5 каб скапіяваць формулу ў астатнія вочкі ў слупку D . Такім чынам, вы можаце знайсці ўсе астатнія выкіды ў вашым наборы даных.
Дадатковая інфармацыя: Як знайсці выкіды са стандартным адхіленнем у Excel (з дапамогай хуткіх крокаў)
4. Устаўце Z-паказчык для вылічэння выкідаў у Excel
Z-паказчык з'яўляецца адным з найбольш часта выкарыстоўваных паказчыкаў для выяўленне выкідаў. Гэты метад паказвае, наколькі далёкія канкрэтныя даныя ад сярэдняга значэння набору даных адносна іх стандартнага адхілення. Каб вылічыць выкіды з дапамогай Z-балла у Excel, вы можаце ўбачыць крокі, апісаныя ніжэй.
Крок 1:
- Па-першае, вазьміце патрэбны набор даных.
Крок2:
- Па-другое, у ячэйцы H5, увядзіце наступную формулу для разліку сярэдняга для дадзеных дадзеных.
=AVERAGE(C5:C16)
Крок 3:
- Па-трэцяе, вылічыце стандартнае адхіленне дадзенага набору даных у ячэйцы H6 з дапамогай наступнай формулы.
=STDEV.P(C5:C16)
Крок 4:
- Пасля гэтага , вы павінны вызначыць Z -бал для кожнага значэння даных. Для гэтага выкарыстоўвайце формулу, прыведзеную ніжэй.
=(C5-$H$5)/$H$6
Крок 5:
- Пасля разліку ўсіх Z-значэнняў, вы ўбачыце, што дыяпазон Z-значэнняў знаходзіцца паміж -1,44 і 13 . Такім чынам, мы лічым значэнні Z-паказчыка меншымі за -1,2 або большымі за +1,8 для межаў выкідаў.
- Затым увядзіце наступную формулу ў ячэйку E 5 .
=OR((D51.8))
- Нарэшце, формула верне значэнне TRUE , калі канкрэтныя даныя з'яўляюцца выкідам, і верне FALSE
- Двойчы пстрыкніце на ячэйцы E5 каб выкарыстоўваць аўтазапаўненне маркер запаўнення інструмента для капіявання формулы ў астатнія вочкі ў слупку E . Такім чынам, вы можаце знайсці ўсе астатнія выкіды ў вашым наборы даных.
Больш падрабязна: Як знайсці выкіды з дапамогай Z-ацэнкі ў Excel (з QuickКрокі)
5. Аб'яднайце функцыі LARGE і SMALL для пошуку выкідаў у Excel
Функцыя LARGE і функцыя SMALL у Excel мець супрацьлеглыя аперацыі. Мы будзем выкарыстоўваць яго для пошуку найбольшых і найменшых даных або значэнняў у наборы даных адпаведна. Гэтая функцыя будзе выцягваць усе дадзеныя ў наборы даных, знаходзячы найменшыя і самыя вялікія лічбы. Яны здольныя знайсці другі па памеры або самы вялікі, трэці па велічыні або самы маленькі і гэтак далей.
Крок 1:
- Спачатку выкарыстоўвайце наступную формулу ў ячэйцы E5 з функцыяй LARGE .
=LARGE($C$5:$C$16,1)
-
- Такім чынам, з 12 значэнняў вы можаце ўбачыць 1-е па велічыні значэнне, якое складае 780 .
Крок 2:
- Пасля гэтага ў ячэйцы G5 запішыце наступную формулу, каб знайсці найменшае значэнне.
=SMALL($C$5:$C$16,1)
- Нарэшце, з 12 значэнняў вы можаце ўбачыць 1-е найменшае значэнне 110 .
- Пасля таго, як вы знойдзеце ўсе неабходныя значэнні, вы зможаце лёгка паказаць любыя выкіды ў наборы даных.
Выснова
Вось і канец гэтага артыкула. Я спадзяюся, што вы знойдзеце гэты артыкул карысным. Прачытаўшы гэты артыкул, вы зможаце вылічыць выкіды ў Excel, выкарыстоўваючы любы з метадаў. Калі ласка, падзяліцеся любымі далейшымі пытаннямі або рэкамендацыямі знам у раздзеле каментарыяў ніжэй.