Как да премахнем отклоненията в Excel (3 начина)

  • Споделя Това
Hugh West

Намирането на отклонения и премахването им е много често срещана задача за анализ на данни в статистиката, извличането на данни, машинното обучение и т.н. Има толкова много начини, по които можете да намерите отклонения в набора от данни, но процесът на премахването им не е толкова лесен за намиране. В тази статия ще ви покажем как да премахване на отклонения в Excel .

Изтегляне на работна тетрадка

Можете да изтеглите безплатната учебна тетрадка на Excel от тук.

Премахване на отклоненията.xlsx

Какво представляват отклоненията в Excel?

Един отклонение С други думи, отклоненията са стойности, които са значително по-високи или по-ниски от останалите стойности в дадена съвкупност от данни.

Помислете за мач по крикет, в който всички батъри са вкарали около 50 точки, но само един батърист е вкарал век (100), а друг батърист е излязъл с 0 точки. 100-те и 0-те точки са отклоненията в този мач.

Извънредните стойности са проблематични, тъй като те могат да изкривят резултата от анализа на данните и да доведат до подвеждащи резултати. Затова е по-добре да се открият извънредните стойности и да се отстранят, за да се получи гладка съвкупност от данни.

3 начина за отстраняване на отклонения в Excel

В този раздел ще научите как да изтриване на отклонения Отстраняването на отклоненията е сложен процес, затова прочетете внимателно цялата статия.

1. Използване на функцията на Excel за изчисляване на средната стойност без отклонения

Excel Функция TRIMMEAN може да се използва за изчисляване на средната стойност на дадена съвкупност от данни, като се изключат отклоненията. Точките данни, които трябва да се изключат, се подават като процент. Стойността на процента може да се въведе в десетичен формат или в процентен формат.

Синтаксисът за изчисляване на средната стойност без отклонения е,

=TRIMMEAN(масив, проценти)

Тук,

  • масив = Обхват на данните за изрязване и изчисляване на средния резултат
  • процент = Броят на точките с данни, които се изключват

Нека видим как да приложим тази функция, за да изчислим резултатите с премахнати отклонения.

Разгледайте горната картина. Имаме данни от Клетка B5 до B14 . Тук повечето числа са между 20 и 27, но две стойности - 0 и 100 - са далеч от тези стойности. Така че това са отклонения в нашия набор от данни.

За нашата съвкупност от данни формулата за изчисляване на средната стойност без отклоняващите се стойности с Excel TRIMMEAN функция е,

=TRIMMEAN(B5:B14,0.2)

Тук,

  • B5:B14 = Обхват на данните за изрязване и изчисляване на средния резултат
  • 0.2 (или 20%) = Броят на точките от данни, които се изключват

Ако някое от числата в набора от данни се отклонява с 20 % от останалите, то това число ще се нарече отклонение.

Ако напишете формулата в съответствие с набора от данни и натиснете Въведете , ще получите изчислена средна стойност без отклонения за вашия набор от данни. В нашия случай, Клетка E6 е изчислената средна стойност, която е 23.50 .

За да проверим дали отговорът е верен или не, изпълняваме Функция AVERAGE в Клетка E5 която връща средната стойност ( 28.80 ) на всички стойности в диапазона B5:B14 . И в Клетка E7 , пускаме още един СРЕДНА СТОЙНОСТ чрез ръчно въвеждане на всички клетки, с изключение на тези, които съдържат стойности на отклонения, и получи връщане на 23.50 като резултат.

Така че можем да кажем, че TRIMMEAN може успешно да премахне отклоненията от дадена съвкупност от данни, докато изчислява средната стойност в Excel.

Прочетете още: Как да изчистите формула в Excel (7+ метода)

2. Премахване на отклоненията от набора от данни и линейната диаграма в Excel

Обърнете внимание на следната картина. Имаме някои данни, въз основа на които създадохме линейна графика. От линейната графика лесно можем да видим, че в точките данни 4 и 8 са нашите отклонения .

Сега ще видим как можем да изгладим линейната диаграма, като премахнем отдалечените стойности от набора от данни.

В друга клетка (в нашия случай това е Клетка H6 ), запишете следната формула,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Тук,

  • C6 = Клетка, която съдържа първите данни в набора от данни
  • C5 = Клетка над първата клетка за данни
  • C7 = Клетка под първата клетка за данни
  • $E$6 = Разлика между точките с данни.

Поглеждайки към нашите данни, изглежда, че когато дадена точка от данни е различават се 10 единици от други, се определя като отклонение . Така че ние поставихме 10 в Клетка E6 и го превърнете в Абсолютна референция на клетката така че тази клетка да бъде фиксирана по време на сканирането и изчисляването на целия набор от данни.

След натискане на Въведете , можете да видите, че първите данни все още се появяват в клетката с резултата H6 Всичко, което трябва да направите тук, е да конструирате формулата, за да можем да плъзнем Дръжка за пълнене за да приложите формулата към останалите клетки.

Сега плъзнете реда надолу с Дръжка за пълнене и ще видите, че клетките, в които са се намирали отклоненията, сега са запълнени с #N/A .

Погледнете линейната диаграма - сега тя е сплескана и няма никакви отдалечени стойности.

Разбивка на формулата

=IF(

Тъй като ще сравняваме стойности, въз основа на които ще извличаме резултата, започваме формулата със символа IF състояние.

=IF(AND(

Ще сравним текущата точка от данни с клетката над и под нея. И ако и двете сравнения са верни, само тогава ще покажем точката от данни като резултат. Така че, тъй като трябва да се справим с "Both" сравнения, трябва да използваме Функция AND .

=IF(AND(ABS(

Когато изваждаме точки с данни, някои данни могат да хвърлят отрицателни стойности. А ние не искаме да се занимаваме с отрицателни стойности, тъй като отрицателните стойности винаги ще противоречат на условието "премахване на данни, когато разликата е 10". Така че, за да сме сигурни, че винаги ще имаме положителни резултати, трябва да обвием сравненията в Функция на абсолютната стойност .

=IF(AND(ABS(C6-C5)>$E$6

Тук започнахме първото си сравнение. Просто изваждаме текущата стойност от горната стойност и проверяваме дали резултатът е по-голям от нивото на разликата, записано в Клетка E6 и превърна клетката в Абсолютна референция за да запазите стойността на клетката заключена.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

Следва втората част на сравнението, която е разделена със запетая. Тя ще сравни текущата точка от данни със следващата точка от данни.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Сега поставяме запетая и определяме да поставим Функция NA в него, ако и двете И функциите са верни.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

И ако И не е вярна, тогава искаме да върнем действителната точка от данни като IF Така че въвеждаме запетая и предаваме референтния номер на клетката C6 в него.

Прочетете още: Как да премахнете валидирането на данни в Excel (5 начина)

Подобни четива

  • Как да премахнете заглавие в Excel (4 метода)
  • Премахване на прекъснати линии в Excel (5 бързи начина)
  • Как да премахнете решетката от Excel (6 лесни метода)
  • Премахване на граници в Excel (4 бързи начина)
  • Как да премахнете режима на съвместимост в Excel (2 лесни начина)

3. Премахване на отклоненията ръчно в Excel

Друг лесен начин за премахване на отклоненията в Excel е просто да сортирате стойностите на набора от данни и ръчно да изтриете най-горните и най-долните стойности.

Сортиране на данните,

  • Изберете набора от данни.
  • Отидете на Сортиране и филтриране в Редактиране на и изберете една от следните групи Сортиране от най-малък към най-голям или Сортиране от най-голям към най-малък .

  • В нашия случай избрахме Сортиране от най-малък към най-голям . Той подреди числата в нашия набор от данни във възходящ ред, като постави най-малките числа най-отгоре, а най-големите - най-отдолу.

Сега просто ръчно изтрийте тези данни, за да освободите набора от данни от отдалечени стойности.

Не препоръчваме този процес да се прилага при работа с голям набор от данни. Когато наборът от данни е малък и по-лесен за разглеждане, само тогава можете да приложите тази процедура, в противен случай не я прилагайте.

Прочетете още: Как да премахнете сортирането в Excel (3 лесни метода)

Заключение

Тази статия ви показва как да отстраняване на отклоненията в Excel. Надявам се, че тази статия е била много полезна за вас. Не се колебайте да питате, ако имате някакви въпроси по темата.

Хю Уест е опитен обучител и анализатор на Excel с над 10 години опит в индустрията. Има бакалавърска степен по счетоводство и финанси и магистърска степен по бизнес администрация. Хю има страст към преподаването и е разработил уникален подход на преподаване, който е лесен за следване и разбиране. Неговите експертни познания по Excel са помогнали на хиляди студенти и професионалисти по целия свят да подобрят уменията си и да постигнат отлични резултати в кариерата си. Чрез своя блог Хю споделя знанията си със света, като предлага безплатни уроци за Excel и онлайн обучение, за да помогне на хората и фирмите да достигнат пълния си потенциал.