Jak usunąć wartości odstające w Excelu (3 sposoby)

  • Udostępnij To
Hugh West

Znajdowanie wartości odstających i ich usuwanie jest bardzo częstym zadaniem przy analizie danych w statystyce, eksploracji danych, uczeniu maszynowym itp. Istnieje wiele sposobów na znalezienie wartości odstających w zbiorze danych, ale proces ich usuwania nie jest tak łatwy do znalezienia. W tym artykule pokażemy Ci, jak usuwanie wartości odstających w programie Excel .

Pobierz Workbook

Darmowy ćwiczeniowy zeszyt Excela można pobrać stąd.

Remove Outliers.xlsx

Czym są wartości odstające w programie Excel?

An wynik odstający Innymi słowy, wartości odstające to wartości, które są znacznie wyższe lub niższe od pozostałych wartości w zbiorze danych.

Pomyśl o meczu krykieta, w którym wszyscy pałkarze zdobyli około 50, ale tylko jeden batsman zdobył stulecie (100), a inny batsman wyszedł na 0. Te 100 i 0 wyników to wartości skrajne w tym meczu.

Wartości odstające są problematyczne, ponieważ mogą przekrzywić wynik analizy danych i wystąpić mylące wyniki. Dlatego lepiej jest znaleźć wartości odstające i usunąć je, aby mieć gładki zbiór danych.

3 Sposoby na usunięcie wartości odstających w programie Excel

W tej części dowiesz się, jak usuwanie wartości odstających z twojego zbioru danych na 3 różne sposoby. Usuwanie wartości odstających to skomplikowany proces, więc przeczytaj uważnie cały artykuł.

1) Wykorzystanie funkcji Excela do obliczenia średniej bez wartości odstających

Excel Funkcja TRIMMEAN może być użyty do obliczenia średniej danego zestawu danych z wyłączeniem wartości odstających. Punkty danych do wykluczenia są podawane jako procent. Wartość procentowa może być wprowadzona w formacie dziesiętnym lub procentowym.

Składnia do obliczenia średniej bez wartości odstających to,

=TRIMMEAN(tablica, procent)

Tutaj,

  • macierz = Zakres danych do przycięcia i obliczenia średniego wyniku
  • procent = liczba punktów danych do wykluczenia

Zobaczmy, jak zaimplementować tę funkcję, aby obliczyć wyniki z usuniętymi wartościami odstającymi.

Rozważmy powyższy obrazek, mamy dane z Komórka B5 do B14 . tutaj większość liczb mieści się w przedziale od 20 do 27, ale dwie wartości -. 0 i 100 - są dalekie od tych wartości. Więc to są te odchylenia w naszym zbiorze danych.

Dla naszego zbioru danych, wzór do obliczenia średniej (average) bez wartości odstających w Excelu TRIMMEAN funkcja to,

=TRIMMEAN(B5:B14,0.2)

Tutaj,

  • B5:B14 = Zakres danych do przycięcia i obliczenia średniego wyniku
  • 0.2 (lub 20%) = liczba punktów danych do wyłączenia

Jeśli jakakolwiek liczba w zbiorze danych wypadnie o 20% poza resztę, to ta liczba zostanie nazwana odstającą.

Jeśli napiszesz formułę zgodną z twoim zestawem danych i naciśniesz Wejdź na stronę , dostaniesz obliczona średnia bez wartości odstających dla twojego zbioru danych. W naszym przypadku, Komórka E6 posiada obliczoną średnią, która wynosi 23.50 .

Aby sprawdzić, czy odpowiedź jest poprawna, czy nie, uruchamiamy Funkcja AVERAGE w Komórka E5 który zwraca średnią ( 28.80 ) wszystkich wartości z zakresu B5:B14 . i w Komórka E7 , uruchamiamy kolejny ŚREDNIA wprowadzając ręcznie wszystkie komórki oprócz tych, które przechowują wartości odstające, i otrzymałem zwrot w postaci 23.50 jako wynik.

Możemy więc powiedzieć, że TRIMMEAN Funkcja może z powodzeniem usunąć wartości odstające z danego zbioru danych podczas obliczania średniej w Excelu.

Read More: Jak wyczyścić formułę w programie Excel (7+ metod)

2. usuwanie wartości odstających z zestawu danych i wykresu liniowego w programie Excel

Zwróć uwagę na poniższy rysunek.Mamy pewne dane, na podstawie których stworzyliśmy wykres liniowy.Z wykresu liniowego możemy łatwo zauważyć, że w w punktach 4 i 8 mamy nasze wartości skrajne .

Teraz zobaczymy, jak możemy wygładzić wykres liniowy, usuwając wartości odstające ze zbioru danych.

W innej komórce (w naszym przypadku jest to. Komórka H6 ), napisz następujący wzór,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Tutaj,

  • C6 = Komórka, która zawiera pierwsze dane w zbiorze danych
  • C5 = Komórka powyżej pierwszej komórki z danymi
  • C7 = Komórka poniżej pierwszej komórki z danymi
  • $E$6 = Różnica między punktami danych.

Patrząc na nasze dane, wydaje się, że gdy punkt danych jest różnić się 10 jednostek od innych, jest oznaczony jako wynik odstający . So we put 10 w Komórka E6 i uczynić go Bezwzględne odniesienie do komórki tak, że ta komórka będzie stała podczas skanowania i obliczania przez cały zbiór danych.

Po naciśnięciu Wejdź na stronę widać, że pierwsze dane nadal pojawiają się w komórce wynikowej H6 Wszystko, co trzeba było zrobić, to skonstruować formułę, abyśmy mogli przeciągnąć Uchwyt do napełniania aby zastosować formułę do pozostałych komórek.

Teraz przeciągnij wiersz w dół za pomocą Uchwyt do napełniania i zobaczysz, że komórki, w których znajdowały się wartości skrajne, są teraz wypełnione #N/A .

I spójrz teraz na wykres liniowy, jest to teraz spłaszczony wykres bez żadnych odstających wartości w nim.

Podział formuły

=IF(

Ponieważ zamierzamy porównywać wartości, na podstawie których będziemy wyciągać wynik, inicjujemy formułę znakiem JEŚLI stan.

=IF(AND(

Porównamy bieżący punkt danych z komórką powyżej i poniżej. I jeśli oba porównania są prawdziwe, tylko wtedy pokażemy punkt danych jako wynik. Tak więc, ponieważ musimy mieć do czynienia z porównaniami "Both", więc powinniśmy użyć funkcji Funkcja AND .

=IF(AND(ABS(

Kiedy odejmujemy punkty danych, niektóre dane mogą wyrzucać wartości ujemne. A my nie chcemy mieć do czynienia z wartościami ujemnymi, ponieważ wartości ujemne zawsze będą sprzeczne z warunkiem "usuwania danych, gdy różnica wynosi 10". Tak więc, aby upewnić się, że zawsze mamy pozytywne wyniki, musimy zawinąć porównania w an Funkcja wartości bezwzględnej .

=IF(AND(ABS(C6-C5)>$E$6

Tutaj rozpoczęliśmy nasze pierwsze porównanie. Po prostu odejmujemy bieżącą wartość od wartości powyżej i sprawdzamy, czy wynik jest większy od poziomu różnicy zapisanego w Komórka E6 i uczynił z komórki Odniesienie bezwzględne aby utrzymać wartość komórki w stanie zablokowanym.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)

Następnie druga część porównania, która jest oddzielona przecinkiem. Będzie porównywać bieżący punkt danych z następnym punktem danych.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Teraz stawiamy przecinek i ustalamy, żeby postawić Funkcja NA tam, jeśli obie ORAZ funkcje są prawdziwe.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

A jeśli ORAZ funkcja nie jest prawdziwa, to chcemy zwrócić rzeczywisty punkt danych jako JEŚLI Fałszywe wartości. Wpisujemy więc przecinek i przekazujemy numer referencyjny komórki C6 tam.

Read More: Jak usunąć walidację danych w Excelu (5 sposobów)

Podobne lektury

  • Jak usunąć nagłówek w programie Excel (4 metody)
  • Usuń linie przerywane w Excelu (5 szybkich sposobów)
  • Jak usunąć siatkę z programu Excel (6 prostych metod)
  • Usuwanie obramowań w Excelu (4 szybkie sposoby)
  • Jak usunąć tryb zgodności w programie Excel (2 proste sposoby)

3. ręczne usuwanie wartości odstających w programie Excel

Innym łatwym sposobem na wyeliminowanie wartości odstających w programie Excel jest, po prostu posortuj wartości swojego zestawu danych i ręcznie usuń górne i dolne wartości z niego.

Aby posortować dane,

  • Wybierz zbioru danych.
  • Idź do Sortowanie & Filtr w Edycja i wybrać Sortuj od najmniejszego do największego lub Sortuj od największego do najmniejszego .

  • W naszym przypadku wybraliśmy Sortuj od najmniejszego do największego Sortuje on liczby w naszym zbiorze danych w porządku rosnącym, umieszczając najmniejsze z nich na górze, a największe na dole.

Teraz wystarczy ręcznie usunąć te dane, aby zestaw danych wartości odstających był wolny.

Nie zalecamy stosowania tego procesu podczas pracy z dużym zbiorem danych. Kiedy twój zbiór danych jest mały i łatwiejszy do przeglądania, tylko wtedy możesz zastosować tę procedurę, w przeciwnym razie nie wdrażaj tego.

Read More: Jak usunąć sortowanie w programie Excel (3 proste metody)

Wniosek

Ten artykuł pokazał, jak usuwać wartości odstające w Excelu. Mam nadzieję, że ten artykuł okazał się dla Ciebie bardzo korzystny. Zapraszam do zadawania pytań, jeśli masz jakieś pytania dotyczące tematu.

Hugh West jest bardzo doświadczonym trenerem i analitykiem Excela z ponad 10-letnim doświadczeniem w branży. Posiada tytuł licencjata w dziedzinie rachunkowości i finansów oraz tytuł magistra administracji biznesowej. Hugh ma pasję do nauczania i opracował unikalne podejście do nauczania, które jest łatwe do naśladowania i zrozumienia. Jego specjalistyczna wiedza na temat programu Excel pomogła tysiącom studentów i profesjonalistów na całym świecie doskonalić swoje umiejętności i osiągać doskonałe wyniki w karierze. Za pośrednictwem swojego bloga Hugh dzieli się swoją wiedzą ze światem, oferując bezpłatne samouczki programu Excel i szkolenia online, aby pomóc osobom indywidualnym i firmom w pełni wykorzystać swój potencjał.