Cách loại bỏ các giá trị ngoại lệ trong Excel (3 cách)

  • Chia Sẻ Cái Này
Hugh West

Tìm các giá trị ngoại lệ và loại bỏ chúng là một nhiệm vụ rất phổ biến để phân tích dữ liệu trong thống kê, khai thác dữ liệu, học máy, v.v. Có rất nhiều cách để bạn có thể tìm thấy các giá trị ngoại lệ trong tập dữ liệu của mình nhưng quá trình loại bỏ chúng không dễ dàng như vậy tìm thấy. Trong bài viết này, chúng tôi sẽ chỉ cho bạn cách xóa các giá trị ngoại lệ trong Excel .

Tải xuống Sổ làm việc

Bạn có thể tải xuống sổ làm việc Excel thực hành miễn phí từ tại đây.

Xóa Outliers.xlsx

Outliers trong Excel là gì?

Một ngoại lệ là giá trị nằm ngoài giá trị trung bình hoặc trung bình của tập dữ liệu. Nói cách khác, giá trị ngoại lệ là các giá trị cao hơn hoặc thấp hơn đáng kể so với các giá trị còn lại trong tập dữ liệu.

Hãy nghĩ về một trận đấu cricket trong đó tất cả các vận động viên đánh bóng ghi được khoảng 50 điểm nhưng chỉ có một vận động viên đánh bóng ghi được điểm kỷ lục (100 ) và một vận động viên ném bóng khác bị điểm 0. Điểm số 100 và 0 đó là ngoại lệ trong trận đấu này.

Các ngoại lệ có vấn đề vì chúng có thể làm sai lệch kết quả phân tích dữ liệu và dẫn đến kết quả sai lệch. Vì vậy, tốt hơn là bạn nên tìm các giá trị ngoại lệ và loại bỏ chúng để có một tập dữ liệu mượt mà.

3 Cách để loại bỏ các giá trị ngoại lệ trong Excel

Trong phần này, bạn sẽ tìm hiểu cách xóa các giá trị ngoại lai khỏi tập dữ liệu của bạn theo 3 cách khác nhau. Loại bỏ các giá trị ngoại lệ là một quá trình phức tạp, vì vậy hãy đọc kỹ toàn bộ bài viết.

1. Sử dụng hàm Excel để tính trung bình mà không cầnGiá trị ngoại lệ

Có thể sử dụng Excel Hàm TRIMMEAN để tính giá trị trung bình của một tập dữ liệu nhất định trong khi loại trừ giá trị ngoại lệ. Các điểm dữ liệu cần loại trừ được cung cấp dưới dạng phần trăm. Giá trị phần trăm có thể được nhập dưới dạng định dạng thập phân hoặc định dạng phần trăm.

Cú pháp để tính giá trị trung bình không có giá trị ngoại lệ là,

=TRIMMEAN(mảng, phần trăm)

Ở đây,

  • mảng = Phạm vi dữ liệu để cắt và tính kết quả trung bình
  • phần trăm = Phần trăm số lượng điểm dữ liệu cần loại trừ

Hãy xem cách triển khai chức năng này để tính toán kết quả với các giá trị ngoại lệ đã bị loại bỏ.

Hãy xem xét hình trên. Chúng tôi có dữ liệu từ Ô B5 đến B14 . Ở đây, hầu hết các số nằm trong khoảng từ 20 đến 27, nhưng hai giá trị – 0 và 100 – khác xa so với các giá trị đó. Vì vậy, đây là giá trị ngoại lệ trong tập dữ liệu của chúng tôi.

Đối với tập dữ liệu của chúng tôi, công thức tính giá trị trung bình (trung bình) không có giá trị ngoại lệ với hàm TRIMMEAN của Excel là,

=TRIMMEAN(B5:B14,0.2)

Ở đây,

  • B5:B14 = Phạm vi dữ liệu cần cắt và tính kết quả trung bình
  • 0.2 (hoặc 20%) = Số điểm dữ liệu cần loại trừ

Nếu bất kỳ số nào trong tập dữ liệu giảm 20% so với phần còn lại của tập dữ liệu , thì số đó sẽ được gọi là giá trị ngoại lệ.

Nếu bạn viết công thức theo tập dữ liệu của mình và nhấn Enter , bạn sẽ nhận được giá trị trung bình được tính toán mà không có giá trị ngoại lệ cho tập dữ liệu của bạn. Trong trường hợp của chúng tôi, Ô E6 giữ giá trị trung bình được tính là 23,50 .

Để kiểm tra xem câu trả lời có đúng hay không, chúng tôi chạy hàm AVERAGE trong Ô E5 trả về giá trị trung bình ( 28,80 ) của tất cả các giá trị trong phạm vi B5:B14 . Và trong Ô E7 , chúng tôi chạy một hàm AVERAGE khác bằng cách nhập thủ công tất cả các ô trừ những ô chứa giá trị ngoại lệ và nhận được kết quả là 23,50 .

Vì vậy, chúng ta có thể nói rằng hàm TRIMMEAN có thể loại bỏ thành công các giá trị ngoại lệ khỏi một tập dữ liệu nhất định trong khi tính toán giá trị trung bình trong Excel.

Đọc thêm: Cách xóa công thức trong Excel (hơn 7 phương pháp)

2. Xóa các giá trị ngoại lệ khỏi tập dữ liệu và biểu đồ đường trong Excel

Chú ý hình ảnh sau. Chúng tôi có một số dữ liệu dựa trên đó chúng tôi đã tạo biểu đồ đường. Từ biểu đồ đường, chúng ta có thể dễ dàng thấy rằng trong điểm dữ liệu 4 và 8, chúng ta có các giá trị ngoại lệ .

Bây giờ chúng ta sẽ xem cách chúng ta có thể làm mịn ra khỏi biểu đồ đường bằng cách xóa các giá trị nằm ngoài khỏi tập dữ liệu.

Trong một ô khác (trong trường hợp của chúng tôi là Ô H6 ), hãy viết công thức sau,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Ở đây,

  • C6 = Ô chứa dữ liệu đầu tiên trong tập dữ liệu
  • C5 = Ô bên trên ô dữ liệu đầu tiên
  • C7 = Ô bên dưới ô dữ liệu đầu tiên
  • $E$6 = Chênh lệch giữa các điểm dữ liệu .

Đang nhìndữ liệu của chúng tôi, có vẻ như khi một điểm dữ liệu khác 10 đơn vị so với các điểm khác, thì được chỉ định là ngoại lệ . Vì vậy, chúng tôi đặt 10 vào Ô E6 và biến nó thành Tham chiếu ô tuyệt đối để ô này sẽ cố định trong khi quét và tính toán qua toàn bộ tập dữ liệu.

Sau khi nhấn Enter , bạn có thể thấy dữ liệu đầu tiên vẫn xuất hiện trong ô kết quả H6 . Tất cả những gì bạn phải làm ở đây là xây dựng công thức để chúng tôi có thể kéo Fill Handle để áp dụng công thức cho các ô còn lại.

Bây giờ hãy kéo hàng xuống với Fill Handle và bạn sẽ thấy các ô chứa giá trị ngoại lệ hiện được lấp đầy bằng #N/A .

Và bây giờ hãy nhìn vào biểu đồ đường, đây hiện là biểu đồ phẳng không có bất kỳ giá trị bên ngoài nào trong đó.

Phân tích công thức

=IF(

Vì chúng tôi sẽ so sánh các giá trị dựa trên đó chúng tôi sẽ trích xuất kết quả, chúng tôi bắt đầu công thức bằng điều kiện IF .

=IF(AND(

Chúng ta sẽ so sánh điểm dữ liệu hiện tại với ô bên trên và ô bên dưới . Và nếu cả hai phép so sánh đều đúng thì chỉ khi đó chúng ta mới hiển thị điểm dữ liệu. Vì vậy, vì chúng ta cần xử lý phép so sánh “Cả hai” nên chúng ta nên sử dụng hàm AND .

=IF(AND(ABS(

Khi chúng tôi trừ các điểm dữ liệu, một số dữ liệu có thể đưa ra các giá trị âm. Và chúng tôi thực hiện khôngmuốn xử lý các giá trị âm vì các giá trị âm sẽ luôn mâu thuẫn với điều kiện “xóa dữ liệu khi chênh lệch là 10”. Vì vậy, để đảm bảo rằng chúng tôi luôn có kết quả khả quan, chúng tôi cần đưa các phép so sánh vào một hàm giá trị tuyệt đối .

=IF(AND(ABS(C6-C5)> ;$E$6

Ở đây chúng tôi bắt đầu so sánh đầu tiên. Chúng tôi chỉ cần trừ giá trị hiện tại với giá trị ở trên và xem liệu kết quả có lớn hơn mức chênh lệch được lưu trữ trong Ô E6 và biến ô thành Tham chiếu tuyệt đối để khóa giá trị ô.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6 -C7)>$E$6)

Tiếp theo, phần thứ hai của phép so sánh được phân tách bằng dấu phẩy. Phần này sẽ so sánh điểm dữ liệu hiện tại với điểm dữ liệu tiếp theo.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

Bây giờ chúng ta đặt dấu phẩy và xác định đặt Hàm NA vào đó nếu cả hai hàm AND đều đúng.

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

Và nếu hàm AND không đúng thì chúng ta muốn trả về điểm dữ liệu thực dưới dạng giá trị IF Sai. Vì vậy, chúng tôi gõ e trong dấu phẩy và chuyển số tham chiếu ô C6 vào đó.

Đọc thêm: Cách xóa xác thực dữ liệu trong Excel (5 cách)

Bài đọc tương tự

  • Cách xóa tiêu đề trong Excel (4 phương pháp)
  • Xóa các đường chấm trongExcel (5 cách nhanh chóng)
  • Cách xóa lưới khỏi Excel (6 phương pháp dễ dàng)
  • Xóa đường viền trong Excel (4 cách nhanh chóng)
  • Cách xóa Chế độ tương thích trong Excel (2 cách dễ dàng)

3. Loại bỏ các giá trị ngoại lệ theo cách thủ công trong Excel

Một cách dễ dàng khác để loại bỏ các giá trị ngoại lệ trong Excel là chỉ cần sắp xếp các giá trị của tập dữ liệu của bạn và xóa thủ công các giá trị trên cùng và dưới cùng khỏi tập dữ liệu đó.

Cách sắp xếp dữ liệu,

  • Chọn tập dữ liệu.
  • Chuyển đến Sắp xếp & Lọc trong nhóm Chỉnh sửa và chọn Sắp xếp từ nhỏ nhất đến lớn nhất hoặc Sắp xếp từ lớn nhất đến nhỏ nhất .

  • Trong trường hợp của chúng tôi, chúng tôi đã chọn Sắp xếp từ nhỏ nhất đến lớn nhất . Nó sắp xếp các số trong tập dữ liệu của chúng tôi theo thứ tự tăng dần, đặt số nhỏ nhất ở trên cùng và số lớn nhất ở dưới cùng.

Bây giờ, bạn chỉ cần xóa những dữ liệu đó theo cách thủ công để làm cho các giá trị bên ngoài tập dữ liệu trở nên miễn phí.

Chúng tôi khuyên bạn không nên làm theo quy trình này khi làm việc với tập dữ liệu lớn. Khi tập dữ liệu của bạn nhỏ và dễ xem hơn, chỉ khi đó bạn mới có thể áp dụng quy trình này, nếu không thì đừng thực hiện.

Đọc thêm: Cách xóa sắp xếp trong Excel ( 3 Phương pháp Đơn giản)

Kết luận

Bài viết này hướng dẫn bạn cách xóa các giá trị ngoại lệ trong Excel. Tôi hy vọng bài viết này đã rất hữu ích cho bạn. Vui lòng hỏi nếu bạn có bất kỳ câu hỏi nào liên quan đếnchủ đề.

Hugh West là một nhà phân tích và huấn luyện viên Excel giàu kinh nghiệm với hơn 10 năm kinh nghiệm trong ngành. Ông có bằng Cử nhân Tài chính Kế toán và bằng Thạc sĩ Quản trị Kinh doanh. Hugh có niềm đam mê giảng dạy và đã phát triển một phương pháp giảng dạy độc đáo, dễ hiểu và dễ theo dõi. Kiến thức chuyên môn về Excel của ông đã giúp hàng nghìn sinh viên và chuyên gia trên toàn thế giới cải thiện kỹ năng và xuất sắc trong sự nghiệp của họ. Thông qua blog của mình, Hugh chia sẻ kiến ​​thức của mình với mọi người, cung cấp các hướng dẫn Excel miễn phí và đào tạo trực tuyến để giúp các cá nhân và doanh nghiệp phát huy hết tiềm năng của họ.