วิธีลบ Outliers ใน Excel (3 วิธี)

  • แบ่งปันสิ่งนี้
Hugh West

การค้นหาค่าผิดปกติและการลบออกเป็นงานทั่วไปในการวิเคราะห์ข้อมูลทางสถิติ การขุดข้อมูล การเรียนรู้ของเครื่อง ฯลฯ มีหลายวิธีที่คุณสามารถหาค่าผิดปกติในชุดข้อมูลของคุณ แต่กระบวนการในการลบค่าผิดปกตินั้นไม่ง่ายนัก หา. ในบทความนี้ เราจะแสดงวิธีการ ลบค่าผิดปกติใน Excel

ดาวน์โหลดสมุดงาน

คุณสามารถดาวน์โหลดสมุดงาน Excel แบบฝึกหัดได้ฟรีจาก ที่นี่

ลบ Outliers.xlsx

Outliers ใน Excel คืออะไร

An Outlier เป็นค่าที่อยู่ห่างจากค่าเฉลี่ยหรือค่ามัธยฐานของชุดข้อมูล กล่าวอีกนัยหนึ่ง ค่าผิดปกติคือค่าที่สูงหรือต่ำกว่าค่าที่เหลือในชุดข้อมูลอย่างมาก

ลองนึกถึงการแข่งขันคริกเก็ตที่ผู้ตีทั้งหมดทำคะแนนได้ประมาณ 50 แต่มีผู้ตีลูกเพียงคนเดียวที่ทำคะแนนได้ในรอบศตวรรษ (100 ) และคนตีลูกอีกคนออกที่ 0 คะแนน 100 และ 0 นั้นคือค่าผิดปกติในนัดนี้

ค่าผิดปกติเป็นปัญหาเนื่องจากสามารถบิดเบือนผลการวิเคราะห์ข้อมูลและทำให้เกิดผลที่ผิดพลาดได้ ดังนั้นจึงเป็นการดีกว่าที่จะค้นหาค่าผิดปกติและนำออกเพื่อให้ชุดข้อมูลราบรื่น

3 วิธีในการลบค่าผิดปกติใน Excel

ในส่วนนี้ คุณจะได้เรียนรู้วิธีการ ลบค่าผิดปกติ จากชุดข้อมูลของคุณใน 3 วิธี การนำค่าผิดปกติออกนั้นเป็นกระบวนการที่ยุ่งยาก ดังนั้นโปรดอ่านบทความทั้งหมดอย่างละเอียด

1. การใช้ฟังก์ชัน Excel เพื่อคำนวณค่าเฉลี่ยโดยไม่ต้องค่าผิดปกติ

Excel ฟังก์ชัน TRIMMEAN สามารถใช้ในการคำนวณค่าเฉลี่ยของชุดข้อมูลหนึ่งๆ ในขณะที่ไม่รวมค่าผิดปกติ จุดข้อมูลที่จะแยกออกเป็นเปอร์เซ็นต์ ค่าเปอร์เซ็นต์สามารถป้อนเป็นรูปแบบทศนิยมหรือรูปแบบเปอร์เซ็นต์

ไวยากรณ์ในการคำนวณค่าเฉลี่ยโดยไม่มีค่าผิดปกติคือ

=TRIMMEAN(อาร์เรย์, เปอร์เซ็นต์)

ที่นี่

  • อาร์เรย์ = ช่วงของข้อมูลที่จะตัดแต่งและคำนวณผลลัพธ์เฉลี่ย
  • เปอร์เซ็นต์ = จำนวนจุดข้อมูลที่จะยกเว้น

มาดูวิธีใช้ฟังก์ชันนี้เพื่อคำนวณผลลัพธ์ด้วยค่าผิดปกติที่ลบออก

พิจารณารูปภาพด้านบน เรามีข้อมูลจาก เซลล์ B5 ถึง B14 ในที่นี้ ตัวเลขส่วนใหญ่อยู่ระหว่าง 20 ถึง 27 แต่ค่าสองค่า – 0 และ 100 – ห่างไกลจากค่าเหล่านั้น ดังนั้นนี่คือ ค่าผิดปกติ ในชุดข้อมูลของเรา

สำหรับชุดข้อมูลของเรา สูตรคำนวณค่าเฉลี่ย (ค่าเฉลี่ย) โดยไม่มีค่าผิดปกติด้วยฟังก์ชัน Excel TRIMMEAN คือ

=TRIMMEAN(B5:B14,0.2)

ที่นี่

  • B5:B14 = ช่วงของข้อมูลที่จะตัดแต่งและคำนวณผลลัพธ์เฉลี่ย
  • 0.2 (หรือ 20%) = จำนวนจุดข้อมูลที่จะยกเว้น

หากตัวเลขใดๆ ในชุดข้อมูลต่ำกว่าชุดข้อมูลที่เหลือ 20% ตัวเลขนั้นจะถูกเรียกว่าค่าผิดปกติ

หากคุณเขียนสูตรตามชุดข้อมูลของคุณและกด Enter คุณจะได้รับ ค่าเฉลี่ยที่คำนวณโดยไม่มีค่าผิดปกติ สำหรับชุดข้อมูลของคุณ ในกรณีของเรา เซลล์ E6 มีค่าเฉลี่ยที่คำนวณได้ซึ่งก็คือ 23.50 .

ในการตรวจสอบว่าคำตอบถูกต้องหรือไม่ เราเรียกใช้ฟังก์ชัน AVERAGE ใน เซลล์ E5 ซึ่งจะส่งคืนค่าเฉลี่ย ( 28.80 ) ของค่าทั้งหมดในช่วง B5:B14 และใน เซลล์ E7 เราเรียกใช้ฟังก์ชัน เฉลี่ย อีกฟังก์ชันหนึ่งโดยการป้อนเซลล์ทั้งหมดด้วยตนเอง ยกเว้นเซลล์ที่เก็บค่าผิดปกติ และได้รับผลตอบแทนเป็น 23.50

เราจึงพูดได้ว่าฟังก์ชัน TRIMMEAN สามารถลบค่าผิดปกติออกจากชุดข้อมูลที่กำหนดได้สำเร็จในขณะที่คำนวณค่าเฉลี่ยใน Excel

อ่านเพิ่มเติม: วิธีล้างสูตรใน Excel (7+ วิธี)

2. ลบค่าผิดปกติออกจากชุดข้อมูลและแผนภูมิเส้นใน Excel

สังเกตรูปภาพต่อไปนี้ เรามีข้อมูลบางส่วนที่เราสร้างกราฟเส้น จากกราฟเส้น เราจะเห็นว่าใน จุดข้อมูล 4 และ 8 เรามีค่าผิดปกติ

ตอนนี้ เราจะมาดูกันว่าเราจะทำให้เรียบได้อย่างไร ออกจากแผนภูมิเส้นโดยการลบค่าภายนอกออกจากชุดข้อมูล

ในเซลล์อื่น (ในกรณีของเราคือ เซลล์ H6 ) ให้เขียนสูตรต่อไปนี้

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

ที่นี่

  • C6 = เซลล์ที่เก็บข้อมูลแรกในชุดข้อมูล
  • C5 = เซลล์เหนือเซลล์ข้อมูลแรก
  • C7 = เซลล์ใต้เซลล์ข้อมูลแรก
  • $E$6 = ความแตกต่างระหว่างจุดข้อมูล .

มองไปที่ข้อมูลของเรา ดูเหมือนว่าเมื่อจุดข้อมูล ต่างกัน 10 หน่วย จากจุดอื่น จะถูกกำหนดให้เป็น ค่าผิดปกติ ดังนั้นเราจึงใส่ 10 ใน เซลล์ E6 และทำให้เป็น การอ้างอิงเซลล์สัมบูรณ์ เพื่อให้เซลล์นี้ได้รับการแก้ไขในขณะที่สแกนและคำนวณผ่านชุดข้อมูลทั้งหมด<3

หลังจากกด Enter คุณจะเห็นข้อมูลแรกยังคงปรากฏในเซลล์ผลลัพธ์ H6 สิ่งที่คุณต้องทำที่นี่คือ เพียงสร้างสูตรเพื่อให้เราสามารถลาก จุดจับเติม เพื่อนำสูตรไปใช้กับเซลล์ที่เหลือ

ตอนนี้ลากแถวลงด้วย Fill Handle แล้วคุณจะเห็นเซลล์ที่เก็บค่าผิดปกติถูกเติมด้วย #N/A .

และดูที่แผนภูมิเส้นตอนนี้ กราฟนี้เป็นกราฟแบนโดยไม่มีค่าภายนอกใดๆ อยู่ในนั้น

การแจกแจงสูตร

=IF(

ในขณะที่เรากำลังจะเปรียบเทียบค่าตามที่เราจะแยกผลลัพธ์ เราจึงเริ่มสูตรด้วย เงื่อนไข IF

=IF(AND(

เราจะเปรียบเทียบจุดข้อมูลปัจจุบันกับเซลล์ด้านบนและเซลล์ด้านล่าง และถ้าการเปรียบเทียบทั้งสองเป็นจริง เราจะแสดงจุดข้อมูลเป็นผลลัพธ์เท่านั้น ดังนั้น เนื่องจากเราจำเป็นต้องจัดการกับการเปรียบเทียบ "ทั้งสอง" เราจึงควรใช้ฟังก์ชัน AND

=IF(AND(ABS(

เมื่อเราลบจุดข้อมูล ข้อมูลบางอย่างอาจให้ค่าลบ และเราทำ ไม่ต้องการจัดการกับค่าลบ เนื่องจากค่าลบจะขัดแย้งกับเงื่อนไขของ “การลบข้อมูลเมื่อผลต่างเท่ากับ 10” เสมอ ดังนั้นเพื่อให้แน่ใจว่าเราได้ผลลัพธ์ที่เป็นบวกเสมอ เราจำเป็นต้องรวมการเปรียบเทียบไว้ใน ฟังก์ชันค่าสัมบูรณ์

=IF(AND(ABS(C6-C5)> ;$E$6

ที่นี่ เราเริ่มการเปรียบเทียบครั้งแรก เราเพียงลบค่าปัจจุบันด้วยค่าด้านบน และดูว่าผลลัพธ์ที่ได้นั้นมากกว่าระดับความแตกต่างที่จัดเก็บไว้ใน เซลล์ E6 และทำให้เซลล์เป็น การอ้างอิงสัมบูรณ์ เพื่อคงค่าเซลล์ไว้ล็อกไว้

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

ถัดไป ส่วนที่สองของการเปรียบเทียบซึ่งคั่นด้วยเครื่องหมายจุลภาค โดยจะเปรียบเทียบจุดข้อมูลปัจจุบันกับจุดข้อมูลถัดไป

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

ตอนนี้เราใส่ เครื่องหมายจุลภาคและกำหนดให้ใส่ ฟังก์ชัน NA ในนั้นหากฟังก์ชัน AND เป็นจริงทั้งคู่

=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

และหากฟังก์ชัน AND ไม่เป็นความจริง เราจะ ต้องการคืนจุดข้อมูลจริงเป็นค่า IF False เราจึงพิมพ์ e ในเครื่องหมายจุลภาคและส่งหมายเลขอ้างอิงเซลล์ C6 ในนั้น

อ่านเพิ่มเติม: วิธีลบการตรวจสอบความถูกต้องของข้อมูลใน Excel (5 วิธี)

การอ่านที่คล้ายกัน

  • วิธีลบส่วนหัวใน Excel (4 วิธี)
  • ลบเส้นประในExcel (5 วิธีด่วน)
  • วิธีลบเส้นตารางออกจาก Excel (6 วิธีง่ายๆ)
  • ลบเส้นขอบใน Excel (4 วิธีด่วน)
  • วิธีลบโหมดความเข้ากันได้ใน Excel (2 วิธีง่ายๆ)

3. ลบค่าผิดปกติใน Excel ด้วยตนเอง

อีกวิธีง่ายๆ ในการกำจัดค่าผิดปกติใน Excel คือเพียงจัดเรียงค่าของชุดข้อมูลของคุณ แล้วลบค่าบนและล่างออกด้วยตนเอง

ในการจัดเรียง ข้อมูล

  • เลือก ชุดข้อมูล
  • ไปที่ จัดเรียง & กรอง ในกลุ่ม การแก้ไข และเลือก เรียงลำดับจากน้อยไปมาก หรือ เรียงลำดับจากมากไปน้อย .

  • ในกรณีของเรา เราเลือก เรียงลำดับจากน้อยไปมาก มันจัดเรียงตัวเลขในชุดข้อมูลของเราโดยเรียงลำดับจากน้อยไปมาก โดยวางตัวเลขที่เล็กที่สุดไว้ด้านบนและตัวเลขที่ใหญ่ที่สุดไว้ด้านล่าง

ตอนนี้เพียงลบข้อมูลเหล่านั้นด้วยตนเอง เพื่อทำให้ชุดข้อมูลมีค่าที่อยู่นอกกรอบฟรี

เราไม่แนะนำให้ทำตามขั้นตอนนี้ในขณะที่ทำงานกับชุดข้อมูลขนาดใหญ่ เมื่อชุดข้อมูลของคุณมีขนาดเล็กและดูง่ายกว่า คุณเท่านั้นที่สามารถใช้ขั้นตอนนี้ได้ มิฉะนั้นไม่ต้องดำเนินการนี้

อ่านเพิ่มเติม: วิธีลบการจัดเรียงใน Excel ( 3 วิธีง่ายๆ)

บทสรุป

บทความนี้แสดงวิธี ลบค่าผิดปกติ ใน Excel ฉันหวังว่าบทความนี้มีประโยชน์มากสำหรับคุณ อย่าลังเลที่จะถามหากคุณมีคำถามใด ๆ เกี่ยวกับหัวข้อ.

Hugh West เป็นผู้ฝึกอบรมและนักวิเคราะห์ Excel ที่มีประสบการณ์สูงและมีประสบการณ์มากกว่า 10 ปีในอุตสาหกรรมนี้ เขาสำเร็จการศึกษาระดับปริญญาตรีสาขาการบัญชีและการเงิน และปริญญาโทสาขาบริหารธุรกิจ Hugh มีความหลงใหลในการสอนและได้พัฒนาแนวทางการสอนที่เป็นเอกลักษณ์ซึ่งง่ายต่อการติดตามและเข้าใจ ความรู้ความเชี่ยวชาญของเขาเกี่ยวกับ Excel ช่วยให้นักเรียนและผู้เชี่ยวชาญหลายพันคนทั่วโลกพัฒนาทักษะและความเป็นเลิศในอาชีพการงาน ฮิวจ์แบ่งปันความรู้ของเขากับคนทั้งโลกผ่านบล็อก โดยเสนอบทช่วยสอน Excel ฟรีและการฝึกอบรมออนไลน์เพื่อช่วยให้บุคคลและธุรกิจบรรลุศักยภาพสูงสุดของตนเอง