สารบัญ
การค้นหาค่าผิดปกติและการลบออกเป็นงานทั่วไปในการวิเคราะห์ข้อมูลทางสถิติ การขุดข้อมูล การเรียนรู้ของเครื่อง ฯลฯ มีหลายวิธีที่คุณสามารถหาค่าผิดปกติในชุดข้อมูลของคุณ แต่กระบวนการในการลบค่าผิดปกตินั้นไม่ง่ายนัก หา. ในบทความนี้ เราจะแสดงวิธีการ ลบค่าผิดปกติใน Excel
ดาวน์โหลดสมุดงาน
คุณสามารถดาวน์โหลดสมุดงาน Excel แบบฝึกหัดได้ฟรีจาก ที่นี่
ลบ Outliers.xlsx
Outliers ใน Excel คืออะไร
An Outlier เป็นค่าที่อยู่ห่างจากค่าเฉลี่ยหรือค่ามัธยฐานของชุดข้อมูล กล่าวอีกนัยหนึ่ง ค่าผิดปกติคือค่าที่สูงหรือต่ำกว่าค่าที่เหลือในชุดข้อมูลอย่างมาก
ลองนึกถึงการแข่งขันคริกเก็ตที่ผู้ตีทั้งหมดทำคะแนนได้ประมาณ 50 แต่มีผู้ตีลูกเพียงคนเดียวที่ทำคะแนนได้ในรอบศตวรรษ (100 ) และคนตีลูกอีกคนออกที่ 0 คะแนน 100 และ 0 นั้นคือค่าผิดปกติในนัดนี้
ค่าผิดปกติเป็นปัญหาเนื่องจากสามารถบิดเบือนผลการวิเคราะห์ข้อมูลและทำให้เกิดผลที่ผิดพลาดได้ ดังนั้นจึงเป็นการดีกว่าที่จะค้นหาค่าผิดปกติและนำออกเพื่อให้ชุดข้อมูลราบรื่น
3 วิธีในการลบค่าผิดปกติใน Excel
ในส่วนนี้ คุณจะได้เรียนรู้วิธีการ ลบค่าผิดปกติ จากชุดข้อมูลของคุณใน 3 วิธี การนำค่าผิดปกติออกนั้นเป็นกระบวนการที่ยุ่งยาก ดังนั้นโปรดอ่านบทความทั้งหมดอย่างละเอียด
1. การใช้ฟังก์ชัน Excel เพื่อคำนวณค่าเฉลี่ยโดยไม่ต้องค่าผิดปกติ
Excel ฟังก์ชัน TRIMMEAN สามารถใช้ในการคำนวณค่าเฉลี่ยของชุดข้อมูลหนึ่งๆ ในขณะที่ไม่รวมค่าผิดปกติ จุดข้อมูลที่จะแยกออกเป็นเปอร์เซ็นต์ ค่าเปอร์เซ็นต์สามารถป้อนเป็นรูปแบบทศนิยมหรือรูปแบบเปอร์เซ็นต์
ไวยากรณ์ในการคำนวณค่าเฉลี่ยโดยไม่มีค่าผิดปกติคือ
=TRIMMEAN(อาร์เรย์, เปอร์เซ็นต์)ที่นี่
- อาร์เรย์ = ช่วงของข้อมูลที่จะตัดแต่งและคำนวณผลลัพธ์เฉลี่ย
- เปอร์เซ็นต์ = จำนวนจุดข้อมูลที่จะยกเว้น
มาดูวิธีใช้ฟังก์ชันนี้เพื่อคำนวณผลลัพธ์ด้วยค่าผิดปกติที่ลบออก
พิจารณารูปภาพด้านบน เรามีข้อมูลจาก เซลล์ B5 ถึง B14 ในที่นี้ ตัวเลขส่วนใหญ่อยู่ระหว่าง 20 ถึง 27 แต่ค่าสองค่า – 0 และ 100 – ห่างไกลจากค่าเหล่านั้น ดังนั้นนี่คือ ค่าผิดปกติ ในชุดข้อมูลของเรา
สำหรับชุดข้อมูลของเรา สูตรคำนวณค่าเฉลี่ย (ค่าเฉลี่ย) โดยไม่มีค่าผิดปกติด้วยฟังก์ชัน Excel TRIMMEAN คือ
=TRIMMEAN(B5:B14,0.2)
ที่นี่
- B5:B14 = ช่วงของข้อมูลที่จะตัดแต่งและคำนวณผลลัพธ์เฉลี่ย
- 0.2 (หรือ 20%) = จำนวนจุดข้อมูลที่จะยกเว้น
หากตัวเลขใดๆ ในชุดข้อมูลต่ำกว่าชุดข้อมูลที่เหลือ 20% ตัวเลขนั้นจะถูกเรียกว่าค่าผิดปกติ
หากคุณเขียนสูตรตามชุดข้อมูลของคุณและกด Enter คุณจะได้รับ ค่าเฉลี่ยที่คำนวณโดยไม่มีค่าผิดปกติ สำหรับชุดข้อมูลของคุณ ในกรณีของเรา เซลล์ E6 มีค่าเฉลี่ยที่คำนวณได้ซึ่งก็คือ 23.50 .
ในการตรวจสอบว่าคำตอบถูกต้องหรือไม่ เราเรียกใช้ฟังก์ชัน AVERAGE ใน เซลล์ E5 ซึ่งจะส่งคืนค่าเฉลี่ย ( 28.80 ) ของค่าทั้งหมดในช่วง B5:B14 และใน เซลล์ E7 เราเรียกใช้ฟังก์ชัน เฉลี่ย อีกฟังก์ชันหนึ่งโดยการป้อนเซลล์ทั้งหมดด้วยตนเอง ยกเว้นเซลล์ที่เก็บค่าผิดปกติ และได้รับผลตอบแทนเป็น 23.50
เราจึงพูดได้ว่าฟังก์ชัน TRIMMEAN สามารถลบค่าผิดปกติออกจากชุดข้อมูลที่กำหนดได้สำเร็จในขณะที่คำนวณค่าเฉลี่ยใน Excel
อ่านเพิ่มเติม: วิธีล้างสูตรใน Excel (7+ วิธี)
2. ลบค่าผิดปกติออกจากชุดข้อมูลและแผนภูมิเส้นใน Excel
สังเกตรูปภาพต่อไปนี้ เรามีข้อมูลบางส่วนที่เราสร้างกราฟเส้น จากกราฟเส้น เราจะเห็นว่าใน จุดข้อมูล 4 และ 8 เรามีค่าผิดปกติ
ตอนนี้ เราจะมาดูกันว่าเราจะทำให้เรียบได้อย่างไร ออกจากแผนภูมิเส้นโดยการลบค่าภายนอกออกจากชุดข้อมูล
ในเซลล์อื่น (ในกรณีของเราคือ เซลล์ H6 ) ให้เขียนสูตรต่อไปนี้
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ที่นี่
- C6 = เซลล์ที่เก็บข้อมูลแรกในชุดข้อมูล
- C5 = เซลล์เหนือเซลล์ข้อมูลแรก
- C7 = เซลล์ใต้เซลล์ข้อมูลแรก
- $E$6 = ความแตกต่างระหว่างจุดข้อมูล .
มองไปที่ข้อมูลของเรา ดูเหมือนว่าเมื่อจุดข้อมูล ต่างกัน 10 หน่วย จากจุดอื่น จะถูกกำหนดให้เป็น ค่าผิดปกติ ดังนั้นเราจึงใส่ 10 ใน เซลล์ E6 และทำให้เป็น การอ้างอิงเซลล์สัมบูรณ์ เพื่อให้เซลล์นี้ได้รับการแก้ไขในขณะที่สแกนและคำนวณผ่านชุดข้อมูลทั้งหมด<3
หลังจากกด Enter คุณจะเห็นข้อมูลแรกยังคงปรากฏในเซลล์ผลลัพธ์ H6 สิ่งที่คุณต้องทำที่นี่คือ เพียงสร้างสูตรเพื่อให้เราสามารถลาก จุดจับเติม เพื่อนำสูตรไปใช้กับเซลล์ที่เหลือ
ตอนนี้ลากแถวลงด้วย Fill Handle แล้วคุณจะเห็นเซลล์ที่เก็บค่าผิดปกติถูกเติมด้วย #N/A .
และดูที่แผนภูมิเส้นตอนนี้ กราฟนี้เป็นกราฟแบนโดยไม่มีค่าภายนอกใดๆ อยู่ในนั้น
การแจกแจงสูตร
=IF(
ในขณะที่เรากำลังจะเปรียบเทียบค่าตามที่เราจะแยกผลลัพธ์ เราจึงเริ่มสูตรด้วย เงื่อนไข IF
=IF(AND(
เราจะเปรียบเทียบจุดข้อมูลปัจจุบันกับเซลล์ด้านบนและเซลล์ด้านล่าง และถ้าการเปรียบเทียบทั้งสองเป็นจริง เราจะแสดงจุดข้อมูลเป็นผลลัพธ์เท่านั้น ดังนั้น เนื่องจากเราจำเป็นต้องจัดการกับการเปรียบเทียบ "ทั้งสอง" เราจึงควรใช้ฟังก์ชัน AND
=IF(AND(ABS(
เมื่อเราลบจุดข้อมูล ข้อมูลบางอย่างอาจให้ค่าลบ และเราทำ ไม่ต้องการจัดการกับค่าลบ เนื่องจากค่าลบจะขัดแย้งกับเงื่อนไขของ “การลบข้อมูลเมื่อผลต่างเท่ากับ 10” เสมอ ดังนั้นเพื่อให้แน่ใจว่าเราได้ผลลัพธ์ที่เป็นบวกเสมอ เราจำเป็นต้องรวมการเปรียบเทียบไว้ใน ฟังก์ชันค่าสัมบูรณ์
=IF(AND(ABS(C6-C5)> ;$E$6
ที่นี่ เราเริ่มการเปรียบเทียบครั้งแรก เราเพียงลบค่าปัจจุบันด้วยค่าด้านบน และดูว่าผลลัพธ์ที่ได้นั้นมากกว่าระดับความแตกต่างที่จัดเก็บไว้ใน เซลล์ E6 และทำให้เซลล์เป็น การอ้างอิงสัมบูรณ์ เพื่อคงค่าเซลล์ไว้ล็อกไว้
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
ถัดไป ส่วนที่สองของการเปรียบเทียบซึ่งคั่นด้วยเครื่องหมายจุลภาค โดยจะเปรียบเทียบจุดข้อมูลปัจจุบันกับจุดข้อมูลถัดไป
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
ตอนนี้เราใส่ เครื่องหมายจุลภาคและกำหนดให้ใส่ ฟังก์ชัน NA ในนั้นหากฟังก์ชัน AND เป็นจริงทั้งคู่
=IF(AND(ABS(C6-C5) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
และหากฟังก์ชัน AND ไม่เป็นความจริง เราจะ ต้องการคืนจุดข้อมูลจริงเป็นค่า IF False เราจึงพิมพ์ e ในเครื่องหมายจุลภาคและส่งหมายเลขอ้างอิงเซลล์ C6 ในนั้น
อ่านเพิ่มเติม: วิธีลบการตรวจสอบความถูกต้องของข้อมูลใน Excel (5 วิธี)
การอ่านที่คล้ายกัน
- วิธีลบส่วนหัวใน Excel (4 วิธี)
- ลบเส้นประในExcel (5 วิธีด่วน)
- วิธีลบเส้นตารางออกจาก Excel (6 วิธีง่ายๆ)
- ลบเส้นขอบใน Excel (4 วิธีด่วน)
- วิธีลบโหมดความเข้ากันได้ใน Excel (2 วิธีง่ายๆ)
3. ลบค่าผิดปกติใน Excel ด้วยตนเอง
อีกวิธีง่ายๆ ในการกำจัดค่าผิดปกติใน Excel คือเพียงจัดเรียงค่าของชุดข้อมูลของคุณ แล้วลบค่าบนและล่างออกด้วยตนเอง
ในการจัดเรียง ข้อมูล
- เลือก ชุดข้อมูล
- ไปที่ จัดเรียง & กรอง ในกลุ่ม การแก้ไข และเลือก เรียงลำดับจากน้อยไปมาก หรือ เรียงลำดับจากมากไปน้อย .
- ในกรณีของเรา เราเลือก เรียงลำดับจากน้อยไปมาก มันจัดเรียงตัวเลขในชุดข้อมูลของเราโดยเรียงลำดับจากน้อยไปมาก โดยวางตัวเลขที่เล็กที่สุดไว้ด้านบนและตัวเลขที่ใหญ่ที่สุดไว้ด้านล่าง
ตอนนี้เพียงลบข้อมูลเหล่านั้นด้วยตนเอง เพื่อทำให้ชุดข้อมูลมีค่าที่อยู่นอกกรอบฟรี
เราไม่แนะนำให้ทำตามขั้นตอนนี้ในขณะที่ทำงานกับชุดข้อมูลขนาดใหญ่ เมื่อชุดข้อมูลของคุณมีขนาดเล็กและดูง่ายกว่า คุณเท่านั้นที่สามารถใช้ขั้นตอนนี้ได้ มิฉะนั้นไม่ต้องดำเนินการนี้
อ่านเพิ่มเติม: วิธีลบการจัดเรียงใน Excel ( 3 วิธีง่ายๆ)
บทสรุป
บทความนี้แสดงวิธี ลบค่าผิดปกติ ใน Excel ฉันหวังว่าบทความนี้มีประโยชน์มากสำหรับคุณ อย่าลังเลที่จะถามหากคุณมีคำถามใด ๆ เกี่ยวกับหัวข้อ.