สารบัญ
อาจจำเป็นต้องระบุค่าผิดปกติเพื่อทำการคำนวณทางสถิติกับข้อมูลจากชุดข้อมูล คุณสามารถค้นพบค่าผิดปกติจากชุดข้อมูลขนาดใหญ่โดยใช้ Microsoft Excel ได้หลายวิธี ในโพสต์นี้ เราจะแสดงวิธีการคำนวณค่าผิดปกติใน Microsoft Excel โดยใช้ห้าวิธีที่แตกต่างกัน
ดาวน์โหลดสมุดงานแบบฝึกหัด
คุณสามารถดาวน์โหลดสมุดงาน Excel ได้ฟรีจากที่นี่และฝึกฝนด้วยตัวเอง .
ค้นหาค่าผิดปกติ.xlsx
5 วิธีง่ายๆ ในการคำนวณค่าผิดปกติใน Excel
ค่าผิดปกติ คือค่าข้อมูล ที่แตกต่างจากค่าข้อมูลที่เหลือในชุดข้อมูลอย่างมีนัยสำคัญ กล่าวอีกนัยหนึ่งค่าผิดปกติคือค่าพิเศษ ค่าเหล่านี้มีค่า สูง มากเป็นพิเศษ หรือมีค่า ต่ำ มากเกินไป เมื่อเปรียบเทียบกับค่าอื่นๆ ในชุดข้อมูล การหาค่าผิดปกติ มีความสำคัญในการคำนวณทางสถิติ เนื่องจากมีค่าผิดปกติที่ส่งผลต่อผลการวิเคราะห์ข้อมูลของเรา
ตัวอย่างเช่น คุณมีชุดข้อมูลที่แสดงรายได้ต่อวันของคน 12 คน ตอนนี้คุณต้องคำนวณค่าผิดปกติโดยใช้ Microsoft Excel ที่นี่ ฉันจะแสดงวิธีง่ายๆ 5 วิธีในการทำเช่นนั้น
1. ใช้การจัดเรียง & ตัวกรองเพื่อคำนวณค่าผิดปกติใน Excel
คุณสามารถคำนวณค่าผิดปกติจากชุดข้อมูลขนาดเล็กได้โดยใช้ เรียงลำดับ & คำสั่งตัวกรอง ใน Excel หากคุณต้องการคำนวณค่าผิดปกติโดยใช้ฟังก์ชันการเรียงลำดับและตัวกรอง คุณสามารถทำได้โดยทำตามด้านล่าง
ขั้นตอนที่ 1:
- ขั้นแรก เลือกส่วนหัวของคอลัมน์ในชุดข้อมูล excel ที่คุณต้องการจัดเรียง ตัวอย่างเช่น ในชุดข้อมูลที่กำหนด ในส่วนหัวของคอลัมน์ไฟล์ชื่อ รายได้รายวัน (เลือกเซลล์ C40 )<15
ขั้นตอนที่ 2:
- จากนั้น กดปุ่ม หน้าแรก บน Ribbon และไปที่กลุ่ม การแก้ไข
ขั้นตอนที่ 3:<7
- หลังจากนั้น ใน กลุ่มการแก้ไข คลิกที่ จัดเรียง & กรอง คำสั่งและคลิกที่ กำหนดเอง จัดเรียง
<19
ขั้นตอนที่ 4:
- จากนั้น กล่องโต้ตอบใหม่ที่ชื่อว่า จัดเรียง จะเปิดขึ้น ในกล่องโต้ตอบที่แสดงขึ้น เลือก รายวัน รายได้ ใน เรียงตาม เมนูแบบเลื่อนลงและ เล็กที่สุดไปใหญ่ที่สุด ในเมนูแบบเลื่อนลงของคำสั่งซื้อ หลังจากนั้น คลิก ตกลง .
ขั้นตอนที่ 5:
- สุดท้าย คอลัมน์ รายได้รายวัน จะถูกจัดเรียงตามลักษณะที่ระบุไว้ โดยค่าต่ำสุดจะอยู่ด้านบนและค่ามากที่สุดจะอยู่ด้านล่าง หลังจากเรียกใช้ขั้นตอน ให้มองหาความผิดปกติใดๆ ในช่วงข้อมูลเพื่อระบุค่าผิดปกติ
ตัวอย่างเช่น ค่าสองค่าแรกในคอลัมน์มีค่าต่ำกว่ามาก และค่า ค่าสองค่าสุดท้ายในคอลัมน์นั้นสูงกว่าค่าที่เหลือในชุดข้อมูลอย่างมาก ดังที่แสดงในผลลัพธ์ข้างต้น
อ่านเพิ่มเติม: วิธีค้นหาค่าผิดปกติในการวิเคราะห์การถดถอยใน Excel (3 วิธีง่ายๆ)
2. ใช้ฟังก์ชัน QUARTILE กับ คำนวณค่าผิดปกติใน Excel
แนวทางของฟังก์ชัน QUARTILE เป็นวิธีที่เป็นวิทยาศาสตร์มากขึ้นในการคำนวณค่าผิดปกติใน Excel คุณสามารถใช้ฟังก์ชันนี้เพื่อแบ่งชุดข้อมูลของคุณออกเป็นสี่ส่วนเท่าๆ กัน ค่าต่อไปนี้จะถูกส่งคืนโดย ฟังก์ชัน QUARTILE :
- ค่า ขั้นต่ำ ค่า
- ค่า ควอไทล์ ที่ 1 (Q1- ต่ำสุด 25% ของชุดข้อมูลที่กำหนด)
- ควอไทล์ ที่ 2 ที่ 2 (Q2-ถัดไป ต่ำสุด 25% ของชุดข้อมูล)
- ควอร์ไทล์ ที่ 3 ที่ 3 (ไตรมาสที่ 3- สูงสุดเป็นอันดับสองที่ 25% ของชุดข้อมูล)
- ค่า ค่าสูงสุด ค่า
ไวยากรณ์ของ ฟังก์ชัน QUARTILE ใน Excel คือ:
=QUARTILE( array,quart)
ไวยากรณ์ประกอบด้วยอาร์กิวเมนต์ต่อไปนี้:
- a rray : ช่วงเซลล์ที่กำหนด ชุดข้อมูลที่คุณจะคำนวณค่าควอไทล์
- ควอร์ต: เป็นการระบุว่าควรส่งคืนค่าใด
สำหรับการคำนวณค่าผิดปกติสำหรับชุดข้อมูลด้านบนโดยใช้ ฟังก์ชัน QUARTILE ให้ทำตามขั้นตอนด้านล่าง
ขั้นตอนที่ 1:
- ประการแรก พิมพ์สูตรต่อไปนี้เพื่อกำหนดควอไทล์ ที่ 1 ควอไทล์ ( Q1 ) ด้านล่าง
=QUARTILE($C$5:$C$16,1)
<7
ขั้นตอนที่ 2:
- ที่นี่อีกครั้ง สูตรคำนวณควอไทล์ 3 ที่ 3 ( Q3 ) แสดงไว้ด้านล่าง
=QUARTILE($C$5:$C$16,3)
ขั้นตอนที่ 3:
- ประการที่สาม คุณต้องกำหนด IQR ซึ่งก็คือ ช่วงระหว่างควอไทล์ (แสดงถึง 50% ของข้อมูลที่กำหนดจากช่วงของชุดข้อมูลที่จัดอยู่ในควอไทล์ที่หนึ่งและสาม) โดยการลบ Q1 (ในเซลล์ G4 ) จาก Q3 (ในเซลล์ G5 ) พิมพ์สูตรต่อไปนี้เพื่อคำนวณการลบ
=G5-G4
ขั้นตอนที่ 4:
- หลังจากพบ IQR แล้ว ถัดไป คุณต้องกำหนด บน และ ล่าง เนื่องจากขีดจำกัด บน และ ล่าง จะมีข้อมูลส่วนใหญ่อยู่ภายใน ชุดข้อมูล เขียนสูตรต่อไปนี้เพื่อคำนวณขีดจำกัดบน
=G5+(1.5*G6)
ขั้นตอนที่ 5:
- จากนั้น ในการคำนวณขีดจำกัดล่าง ให้เขียนสูตรต่อไปนี้
=G4-(1.5*G6)
ขั้นตอนที่ 6:
- สุดท้าย หลังจากเสร็จสิ้นขั้นตอนก่อนหน้า คุณสามารถกำหนดค่าผิดปกติสำหรับแต่ละข้อมูล ค่า. ในแผ่นงาน excel พิมพ์สูตรต่อไปนี้ด้วย ฟังก์ชัน OR ในเซลล์ D5 .
=OR(C5$G$7)
- สูตรนี้จะช่วยในการระบุข้อมูลที่ไม่อยู่ในขอบเขตที่กล่าวถึงข้างต้น หลังจากประมวลผลสูตรจะแสดง คำสั่ง TRUE ถ้าข้อมูลเฉพาะเป็นค่าผิดปกติ และ เท็จ ถ้าไม่ใช่ ดับเบิลคลิก บนเครื่องมือ ป้อนอัตโนมัติ ในเซลล์ C5 เพื่อคัดลอก สูตรไปยังเซลล์ที่เหลือ ใน คอลัมน์ C ดังนั้น คุณสามารถสังเกตค่า True ถัดจากค่าผิดปกติทั้งหมดในชุดข้อมูลของคุณ
3. รวมฟังก์ชัน AVERAGE และ STDEV.P เพื่อคำนวณค่าผิดปกติจากค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
A ส่วนเบี่ยงเบนมาตรฐาน (หรือ σ ) เป็นเมตริกสำหรับกำหนดการกระจายข้อมูลที่เกี่ยวข้องกับค่าเฉลี่ยของชุดข้อมูลทั้งหมด ข้อมูลจะถูกจัดกลุ่มตามค่าเฉลี่ยเมื่อค่าเบี่ยงเบนมาตรฐานต่ำ ในขณะที่ข้อมูลจะกระจายออกไปมากขึ้นเมื่อค่าเบี่ยงเบนมาตรฐานสูง ในการคำนวณค่าผิดปกติโดยใช้ ค่าเฉลี่ย และ ส่วนเบี่ยงเบนมาตรฐาน คุณสามารถทำตามขั้นตอนต่อไปนี้
ขั้นตอนที่ 1:
- ประการแรก ใช้ชุดข้อมูลเดียวกับที่แสดงตอนต้นของบทความนี้ จากนั้นจึงคำนวณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน ในการคำนวณค่าเฉลี่ย พิมพ์สูตรต่อไปนี้ด้วย ฟังก์ชัน AVERAGE ในเซลล์ G5 .
=AVERAGE(C5:C16)
ขั้นตอนที่ 2:
- ในการคำนวณส่วนเบี่ยงเบนมาตรฐาน ให้ใส่สูตรต่อไปนี้ด้วย STDEV ฟังก์ชัน .P ในเซลล์ G6 .
=STDEV.P(C5:C16)
ขั้นตอนที่ 3:
- ถัดไป คุณจะคำนวณขีด จำกัด สูงสุดสำหรับความก้าวหน้าต่อไปในกระบวนการ ในเซลล์ G7 ให้คำนวณขีดจำกัดล่างโดยใช้สูตรต่อไปนี้
=G5-(1.25*G6)
ขั้นตอนที่ 4:
- และในเซลล์ G8 คำนวณขีดจำกัดบนจากสูตรต่อไปนี้
=G5+(1.5*G6)
ขั้นตอนที่ 5:
- หลังจากนั้น เมื่อต้องการคำนวณว่ามีค่าผิดปกติหรือไม่ ให้พิมพ์สูตรต่อไปนี้ในเซลล์ D5
=OR(C5$G$8)
- ดังนั้น สูตรจะส่งกลับค่า จริง หากข้อมูลเฉพาะในเซลล์ที่ต้องการเป็นค่าผิดปกติและ FALSE.
- ดับเบิลคลิก บนเครื่องมือ ป้อนอัตโนมัติ ในเซลล์ D5 เพื่อคัดลอกสูตรไปยังเซลล์ที่เหลือใน คอลัมน์ D ดังนั้น คุณสามารถค้นหาค่าผิดปกติที่เหลือทั้งหมดในชุดข้อมูลของคุณ
อ่านเพิ่มเติม: วิธีหาค่าผิดปกติที่มีค่าส่วนเบี่ยงเบนมาตรฐานใน Excel (พร้อมขั้นตอนด่วน)
4. แทรก Z-score เพื่อคำนวณ Outliers ใน Excel
Z-score เป็นหนึ่งในเมตริกที่ใช้บ่อยที่สุดสำหรับ การระบุค่าผิดปกติ วิธีนี้แสดงว่าข้อมูลเฉพาะอยู่ห่างจากค่าเฉลี่ยของชุดข้อมูลมากน้อยเพียงใดเมื่อเทียบกับส่วนเบี่ยงเบนมาตรฐาน ในการคำนวณค่าผิดปกติโดยใช้ Z-score ใน Excel คุณสามารถดูขั้นตอนที่อธิบายด้านล่าง
ขั้นตอนที่ 1:
- ขั้นแรก นำชุดข้อมูลที่ต้องการ
ขั้นตอน2:
- ประการที่สอง ในเซลล์ H5 พิมพ์สูตรต่อไปนี้เพื่อคำนวณ ค่าเฉลี่ย สำหรับข้อมูลที่กำหนด
=AVERAGE(C5:C16)
ขั้นตอนที่ 3:
- ประการที่สาม คำนวณ ส่วนเบี่ยงเบนมาตรฐาน ของชุดข้อมูลที่กำหนดในเซลล์ H6 โดยใช้สูตรต่อไปนี้
=STDEV.P(C5:C16)
ขั้นตอนที่ 4:
- หลังจากนั้น คุณต้องกำหนด Z -score สำหรับแต่ละค่าข้อมูล ในการทำเช่นนี้ ให้ใช้สูตรด้านล่าง
=(C5-$H$5)/$H$6
ขั้นตอนที่ 5:
- หลังจากคำนวณ ค่า Z ทั้งหมด คุณจะเห็นว่าช่วงของ ค่า Z อยู่ระหว่าง -1.44 และ 13 ดังนั้นเราจึงถือว่าค่าของ Z-score น้อยกว่า -1.2 หรือมากกว่า +1.8 สำหรับขีดจำกัดภายนอก
- จากนั้น พิมพ์สูตรต่อไปนี้ลงในเซลล์ E 5 .
=OR((D51.8))
<39
- สุดท้าย สูตรจะส่งกลับค่า TRUE หากข้อมูลที่ระบุเป็นค่าผิดปกติ และจะส่งกลับ FALSE <9
- ดับเบิลคลิก บนเซลล์ E5 เพื่อใช้ ป้อนอัตโนมัติ ที่จับเติมเครื่องมือเพื่อคัดลอกสูตรไปยังเซลล์ที่เหลือใน คอลัมน์ E ดังนั้น คุณสามารถค้นหาค่าผิดปกติที่เหลือทั้งหมดในชุดข้อมูลของคุณ
อ่านเพิ่มเติม: วิธีค้นหาค่าผิดปกติโดยใช้คะแนน Z ใน Excel (ด้วย Quickขั้นตอน)
5. รวมฟังก์ชัน LARGE และ SMALL เพื่อหาค่าผิดปกติใน Excel
ฟังก์ชัน LARGE และ ฟังก์ชัน SMALL ใน Excel มีการดำเนินงานที่ตรงกันข้าม เราจะใช้เพื่อค้นหาข้อมูลหรือค่าที่มากที่สุดและน้อยที่สุดในชุดข้อมูลตามลำดับ ฟังก์ชันนี้จะดึงข้อมูลทั้งหมดภายในชุดข้อมูล เพื่อหาจำนวนที่น้อยที่สุดและมากที่สุด พวกเขาสามารถหาสิ่งที่เล็กที่สุดหรือใหญ่เป็นอันดับสอง ใหญ่เป็นอันดับสามหรือเล็กที่สุด และอื่นๆ
ขั้นตอนที่ 1:
- ประการแรก ใช้สูตรต่อไปนี้ในเซลล์ E5 ด้วย ฟังก์ชัน LARGE
=LARGE($C$5:$C$16,1)
-
- ดังนั้น จากค่า 12 คุณจะเห็นค่าที่มากที่สุดเป็นอันดับ 1 ซึ่งก็คือ 780 .
ขั้นตอนที่ 2:
- หลังจากนั้น ในเซลล์ G5 ให้จดสูตรต่อไปนี้เพื่อหาค่าที่น้อยที่สุด
=SMALL($C$5:$C$16,1)
- สุดท้าย จากค่า 12 คุณจะเห็นค่า ที่ 1 ค่าที่น้อยที่สุด 110 .
- เมื่อคุณพบค่าที่จำเป็นทั้งหมดแล้ว คุณสามารถชี้ให้เห็นค่าผิดปกติใดๆ ในชุดข้อมูลได้อย่างง่ายดาย
บทสรุป
สิ้นสุดบทความนี้ ฉันหวังว่าคุณจะพบว่าบทความนี้มีประโยชน์ หลังจากอ่านบทความนี้แล้ว คุณจะสามารถคำนวณค่าผิดปกติใน Excel โดยใช้วิธีใดก็ได้ โปรดแบ่งปันคำถามหรือคำแนะนำเพิ่มเติมกับเราในส่วนความเห็นด้านล่าง