ສາລະບານ
ການຊອກຫາ outliers ແລະເອົາພວກມັນອອກແມ່ນວຽກທົ່ວໄປຫຼາຍໃນການວິເຄາະຂໍ້ມູນໃນສະຖິຕິ, ການຂຸດຄົ້ນຂໍ້ມູນ, ການຮຽນຮູ້ເຄື່ອງຈັກແລະອື່ນໆ. ມີຫຼາຍວິທີທີ່ເຈົ້າສາມາດຊອກຫາ outliers ໃນຊຸດຂໍ້ມູນຂອງທ່ານແຕ່ຂະບວນການທີ່ຈະເອົາພວກມັນອອກແມ່ນບໍ່ງ່າຍຫຼາຍ. ຊອກຫາ. ໃນບົດຄວາມນີ້, ພວກເຮົາຈະສະແດງວິທີການ ເອົາ outliers ໃນ Excel . ທີ່ນີ້.
ເອົາ Outliers.xlsx
Outliers ໃນ Excel ແມ່ນຫຍັງ?
ອັນ outlier ເປັນຄ່າທີ່ຫຼຸດອອກຈາກຄ່າສະເລ່ຍ ຫຼືຄ່າປານກາງຂອງຊຸດຂໍ້ມູນ. ເວົ້າອີກຢ່າງໜຶ່ງ, outliers ແມ່ນຄ່າທີ່ສູງກວ່າ ຫຼືຕ່ຳກວ່າຄ່າທີ່ເຫຼືອຢູ່ໃນຊຸດຂໍ້ມູນ.
ໃຫ້ຄິດເຖິງການແຂ່ງຂັນຄຣິກເກັດທີ່ນັກຕີບານທັງໝົດໄດ້ຄະແນນປະມານ 50 ແຕ່ນັກຕີບານຄົນດຽວເທົ່ານັ້ນທີ່ເຮັດຄະແນນໄດ້ໜຶ່ງສະຕະວັດ (100 ) ແລະ batsman ອື່ນໄດ້ອອກຢູ່ທີ່ 0. 100 ແລະ 0 ຄະແນນນັ້ນແມ່ນ outliers ໃນການແຂ່ງຂັນນີ້. ສະນັ້ນມັນດີກວ່າທີ່ຈະຊອກຫາ outliers ແລະເອົາພວກມັນອອກເພື່ອໃຫ້ມີຊຸດຂໍ້ມູນທີ່ລຽບງ່າຍ.
3 ວິທີທີ່ຈະເອົາ Outliers ໃນ Excel
ໃນພາກນີ້, ທ່ານຈະໄດ້ຮຽນຮູ້ວິທີການ ລຶບ outliers ຈາກຊຸດຂໍ້ມູນຂອງທ່ານໃນ 3 ວິທີທີ່ແຕກຕ່າງກັນ. ການເອົາ outliers ອອກເປັນຂະບວນການທີ່ຫຍຸ້ງຍາກ, ສະນັ້ນອ່ານບົດຄວາມທັງຫມົດຢ່າງລະອຽດ.
1. ການນໍາໃຊ້ຟັງຊັນ Excel ເພື່ອຄິດໄລ່ສະເລ່ຍໂດຍບໍ່ມີການOutliers
Excel ຟັງຊັນ TRIMMEAN ສາມາດໃຊ້ເພື່ອຄິດໄລ່ຄ່າສະເລ່ຍຂອງຊຸດຂໍ້ມູນທີ່ໃຫ້ໃນຂະນະທີ່ບໍ່ລວມເອົາ outliers. ຂໍ້ມູນຈຸດທີ່ຈະຍົກເວັ້ນແມ່ນສະໜອງເປັນເປີເຊັນ. ຄ່າເປີເຊັນສາມາດຖືກປ້ອນເຂົ້າເປັນຮູບແບບທົດສະນິຍົມ ຫຼືຮູບແບບເປີເຊັນໄດ້.
Syntax ເພື່ອຄິດໄລ່ຄ່າສະເລ່ຍໂດຍບໍ່ມີຕົວອອກແມ່ນ,
=TRIMMEAN(array, ເປີເຊັນ)ທີ່ນີ້,
- ອາເຣ = ໄລຍະຂອງຂໍ້ມູນເພື່ອຕັດ ແລະຄຳນວນຜົນໄດ້ຮັບສະເລ່ຍ
- ເປີເຊັນ = The ຈໍານວນຈຸດຂໍ້ມູນທີ່ຈະຍົກເວັ້ນ
ໃຫ້ພວກເຮົາເບິ່ງວິທີການປະຕິບັດຫນ້າທີ່ນີ້ເພື່ອຄິດໄລ່ຜົນໄດ້ຮັບທີ່ມີ outliers ທີ່ຖືກໂຍກຍ້າຍອອກ.
ພິຈາລະນາຮູບຂ້າງເທິງ. ພວກເຮົາມີຂໍ້ມູນຈາກ Cell B5 ຫາ B14 . ນີ້ແມ່ນຕົວເລກສ່ວນໃຫຍ່ຢູ່ລະຫວ່າງ 20 ຫາ 27, ແຕ່ສອງຄ່າ – 0 ແລະ 100 – ແມ່ນທາງໄກຈາກຄ່າເຫຼົ່ານັ້ນ. ດັ່ງນັ້ນເຫຼົ່ານີ້ແມ່ນ outliers ໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາ.
ສໍາລັບຊຸດຂໍ້ມູນຂອງພວກເຮົາ, ສູດການຄິດໄລ່ຄ່າສະເລ່ຍ (ສະເລ່ຍ) ໂດຍບໍ່ມີຄ່າ outlier ດ້ວຍ Excel TRIMMEAN function ແມ່ນ,
=TRIMMEAN(B5:B14,0.2)
ນີ້,
- B5:B14 = ຊ່ວງຂໍ້ມູນເພື່ອຕັດ ແລະຄຳນວນຜົນສະເລ່ຍ
- 0.2 (ຫຼື 20%) = ຈຳນວນຈຸດຂໍ້ມູນທີ່ຈະຍົກເວັ້ນ
ຖ້າຕົວເລກໃດນຶ່ງໃນຊຸດຂໍ້ມູນຫຼຸດລົງ 20% ທາງສ່ວນທີ່ເຫຼືອຂອງຊຸດຂໍ້ມູນ , ຫຼັງຈາກນັ້ນຕົວເລກນັ້ນຈະຖືກເອີ້ນວ່າ outliers.
ຖ້າທ່ານຂຽນສູດຕາມຊຸດຂໍ້ມູນຂອງທ່ານແລະກົດ Enter , ທ່ານຈະໄດ້ຮັບ ຄ່າສະເລ່ຍຂອງການຄິດໄລ່ໂດຍບໍ່ມີ outliers. ສຳລັບຊຸດຂໍ້ມູນຂອງທ່ານ. ໃນກໍລະນີຂອງພວກເຮົາ, Cell E6 ຖືຄ່າສະເລ່ຍທີ່ຄິດໄລ່ແມ່ນ 23.50 .
ເພື່ອກວດເບິ່ງວ່າຄໍາຕອບຖືກຕ້ອງຫຼືບໍ່, ພວກເຮົາດໍາເນີນການ AVERAGE function ໃນ Cell E5 ເຊິ່ງໃຫ້ຄ່າສະເລ່ຍ ( 28.80 ) ຂອງຄ່າທັງໝົດໃນຂອບເຂດ B5:B14 . ແລະໃນ Cell E7 , ພວກເຮົາເອີ້ນໃຊ້ຟັງຊັນ AVERAGE ອື່ນໂດຍການປ້ອນເຊລທັງໝົດດ້ວຍຕົນເອງ ຍົກເວັ້ນຄ່າທີ່ຖືຄ່າ outliers, ແລະໄດ້ຮັບຜົນຕອບແທນເປັນ 23.50 .
ດັ່ງນັ້ນພວກເຮົາສາມາດເວົ້າໄດ້ວ່າຟັງຊັນ TRIMMEAN ສາມາດເອົາ outliers ອອກຈາກຊຸດຂໍ້ມູນທີ່ໃຫ້ໄດ້ຢ່າງສໍາເລັດຜົນໃນຂະນະທີ່ຄິດໄລ່ຄ່າສະເລ່ຍໃນ Excel.
ອ່ານເພີ່ມເຕີມ: ວິທີລຶບສູດໃນ Excel (7+ ວິທີການ)
2. ເອົາ Outliers ອອກຈາກຊຸດຂໍ້ມູນ ແລະ Line Chart ໃນ Excel
ໃຫ້ສັງເກດຮູບຕໍ່ໄປນີ້. ພວກເຮົາມີຂໍ້ມູນບາງຢ່າງໂດຍອີງໃສ່ການທີ່ພວກເຮົາໄດ້ສ້າງເສັ້ນສະແດງຜົນ. ຈາກເສັ້ນກຣາບ, ພວກເຮົາສາມາດເຫັນໄດ້ຢ່າງງ່າຍດາຍວ່າໃນ ຈຸດຂໍ້ມູນ 4 ແລະ 8 ພວກເຮົາມີ outliers ຂອງພວກເຮົາ .
ຕອນນີ້ພວກເຮົາຈະເບິ່ງວິທີທີ່ພວກເຮົາສາມາດລຽບໄດ້. ອອກຈາກຕາຕະລາງເສັ້ນໂດຍການເອົາຄ່າທີ່ຫ່າງໄກອອກຈາກຊຸດຂໍ້ມູນ.
ໃນເຊລອື່ນ (ໃນກໍລະນີຂອງພວກເຮົາມັນເປັນ Cell H6 ), ຂຽນສູດຕໍ່ໄປນີ້,
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ນີ້,
- C6 = ຕາລາງທີ່ເກັບຂໍ້ມູນທຳອິດໃນຊຸດຂໍ້ມູນ
- C5 = ເຊວຂ້າງເທິງຕາລາງຂໍ້ມູນທຳອິດ
- C7 = ເຊວຂ້າງລຸ່ມຕາລາງຂໍ້ມູນທຳອິດ
- $E$6 = ຄວາມແຕກຕ່າງລະຫວ່າງຈຸດຂໍ້ມູນ .
ກຳລັງເບິ່ງຂໍ້ມູນຂອງພວກເຮົາ, ມັນເບິ່ງຄືວ່າໃນເວລາທີ່ຈຸດຂໍ້ມູນແມ່ນ ຄວາມແຕກຕ່າງ 10 ຫົວຫນ່ວຍ ຈາກຄົນອື່ນ, ຖືກກໍານົດເປັນ outlier . ດັ່ງນັ້ນ, ພວກເຮົາເອົາ 10 ໄວ້ໃນ Cell E6 ແລະເຮັດໃຫ້ມັນເປັນ ການອ້າງອີງເຊລຢ່າງແທ້ຈິງ ເພື່ອວ່າເຊລນີ້ຈະຖືກແກ້ໄຂໃນຂະນະທີ່ສະແກນ ແລະຄຳນວນຜ່ານຊຸດຂໍ້ມູນທັງໝົດ.
ຫຼັງຈາກກົດ Enter , ທ່ານສາມາດເບິ່ງຂໍ້ມູນທໍາອິດຍັງປາກົດຢູ່ໃນຕາລາງຜົນໄດ້ຮັບ H6 . ທັງໝົດທີ່ທ່ານຕ້ອງເຮັດຢູ່ນີ້ແມ່ນ, ພຽງແຕ່ສ້າງສູດເພື່ອໃຫ້ພວກເຮົາສາມາດລາກ Fill Handle ເພື່ອນຳໃຊ້ສູດໃສ່ສ່ວນທີ່ເຫຼືອຂອງເຊວໄດ້.
ຕອນນີ້ລາກແຖວລົງດ້ວຍ Fill Handle ແລະທ່ານຈະເຫັນຕາລາງທີ່ຖືເອົາເສັ້ນຂ້າງນອກນັ້ນເຕັມໄປດ້ວຍ #N/A .
ແລະເບິ່ງຕາຕະລາງເສັ້ນດຽວນີ້, ນີ້ແມ່ນເສັ້ນກຣາບທີ່ແປແລ້ວໂດຍບໍ່ມີຄ່າທີ່ຫ່າງໄກໃນມັນ.
ການແບ່ງສູດ
=IF(
ເມື່ອພວກເຮົາກຳລັງຈະປຽບທຽບຄ່າຕາມທີ່ພວກເຮົາຈະແຍກຜົນອອກມາ, ພວກເຮົາເລີ່ມສູດຄຳນວນດ້ວຍ ເງື່ອນໄຂ IF .
=IF(AND(
ພວກເຮົາຈະປຽບທຽບຈຸດຂໍ້ມູນປັດຈຸບັນ ແລະເຊລຂ້າງເທິງ ແລະຕາລາງຂ້າງລຸ່ມ. ແລະຖ້າຫາກວ່າການປຽບທຽບທັງສອງເປັນຄວາມຈິງ, ພຽງແຕ່ຫຼັງຈາກນັ້ນພວກເຮົາຈະສະແດງຈຸດຂໍ້ມູນເປັນຜົນໄດ້ຮັບ. ດັ່ງນັ້ນ, ເນື່ອງຈາກວ່າພວກເຮົາຈໍາເປັນຕ້ອງຈັດການກັບການປຽບທຽບ "ທັງສອງ" ດັ່ງນັ້ນພວກເຮົາຄວນຈະນໍາໃຊ້ຫນ້າທີ່ AND .
=IF(AND(ABS(
) ເມື່ອພວກເຮົາລົບຈຸດຂໍ້ມູນ, ບາງຂໍ້ມູນອາດຈະຖິ້ມຄ່າລົບ. ແລະພວກເຮົາເຮັດ ບໍ່ຕ້ອງການທີ່ຈະຈັດການກັບຄ່າທາງລົບຍ້ອນວ່າຄ່າລົບຈະກົງກັນຂ້າມກັບເງື່ອນໄຂຂອງ "ການຖອນຂໍ້ມູນໃນເວລາທີ່ຄວາມແຕກຕ່າງແມ່ນ 10". ດັ່ງນັ້ນເພື່ອໃຫ້ແນ່ໃຈວ່າພວກເຮົາໄດ້ຮັບຜົນບວກສະເໝີ, ພວກເຮົາຈໍາເປັນຕ້ອງໄດ້ສະຫຼຸບການປຽບທຽບໃນ ຟັງຊັນຄ່າຢ່າງແທ້ຈິງ .
=IF(AND(ABS(C6-C5)>) ;$E$6
ນີ້ພວກເຮົາໄດ້ເລີ່ມການປຽບທຽບຄັ້ງທຳອິດຂອງພວກເຮົາ. ພວກເຮົາພຽງແຕ່ຫັກຄ່າປັດຈຸບັນດ້ວຍຄ່າຂ້າງເທິງນີ້ ແລະເບິ່ງວ່າຜົນໄດ້ຮັບແມ່ນໃຫຍ່ກວ່າລະດັບຄວາມແຕກຕ່າງທີ່ເກັບໄວ້ໃນ Cell E6<2 ຫຼືບໍ່> ແລະເຮັດໃຫ້ເຊລເປັນ ການອ້າງອີງຢ່າງແທ້ຈິງ ເພື່ອຮັກສາຄ່າເຊລຖືກລັອກ.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)
ຕໍ່ໄປ, ສ່ວນທີສອງຂອງການປຽບທຽບທີ່ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດ. ມັນຈະປຽບທຽບຈຸດຂໍ້ມູນປັດຈຸບັນກັບຈຸດຂໍ້ມູນຕໍ່ໄປ.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
ຕອນນີ້ພວກເຮົາໃສ່ ເຄື່ອງໝາຍຈຸດ ແລະກຳນົດໃຫ້ໃສ່ ຟັງຊັນ NA ຢູ່ໃນນັ້ນ ຖ້າຟັງຊັນ AND ທັງສອງເປັນຈິງ.
=IF(AND(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)
ແລະ ຖ້າຟັງຊັນ AND ບໍ່ແມ່ນຄວາມຈິງ ພວກເຮົາ ຕ້ອງການກັບຄືນຈຸດຂໍ້ມູນຕົວຈິງເປັນ IF ຄ່າທີ່ບໍ່ຖືກຕ້ອງ. ດັ່ງນັ້ນພວກເຮົາຈຶ່ງພິມ e ໃນເຄື່ອງໝາຍຈຸດ ແລະສົ່ງເລກອ້າງອີງຕາລາງ C6 ຢູ່ໃນນັ້ນ.
ອ່ານເພີ່ມເຕີມ: ວິທີລຶບການກວດສອບຂໍ້ມູນໃນ Excel (5 ວິທີ)
ການອ່ານທີ່ຄ້າຍກັນ
- ວິທີລຶບສ່ວນຫົວໃນ Excel (4 ວິທີ)
- ເອົາເສັ້ນຈຸດອອກໃນExcel (5 ວິທີດ່ວນ)
- ວິທີລຶບ Grid ຈາກ Excel (6 ວິທີງ່າຍໆ)
- ເອົາຂອບໃນ Excel (4 ວິທີດ່ວນ)
- ວິທີລຶບໂໝດເຂົ້າກັນໄດ້ໃນ Excel (2 ວິທີງ່າຍໆ)
3. ເອົາ Outliers ດ້ວຍຕົນເອງໃນ Excel
ອີກວິທີໜຶ່ງທີ່ງ່າຍໃນການກໍາຈັດ outliers ໃນ Excel ແມ່ນ, ພຽງແຕ່ຈັດຮຽງຄ່າຂອງຊຸດຂໍ້ມູນຂອງທ່ານ ແລະລຶບຄ່າເທິງ ແລະລຸ່ມອອກຈາກມັນ.
ເພື່ອຈັດຮຽງ. ຂໍ້ມູນ,
- ເລືອກ ຊຸດຂໍ້ມູນ.
- ໄປທີ່ ຈັດຮຽງ & ກັ່ນຕອງ ໃນກຸ່ມ ການແກ້ໄຂ ແລະເລືອກ ຈັດຮຽງນ້ອຍສຸດຫາໃຫຍ່ສຸດ ຫຼື ຈັດຮຽງໃຫຍ່ສຸດຫານ້ອຍສຸດ .
<19
- ໃນກໍລະນີຂອງພວກເຮົາ, ພວກເຮົາໄດ້ເລືອກ ຈັດຮຽງນ້ອຍສຸດຫາໃຫຍ່ສຸດ . ມັນຈັດຮຽງຕົວເລກໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາຕາມລຳດັບແຕ່ໃຫຍ່ຫານ້ອຍ, ວາງໂຕນ້ອຍສຸດຢູ່ເທິງສຸດ ແລະໂຕໃຫຍ່ສຸດຢູ່ລຸ່ມສຸດ.
ດຽວນີ້ພຽງແຕ່ລຶບຂໍ້ມູນເຫຼົ່ານັ້ນອອກເອງ. ເພື່ອເຮັດໃຫ້ຊຸດຂໍ້ມູນ outlying ຄ່າບໍ່ເສຍຄ່າ.
ພວກເຮົາບໍ່ແນະນໍາໃຫ້ປະຕິບັດຕາມຂະບວນການນີ້ໃນຂະນະທີ່ເຮັດວຽກກັບຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່. ເມື່ອຊຸດຂໍ້ມູນຂອງທ່ານມີຂະໜາດນ້ອຍ ແລະເບິ່ງງ່າຍກວ່າ, ພຽງແຕ່ເຈົ້າສາມາດນຳໃຊ້ຂັ້ນຕອນນີ້, ຖ້າບໍ່ດັ່ງນັ້ນ ຢ່າປະຕິບັດອັນນີ້.
ອ່ານເພີ່ມເຕີມ: ວິທີລຶບການຈັດລຽງໃນ Excel ( 3 ວິທີງ່າຍໆ)
ບົດສະຫຼຸບ
ບົດຄວາມນີ້ໄດ້ສະແດງໃຫ້ທ່ານເຫັນວິທີ ເອົາ outliers ອອກ ໃນ Excel. ຂ້າພະເຈົ້າຫວັງວ່າບົດຄວາມນີ້ຈະເປັນປະໂຫຍດຫຼາຍສໍາລັບທ່ານ. ຮູ້ສຶກບໍ່ເສຍຄ່າທີ່ຈະຖາມຖ້າຫາກວ່າທ່ານມີຄໍາຖາມໃດໆກ່ຽວກັບຫົວຂໍ້.