ວິທີການເອົາ Outliers ໃນ Excel (3 ວິທີ)

  • ແບ່ງປັນນີ້
Hugh West

ການຊອກຫາ outliers ແລະເອົາພວກມັນອອກແມ່ນວຽກທົ່ວໄປຫຼາຍໃນການວິເຄາະຂໍ້ມູນໃນສະຖິຕິ, ການຂຸດຄົ້ນຂໍ້ມູນ, ການຮຽນຮູ້ເຄື່ອງຈັກແລະອື່ນໆ. ມີຫຼາຍວິທີທີ່ເຈົ້າສາມາດຊອກຫາ outliers ໃນຊຸດຂໍ້ມູນຂອງທ່ານແຕ່ຂະບວນການທີ່ຈະເອົາພວກມັນອອກແມ່ນບໍ່ງ່າຍຫຼາຍ. ຊອກຫາ. ໃນບົດຄວາມນີ້, ພວກເຮົາຈະສະແດງວິທີການ ເອົາ outliers ໃນ Excel . ທີ່ນີ້.

ເອົາ Outliers.xlsx

Outliers ໃນ Excel ແມ່ນຫຍັງ?

ອັນ outlier ເປັນຄ່າທີ່ຫຼຸດອອກຈາກຄ່າສະເລ່ຍ ຫຼືຄ່າປານກາງຂອງຊຸດຂໍ້ມູນ. ເວົ້າອີກຢ່າງໜຶ່ງ, outliers ແມ່ນຄ່າທີ່ສູງກວ່າ ຫຼືຕ່ຳກວ່າຄ່າທີ່ເຫຼືອຢູ່ໃນຊຸດຂໍ້ມູນ.

ໃຫ້ຄິດເຖິງການແຂ່ງຂັນຄຣິກເກັດທີ່ນັກຕີບານທັງໝົດໄດ້ຄະແນນປະມານ 50 ແຕ່ນັກຕີບານຄົນດຽວເທົ່ານັ້ນທີ່ເຮັດຄະແນນໄດ້ໜຶ່ງສະຕະວັດ (100 ) ແລະ batsman ອື່ນໄດ້ອອກຢູ່ທີ່ 0. 100 ແລະ 0 ຄະແນນນັ້ນແມ່ນ outliers ໃນການແຂ່ງຂັນນີ້. ສະນັ້ນມັນດີກວ່າທີ່ຈະຊອກຫາ outliers ແລະເອົາພວກມັນອອກເພື່ອໃຫ້ມີຊຸດຂໍ້ມູນທີ່ລຽບງ່າຍ.

3 ວິທີທີ່ຈະເອົາ Outliers ໃນ Excel

ໃນພາກນີ້, ທ່ານຈະໄດ້ຮຽນຮູ້ວິທີການ ລຶບ outliers ຈາກຊຸດຂໍ້ມູນຂອງທ່ານໃນ 3 ວິທີທີ່ແຕກຕ່າງກັນ. ການເອົາ outliers ອອກເປັນຂະບວນການທີ່ຫຍຸ້ງຍາກ, ສະນັ້ນອ່ານບົດຄວາມທັງຫມົດຢ່າງລະອຽດ.

1. ການນໍາໃຊ້ຟັງຊັນ Excel ເພື່ອຄິດໄລ່ສະເລ່ຍໂດຍບໍ່ມີການOutliers

Excel ຟັງຊັນ TRIMMEAN ສາມາດໃຊ້ເພື່ອຄິດໄລ່ຄ່າສະເລ່ຍຂອງຊຸດຂໍ້ມູນທີ່ໃຫ້ໃນຂະນະທີ່ບໍ່ລວມເອົາ outliers. ຂໍ້ມູນຈຸດທີ່ຈະຍົກເວັ້ນແມ່ນສະໜອງເປັນເປີເຊັນ. ຄ່າເປີເຊັນສາມາດຖືກປ້ອນເຂົ້າເປັນຮູບແບບທົດສະນິຍົມ ຫຼືຮູບແບບເປີເຊັນໄດ້.

Syntax ເພື່ອຄິດໄລ່ຄ່າສະເລ່ຍໂດຍບໍ່ມີຕົວອອກແມ່ນ,

=TRIMMEAN(array, ເປີເຊັນ)

ທີ່ນີ້,

  • ອາເຣ = ໄລຍະຂອງຂໍ້ມູນເພື່ອຕັດ ແລະຄຳນວນຜົນໄດ້ຮັບສະເລ່ຍ
  • ເປີເຊັນ = The ຈໍານວນຈຸດຂໍ້ມູນທີ່ຈະຍົກເວັ້ນ

ໃຫ້ພວກເຮົາເບິ່ງວິທີການປະຕິບັດຫນ້າທີ່ນີ້ເພື່ອຄິດໄລ່ຜົນໄດ້ຮັບທີ່ມີ outliers ທີ່ຖືກໂຍກຍ້າຍອອກ.

ພິຈາລະນາຮູບຂ້າງເທິງ. ພວກເຮົາມີຂໍ້ມູນຈາກ Cell B5 ຫາ B14 . ນີ້ແມ່ນຕົວເລກສ່ວນໃຫຍ່ຢູ່ລະຫວ່າງ 20 ຫາ 27, ແຕ່ສອງຄ່າ – 0 ແລະ 100 – ແມ່ນທາງໄກຈາກຄ່າເຫຼົ່ານັ້ນ. ດັ່ງນັ້ນເຫຼົ່ານີ້ແມ່ນ outliers ໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາ.

ສໍາລັບຊຸດຂໍ້ມູນຂອງພວກເຮົາ, ສູດການຄິດໄລ່ຄ່າສະເລ່ຍ (ສະເລ່ຍ) ໂດຍບໍ່ມີຄ່າ outlier ດ້ວຍ Excel TRIMMEAN function ແມ່ນ,

=TRIMMEAN(B5:B14,0.2)

ນີ້,

  • B5:B14 = ຊ່ວງຂໍ້ມູນເພື່ອຕັດ ແລະຄຳນວນຜົນສະເລ່ຍ
  • 0.2 (ຫຼື 20%) = ຈຳນວນຈຸດຂໍ້ມູນທີ່ຈະຍົກເວັ້ນ

ຖ້າຕົວເລກໃດນຶ່ງໃນຊຸດຂໍ້ມູນຫຼຸດລົງ 20% ທາງສ່ວນທີ່ເຫຼືອຂອງຊຸດຂໍ້ມູນ , ຫຼັງຈາກນັ້ນຕົວເລກນັ້ນຈະຖືກເອີ້ນວ່າ outliers.

ຖ້າທ່ານຂຽນສູດຕາມຊຸດຂໍ້ມູນຂອງທ່ານແລະກົດ Enter , ທ່ານຈະໄດ້ຮັບ ຄ່າສະເລ່ຍຂອງການຄິດໄລ່ໂດຍບໍ່ມີ outliers. ສຳລັບຊຸດຂໍ້ມູນຂອງທ່ານ. ໃນກໍລະນີຂອງພວກເຮົາ, Cell E6 ຖືຄ່າສະເລ່ຍທີ່ຄິດໄລ່ແມ່ນ 23.50 .

ເພື່ອກວດເບິ່ງວ່າຄໍາຕອບຖືກຕ້ອງຫຼືບໍ່, ພວກເຮົາດໍາເນີນການ AVERAGE function ໃນ Cell E5 ເຊິ່ງໃຫ້ຄ່າສະເລ່ຍ ( 28.80 ) ຂອງຄ່າທັງໝົດໃນຂອບເຂດ B5:B14 . ແລະໃນ Cell E7 , ພວກເຮົາເອີ້ນໃຊ້ຟັງຊັນ AVERAGE ອື່ນໂດຍການປ້ອນເຊລທັງໝົດດ້ວຍຕົນເອງ ຍົກເວັ້ນຄ່າທີ່ຖືຄ່າ outliers, ແລະໄດ້ຮັບຜົນຕອບແທນເປັນ 23.50 .

ດັ່ງນັ້ນພວກເຮົາສາມາດເວົ້າໄດ້ວ່າຟັງຊັນ TRIMMEAN ສາມາດເອົາ outliers ອອກຈາກຊຸດຂໍ້ມູນທີ່ໃຫ້ໄດ້ຢ່າງສໍາເລັດຜົນໃນຂະນະທີ່ຄິດໄລ່ຄ່າສະເລ່ຍໃນ Excel.

ອ່ານເພີ່ມເຕີມ: ວິທີລຶບສູດໃນ Excel (7+ ວິທີການ)

2. ເອົາ Outliers ອອກຈາກຊຸດຂໍ້ມູນ ແລະ Line Chart ໃນ Excel

ໃຫ້ສັງເກດຮູບຕໍ່ໄປນີ້. ພວກ​ເຮົາ​ມີ​ຂໍ້​ມູນ​ບາງ​ຢ່າງ​ໂດຍ​ອີງ​ໃສ່​ການ​ທີ່​ພວກ​ເຮົາ​ໄດ້​ສ້າງ​ເສັ້ນ​ສະ​ແດງ​ຜົນ​. ຈາກເສັ້ນກຣາບ, ພວກເຮົາສາມາດເຫັນໄດ້ຢ່າງງ່າຍດາຍວ່າໃນ ຈຸດຂໍ້ມູນ 4 ແລະ 8 ພວກເຮົາມີ outliers ຂອງພວກເຮົາ .

ຕອນນີ້ພວກເຮົາຈະເບິ່ງວິທີທີ່ພວກເຮົາສາມາດລຽບໄດ້. ອອກຈາກຕາຕະລາງເສັ້ນໂດຍການເອົາຄ່າທີ່ຫ່າງໄກອອກຈາກຊຸດຂໍ້ມູນ.

ໃນເຊລອື່ນ (ໃນກໍລະນີຂອງພວກເຮົາມັນເປັນ Cell H6 ), ຂຽນສູດຕໍ່ໄປນີ້,

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)

ນີ້,

  • C6 = ຕາລາງທີ່ເກັບຂໍ້ມູນທຳອິດໃນຊຸດຂໍ້ມູນ
  • C5 = ເຊວຂ້າງເທິງຕາລາງຂໍ້ມູນທຳອິດ
  • C7 = ເຊວຂ້າງລຸ່ມຕາລາງຂໍ້ມູນທຳອິດ
  • $E$6 = ຄວາມແຕກຕ່າງລະຫວ່າງຈຸດຂໍ້ມູນ .

ກຳລັງເບິ່ງຂໍ້​ມູນ​ຂອງ​ພວກ​ເຮົາ​, ມັນ​ເບິ່ງ​ຄື​ວ່າ​ໃນ​ເວ​ລາ​ທີ່​ຈຸດ​ຂໍ້​ມູນ​ແມ່ນ ຄວາມ​ແຕກ​ຕ່າງ 10 ຫົວ​ຫນ່ວຍ ຈາກ​ຄົນ​ອື່ນ​, ຖືກ​ກໍາ​ນົດ​ເປັນ outlier . ດັ່ງນັ້ນ, ພວກເຮົາເອົາ 10 ໄວ້ໃນ Cell E6 ແລະເຮັດໃຫ້ມັນເປັນ ການອ້າງອີງເຊລຢ່າງແທ້ຈິງ ເພື່ອວ່າເຊລນີ້ຈະຖືກແກ້ໄຂໃນຂະນະທີ່ສະແກນ ແລະຄຳນວນຜ່ານຊຸດຂໍ້ມູນທັງໝົດ.

ຫຼັງຈາກກົດ Enter , ທ່ານສາມາດເບິ່ງຂໍ້ມູນທໍາອິດຍັງປາກົດຢູ່ໃນຕາລາງຜົນໄດ້ຮັບ H6 . ທັງໝົດທີ່ທ່ານຕ້ອງເຮັດຢູ່ນີ້ແມ່ນ, ພຽງແຕ່ສ້າງສູດເພື່ອໃຫ້ພວກເຮົາສາມາດລາກ Fill Handle ເພື່ອນຳໃຊ້ສູດໃສ່ສ່ວນທີ່ເຫຼືອຂອງເຊວໄດ້.

ຕອນນີ້ລາກແຖວລົງດ້ວຍ Fill Handle ແລະທ່ານຈະເຫັນຕາລາງທີ່ຖືເອົາເສັ້ນຂ້າງນອກນັ້ນເຕັມໄປດ້ວຍ #N/A .

ແລະເບິ່ງຕາຕະລາງເສັ້ນດຽວນີ້, ນີ້ແມ່ນເສັ້ນກຣາບທີ່ແປແລ້ວໂດຍບໍ່ມີຄ່າທີ່ຫ່າງໄກໃນມັນ.

ການແບ່ງສູດ

=IF(

ເມື່ອພວກເຮົາກຳລັງຈະປຽບທຽບຄ່າຕາມທີ່ພວກເຮົາຈະແຍກຜົນອອກມາ, ພວກເຮົາເລີ່ມສູດຄຳນວນດ້ວຍ ເງື່ອນໄຂ IF .

=IF(AND(

ພວກເຮົາຈະປຽບທຽບຈຸດຂໍ້ມູນປັດຈຸບັນ ແລະເຊລຂ້າງເທິງ ແລະຕາລາງຂ້າງລຸ່ມ. ແລະຖ້າຫາກວ່າການປຽບທຽບທັງສອງເປັນຄວາມຈິງ, ພຽງແຕ່ຫຼັງຈາກນັ້ນພວກເຮົາຈະສະແດງຈຸດຂໍ້ມູນເປັນຜົນໄດ້ຮັບ. ດັ່ງນັ້ນ, ເນື່ອງຈາກວ່າພວກເຮົາຈໍາເປັນຕ້ອງຈັດການກັບການປຽບທຽບ "ທັງສອງ" ດັ່ງນັ້ນພວກເຮົາຄວນຈະນໍາໃຊ້ຫນ້າທີ່ AND .

=IF(AND(ABS(

) ເມື່ອພວກເຮົາລົບຈຸດຂໍ້ມູນ, ບາງຂໍ້ມູນອາດຈະຖິ້ມຄ່າລົບ. ແລະພວກເຮົາເຮັດ ບໍ່ຕ້ອງການທີ່ຈະຈັດການກັບຄ່າທາງລົບຍ້ອນວ່າຄ່າລົບຈະກົງກັນຂ້າມກັບເງື່ອນໄຂຂອງ "ການຖອນຂໍ້ມູນໃນເວລາທີ່ຄວາມແຕກຕ່າງແມ່ນ 10". ດັ່ງນັ້ນເພື່ອໃຫ້ແນ່ໃຈວ່າພວກເຮົາໄດ້ຮັບຜົນບວກສະເໝີ, ພວກເຮົາຈໍາເປັນຕ້ອງໄດ້ສະຫຼຸບການປຽບທຽບໃນ ຟັງຊັນຄ່າຢ່າງແທ້ຈິງ .

=IF(AND(ABS(C6-C5)>) ;$E$6

ນີ້ພວກເຮົາໄດ້ເລີ່ມການປຽບທຽບຄັ້ງທຳອິດຂອງພວກເຮົາ. ພວກເຮົາພຽງແຕ່ຫັກຄ່າປັດຈຸບັນດ້ວຍຄ່າຂ້າງເທິງນີ້ ແລະເບິ່ງວ່າຜົນໄດ້ຮັບແມ່ນໃຫຍ່ກວ່າລະດັບຄວາມແຕກຕ່າງທີ່ເກັບໄວ້ໃນ Cell E6<2 ຫຼືບໍ່> ແລະເຮັດໃຫ້ເຊລເປັນ ການອ້າງອີງຢ່າງແທ້ຈິງ ເພື່ອຮັກສາຄ່າເຊລຖືກລັອກ.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6) -C7)>$E$6)

ຕໍ່ໄປ, ສ່ວນທີສອງຂອງການປຽບທຽບທີ່ແຍກດ້ວຍເຄື່ອງໝາຍຈຸດ. ມັນຈະປຽບທຽບຈຸດຂໍ້ມູນປັດຈຸບັນກັບຈຸດຂໍ້ມູນຕໍ່ໄປ.

=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()

ຕອນນີ້ພວກເຮົາໃສ່ ເຄື່ອງໝາຍຈຸດ ແລະກຳນົດໃຫ້ໃສ່ ຟັງຊັນ NA ຢູ່ໃນນັ້ນ ຖ້າຟັງຊັນ AND ທັງສອງເປັນຈິງ.

=IF(AND(ABS(C6-C5)) >$E$6,ABS(C6-C7)>$E$6),NA(),C6)

ແລະ ຖ້າຟັງຊັນ AND ບໍ່ແມ່ນຄວາມຈິງ ພວກເຮົາ ຕ້ອງການກັບຄືນຈຸດຂໍ້ມູນຕົວຈິງເປັນ IF ຄ່າທີ່ບໍ່ຖືກຕ້ອງ. ດັ່ງນັ້ນພວກເຮົາຈຶ່ງພິມ e ໃນເຄື່ອງໝາຍຈຸດ ແລະສົ່ງເລກອ້າງອີງຕາລາງ C6 ຢູ່ໃນນັ້ນ.

ອ່ານເພີ່ມເຕີມ: ວິທີລຶບການກວດສອບຂໍ້ມູນໃນ Excel (5 ວິທີ)

ການອ່ານທີ່ຄ້າຍກັນ

  • ວິທີລຶບສ່ວນຫົວໃນ Excel (4 ວິທີ)
  • ເອົາເສັ້ນຈຸດອອກໃນExcel (5 ວິທີດ່ວນ)
  • ວິທີລຶບ Grid ຈາກ Excel (6 ວິທີງ່າຍໆ)
  • ເອົາຂອບໃນ Excel (4 ວິທີດ່ວນ)
  • ວິທີລຶບໂໝດເຂົ້າກັນໄດ້ໃນ Excel (2 ວິທີງ່າຍໆ)

3. ເອົາ Outliers ດ້ວຍຕົນເອງໃນ Excel

ອີກວິທີໜຶ່ງທີ່ງ່າຍໃນການກໍາຈັດ outliers ໃນ Excel ແມ່ນ, ພຽງແຕ່ຈັດຮຽງຄ່າຂອງຊຸດຂໍ້ມູນຂອງທ່ານ ແລະລຶບຄ່າເທິງ ແລະລຸ່ມອອກຈາກມັນ.

ເພື່ອຈັດຮຽງ. ຂໍ້ມູນ,

  • ເລືອກ ຊຸດຂໍ້ມູນ.
  • ໄປທີ່ ຈັດຮຽງ & ກັ່ນຕອງ ໃນກຸ່ມ ການແກ້ໄຂ ແລະເລືອກ ຈັດຮຽງນ້ອຍສຸດຫາໃຫຍ່ສຸດ ຫຼື ຈັດຮຽງໃຫຍ່ສຸດຫານ້ອຍສຸດ .

<19

  • ໃນກໍລະນີຂອງພວກເຮົາ, ພວກເຮົາໄດ້ເລືອກ ຈັດຮຽງນ້ອຍສຸດຫາໃຫຍ່ສຸດ . ມັນຈັດຮຽງຕົວເລກໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາຕາມລຳດັບແຕ່ໃຫຍ່ຫານ້ອຍ, ວາງໂຕນ້ອຍສຸດຢູ່ເທິງສຸດ ແລະໂຕໃຫຍ່ສຸດຢູ່ລຸ່ມສຸດ.

ດຽວນີ້ພຽງແຕ່ລຶບຂໍ້ມູນເຫຼົ່ານັ້ນອອກເອງ. ເພື່ອເຮັດໃຫ້ຊຸດຂໍ້ມູນ outlying ຄ່າບໍ່ເສຍຄ່າ.

ພວກເຮົາບໍ່ແນະນໍາໃຫ້ປະຕິບັດຕາມຂະບວນການນີ້ໃນຂະນະທີ່ເຮັດວຽກກັບຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່. ເມື່ອຊຸດຂໍ້ມູນຂອງທ່ານມີຂະໜາດນ້ອຍ ແລະເບິ່ງງ່າຍກວ່າ, ພຽງແຕ່ເຈົ້າສາມາດນຳໃຊ້ຂັ້ນຕອນນີ້, ຖ້າບໍ່ດັ່ງນັ້ນ ຢ່າປະຕິບັດອັນນີ້.

ອ່ານເພີ່ມເຕີມ: ວິທີລຶບການຈັດລຽງໃນ Excel ( 3 ວິທີງ່າຍໆ)

ບົດສະຫຼຸບ

ບົດຄວາມນີ້ໄດ້ສະແດງໃຫ້ທ່ານເຫັນວິທີ ເອົາ outliers ອອກ ໃນ Excel. ຂ້າພະເຈົ້າຫວັງວ່າບົດຄວາມນີ້ຈະເປັນປະໂຫຍດຫຼາຍສໍາລັບທ່ານ. ຮູ້ສຶກບໍ່ເສຍຄ່າທີ່ຈະຖາມຖ້າຫາກວ່າທ່ານມີຄໍາຖາມໃດໆກ່ຽວກັບຫົວຂໍ້.

Hugh West ເປັນຄູຝຶກ Excel ທີ່ມີປະສົບການສູງແລະນັກວິເຄາະທີ່ມີປະສົບການຫຼາຍກວ່າ 10 ປີໃນອຸດສາຫະກໍາ. ລາວຈົບປະລິນຍາຕີສາຂາບັນຊີ ແລະການເງິນ ແລະປະລິນຍາໂທສາຂາບໍລິຫານທຸລະກິດ. Hugh ມີຄວາມກະຕືລືລົ້ນໃນການສອນແລະໄດ້ພັດທະນາວິທີການສອນທີ່ເປັນເອກະລັກທີ່ງ່າຍຕໍ່ການຕິດຕາມແລະເຂົ້າໃຈ. ຄວາມຮູ້ຊ່ຽວຊານຂອງລາວກ່ຽວກັບ Excel ໄດ້ຊ່ວຍໃຫ້ນັກຮຽນແລະຜູ້ຊ່ຽວຊານຫລາຍພັນຄົນໃນທົ່ວໂລກປັບປຸງທັກສະຂອງເຂົາເຈົ້າແລະດີເລີດໃນອາຊີບຂອງພວກເຂົາ. ຜ່ານ blog ຂອງລາວ, Hugh ແບ່ງປັນຄວາມຮູ້ຂອງລາວກັບໂລກ, ສະຫນອງການສອນ Excel ຟຣີແລະການຝຶກອົບຮົມອອນໄລນ໌ເພື່ອຊ່ວຍໃຫ້ບຸກຄົນແລະທຸລະກິດສາມາດບັນລຸທ່າແຮງຂອງພວກເຂົາ.