ສາລະບານ
ການວິເຄາະການຖົດຖອຍ ເປັນການຄິດໄລ່ທາງສະຖິຕິທີ່ໃຊ້ຢ່າງກວ້າງຂວາງ. ພວກເຮົາມັກຈະເຮັດການຄິດໄລ່ປະເພດນີ້ຕາມຄວາມປາຖະຫນາຂອງພວກເຮົາ. ໃນ Excel, ພວກເຮົາສາມາດປະຕິບັດ ການວິເຄາະການຖົດຖອຍຫຼາຍປະເພດ . ໃນບົດຄວາມນີ້, ພວກເຮົາຈະສະແດງວິທີການເຮັດ logistic regression ໃນ Excel. ຖ້າຫາກວ່າທ່ານຍັງມີຄວາມສົນໃຈທີ່ຈະຮຽນຮູ້ວິເຄາະນີ້, ດາວນ໌ໂຫລດປື້ມບັນທຶກການປະຕິບັດແລະປະຕິບັດຕາມພວກເຮົາ. 6>
Logistic Regression.xlsx
Logistic Regression ແມ່ນຫຍັງ?
ການວິເຄາະການຖົດຖອຍຂອງ logistic ແມ່ນວິທີການຮຽນຮູ້ທາງສະຖິຕິທີ່ໃຊ້ເພື່ອຄາດຄະເນມູນຄ່າຂອງຕົວແປທີ່ຂຶ້ນກັບໂດຍອີງຕາມເງື່ອນໄຂທີ່ເປັນເອກະລາດບາງອັນ. ມັນຊ່ວຍໃຫ້ບຸກຄົນໃດຫນຶ່ງໄດ້ຮັບຜົນໄດ້ຮັບຈາກຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ໂດຍອີງໃສ່ປະເພດທີ່ຕ້ອງການຂອງລາວ. ການວິເຄາະການຖົດຖອຍຂອງ Logistic Regression ສ່ວນໃຫຍ່ແມ່ນສາມປະເພດ:
- Binary Logistic Regression
- Multinomial Logistic Regression
- Ordinal Logistic Regression
Binary Logistic Regression: ໃນຮູບແບບການວິເຄາະ binary regression, ພວກເຮົາກໍານົດປະເພດຂອງພຽງແຕ່ສອງກໍລະນີ. ແມ່ນ/ບໍ່ ຫຼື ບວກ/ລົບ.
ການຖົດຖອຍຂອງລະບົບຂົນສົ່ງຫຼາຍດ້ານ: ການວິເຄາະທາງໂລຈິສຕິກ Multiminal ໃຊ້ໄດ້ກັບສາມປະເພດ ຫຼືຫຼາຍກວ່ານັ້ນ. ຖ້າພວກເຮົາມີຫຼາຍກວ່າສອງພາກສ່ວນເພື່ອຈັດປະເພດຂໍ້ມູນຂອງພວກເຮົາ, ພວກເຮົາສາມາດໃຊ້ແບບຈໍາລອງການວິເຄາະການຖົດຖອຍນີ້ໄດ້.
Ordinal LogisticRegression: ຮູບແບບການວິເຄາະການຖົດຖອຍນີ້ໃຊ້ໄດ້ຫຼາຍກວ່າສອງປະເພດ. ຢ່າງໃດກໍຕາມ, ໃນຮູບແບບນີ້, ພວກເຮົາຕ້ອງການຄໍາສັ່ງທີ່ກໍານົດໄວ້ລ່ວງຫນ້າເພື່ອຈັດປະເພດໃຫ້ເຂົາເຈົ້າ. ການວິເຄາະ. ປະເພດຂອງການວິເຄາະນີ້ໃຫ້ພວກເຮົາມີມູນຄ່າການຄາດຄະເນຂອງຕົວແປທີ່ຕ້ອງການ. ເພື່ອປະຕິບັດການວິເຄາະ, ພວກເຮົາພິຈາລະນາຊຸດຂໍ້ມູນຂອງ 10 ເຄື່ອງຈັກຈາກອຸດສາຫະກໍາ. ຄວາມພ້ອມຂອງເຄື່ອງສາມາດເປັນບວກ ຫຼືລົບ. ຕົວເລກຖານສອງ 1=positive , ແລະ 0=negative , ແລະຄ່າເຫຼົ່ານີ້ຖືກສະແດງຢູ່ໃນຖັນ B . ອາຍຸຂອງເຄື່ອງຈັກເຫຼົ່ານັ້ນຢູ່ໃນຖັນ C ແລະຊົ່ວໂມງປະຕິບັດໜ້າທີ່ສະເລ່ຍຕໍ່ອາທິດຢູ່ໃນຖັນ D . ດັ່ງນັ້ນ, ຊຸດຂໍ້ມູນຂອງພວກເຮົາແມ່ນຢູ່ໃນຂອບເຂດຂອງເຊລ B5:D14 . ຄ່າຂອງຕົວແປການແກ້ໄຂການຖົດຖອຍໃນເບື້ອງຕົ້ນແມ່ນຢູ່ໃນຂອບເຂດຂອງເຊລ C16:D18 . ຂັ້ນຕອນການວິເຄາະທັງຫມົດແມ່ນອະທິບາຍເປັນຂັ້ນຕອນຂ້າງລຸ່ມນີ້:
ຂັ້ນຕອນທີ 1: ການປ້ອນຂໍ້ມູນຂອງທ່ານ
ໃນຂັ້ນຕອນນີ້, ພວກເຮົາຈະນໍາເຂົ້າຊຸດຂໍ້ມູນຂອງທ່ານ:
- ກ່ອນອື່ນໝົດ, ປ້ອນຊຸດຂໍ້ມູນຂອງທ່ານເຂົ້າໃນ Excel ຢ່າງຖືກຕ້ອງ. ສໍາລັບການວິເຄາະຂອງພວກເຮົາ, ພວກເຮົາໃສ່ຊຸດຂໍ້ມູນໃນຂອບເຂດຂອງເຊລ B5:D14 .
- ຈາກນັ້ນ, ໃສ່ <1 ຂອງທ່ານ>Solver Decision Variables' ພວກເຮົາໃສ່ພວກມັນຢູ່ໃນຂອບເຂດຂອງເຊລ D16:D18.
- ພວກເຮົາສົມມຸດຄ່າຂອງຕົວແປທັງໝົດເປັນ 0.01 .
ອ່ານເພີ່ມເຕີມ: ການຖົດຖອຍຫຼາຍເສັ້ນໃນຊຸດຂໍ້ມູນ Excel (2 ວິທີ)
ຂັ້ນຕອນທີ 2: ການປະເມີນຄ່າ Logit
ໃນຂັ້ນຕອນນີ້, ພວກເຮົາຈະຄິດໄລ່ຄ່າ Logit ຄ່າສໍາລັບຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ພວກເຮົາກໍານົດ Logit ຄ່າເປັນ X ໃນການຄິດໄລ່ຂອງພວກເຮົາ. ສູດຂອງ Logit ຄ່າແມ່ນ:
ນີ້, b0, b1, ແລະ b2 ແມ່ນ regression ຕົວແປ.
- ຂຽນສູດຕໍ່ໄປນີ້ໃນເຊລ E5 . ໃຊ້ເຄື່ອງໝາຍ Absolute ເພື່ອຈຶ້ງຄ່າເຊລຂອງຕົວແປ. ຖ້າທ່ານບໍ່ຮູ້ວິທີໃສ່ເຄື່ອງໝາຍ Absolute Cell Reference , ທ່ານສາມາດປ້ອນມັນໄດ້ຫຼາຍວິທີ.
=$D$16+$D$17*C5+$D$18*D5
<2
- ຈາກນັ້ນ, ໃຫ້ກົດປຸ່ມ Enter ໃນແປ້ນພິມຂອງທ່ານ.
- ຫຼັງຈາກນັ້ນ, ຄລິກສອງເທື່ອ ໃນໄອຄອນ Fill Handle ເພື່ອສຳເນົາສູດຄຳນວນຂຶ້ນໃສ່ຕາລາງ E14 .
- ທ່ານຈະໄດ້ຮັບຄ່າທັງໝົດຂອງ X .
ອ່ານເພີ່ມເຕີມ: How to Do Simple Linear Regression in Excel (4 ວິທີງ່າຍໆ)
ຂັ້ນຕອນທີ 3: ກໍານົດ Exponential ຂອງ Logit ສໍາລັບແຕ່ລະຂໍ້ມູນ
ໃນທີ່ນີ້, ພວກເຮົາຈະຄິດໄລ່ຄ່າ exponential ຂອງ logit. ຄ່າ, ສຳລັບນັ້ນ, ພວກເຮົາຈະໃຊ້ ຟັງຊັນ EXP :
- ເພື່ອກຳນົດຄ່າເລກກຳລັງຂອງ X , ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້ໃນເຊລ. F5 :
=EXP(E5)
- ເຊັ່ນດຽວກັນ, ຄລິກສອງເທື່ອ ໃນໄອຄອນ Fill Handle ເພື່ອສຳເນົາສູດຄຳນວນເຊັ່ນ:ຂັ້ນຕອນທີ່ຜ່ານມາ. ທ່ານຈະເປັນຄ່າເລກກຳລັງທັງໝົດຂອງ X .
ຂັ້ນຕອນທີ 4: ຄິດໄລ່ຄ່າຄວາມເປັນໄປໄດ້
P( X) ແມ່ນຄ່າຄວາມເປັນໄປໄດ້ສຳລັບການເກີດເຫດການ X . ຄວາມເປັນໄປໄດ້ຂອງເຫດການ X ສາມາດກຳນົດເປັນ:
- ເພື່ອຄຳນວນມັນ, ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້ໃນເຊລ G5 .
=F5/(1+F5)
- ກົດ Enter key.
- ດຽວນີ້, ລາກໄອຄອນ Fill Handle ຂຶ້ນໄປທີ່ G15 ເພື່ອເອົາຄ່າຂອງຄ່າທັງໝົດ.
<27
ອ່ານເພີ່ມເຕີມ: ວິທີການຄິດໄລ່ຄ່າ P ໃນ Linear Regression ໃນ Excel (3 ວິທີ)
ຂັ້ນຕອນທີ 5: ປະເມີນຜົນລວມຂອງບັນທຶກ- Likelihood Value
ໃນຂັ້ນຕອນຕໍ່ໄປນີ້, ພວກເຮົາຈະປະເມີນຄ່າຂອງ Log-Likelihood. ຫຼັງຈາກນັ້ນພວກເຮົາຈະໃຊ້ ຟັງຊັນ SUM ເພື່ອເພີ່ມຂໍ້ມູນທັງໝົດ:
- ເພື່ອຄິດໄລ່ຄ່າ Log-Likelihood , ພວກເຮົາຈະໄປ ໃຊ້ ການ LN ຟັງຊັນ ໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ໃນຕາລາງ H5 , ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- ດຽວນີ້, ກົດ ປຸ່ມ Enter ໃນແປ້ນພິມ.
- ຈາກນັ້ນ, ຄລິກສອງເທື່ອ ຢູ່ໃນ ຕື່ມໃສ່ໄອຄອນ Handle ເພື່ອກຳນົດຄ່າຄວາມເປັນໄປໄດ້ຂອງບັນທຶກທັງໝົດ.
- ຫຼັງຈາກນັ້ນ, ໃນຕາລາງ H15 , ໃຫ້ຂຽນລົງ ສູດຕໍ່ໄປນີ້ເພື່ອລວມຄ່າທັງໝົດ.
=SUM(H5:H14)
🔍 ລາຍລະອຽດຂອງສູດ
ພວກເຮົາກຳລັງເຮັດການແບ່ງສ່ວນນີ້ສໍາລັບຕາລາງ H5 .
👉
LN(G5): ຟັງຊັນນີ້ໃຫ້ຜົນກັບ -0.384.
👉
LN(1-G5): ຟັງຊັນນີ້ສົ່ງກັບ -1.144.
👉
(B5*LN(G5))+((1-B5)* LN(1-G5)): ຟັງຊັນນີ້ສົ່ງກັບ -0.384.
ຂັ້ນຕອນທີ 6: ໃຊ້ເຄື່ອງມືການວິເຄາະຕົວແກ້ໄຂສໍາລັບການວິເຄາະສຸດທ້າຍ
ຕອນນີ້, ພວກເຮົາຈະດໍາເນີນການ ການວິເຄາະການຖົດຖອຍສຸດທ້າຍ. ພວກເຮົາຈະເຮັດການວິເຄາະຜ່ານຄໍາສັ່ງ Solver . ຖ້າຫາກວ່າທ່ານບໍ່ເຫັນມັນຢູ່ໃນແຖບ Data , ທ່ານຕ້ອງໄດ້ເປີດໃຊ້ງານ Solver ຈາກ Excel Add-ins .
- ເພື່ອເປີດໃຊ້ມັນ, ເລືອກ ໄຟລ໌ > ຕົວເລືອກ .
- ດັ່ງນັ້ນ, ກ່ອງໂຕ້ຕອບທີ່ເອີ້ນວ່າ ຕົວເລືອກ Excel ຈະປາກົດຂຶ້ນ.
- ໃນກ່ອງໂຕ້ຕອບນີ້, ເລືອກຕົວເລືອກ Add-ins .
- ດຽວນີ້, ເລືອກຕົວເລືອກ Excel Add-ins ໃນສ່ວນ Manage . ແລະຄລິກ Go .
- ກ່ອງໂຕ້ຕອບຂະໜາດນ້ອຍຫົວຂໍ້ Add-ins ຈະປາກົດຂຶ້ນ.<10
- ຈາກນັ້ນ, ກວດເບິ່ງຕົວເລືອກ Solver Add-in ແລະຄລິກ ຕົກລົງ .
- ຫຼັງຈາກນັ້ນ, ໃຫ້ໄປທີ່ແຖບ Data , ແລະທ່ານຈະເຫັນຄໍາສັ່ງ Solver ໃນກຸ່ມ ການວິເຄາະ .
<34
- ດຽວນີ້, ຄລິກທີ່ Solver ຄຳສັ່ງ.
- ກ່ອງໂຕ້ຕອບໃໝ່ທີ່ມີຊື່ວ່າ Solver Parameters ຈະປະກົດຂຶ້ນ.
- ໃນປ່ອງ Set Objective , ເລືອກຕາລາງ $H$15 ດ້ວຍເມົ້າຂອງທ່ານ. ທ່ານຍັງສາມາດຂຽນການອ້າງອີງເຊລເທິງແປ້ນພິມຂອງທ່ານໄດ້. ໃຫ້ແນ່ໃຈວ່າທ່ານໃຊ້ Absolute Cell Reference ລົງຊື່ທີ່ນີ້.
- ຕໍ່ໄປ, ໃນທາງເລືອກ ໂດຍການປ່ຽນເຊລທີ່ປ່ຽນແປງໄດ້ ເລືອກຂອບເຂດຂອງເຊລ $D$16:$D$18 .
- ຈາກນັ້ນ, ຍົກເລີກການເລືອກ ເຮັດໃຫ້ຕົວແປທີ່ບໍ່ມີຂໍ້ຈໍາກັດທີ່ບໍ່ແມ່ນຄ່າລົບ ເພື່ອເອົາຄ່າລົບຖ້າມັນສະແດງເປັນໝາຍຖືກແລ້ວ.
- ສຸດທ້າຍ, ຄລິກທີ່ ແກ້ໄຂ ປຸ່ມ.
- ດັ່ງນັ້ນ, ປ່ອງ ຜົນການແກ້ໄຂ ຈະປະກົດຂຶ້ນຕໍ່ຫນ້າທ່ານ.
- ຕອນນີ້, ໃຫ້ເລືອກ Keep Solver Solution ກ່ອງນີ້ຍັງຈະສະແດງໃຫ້ທ່ານຮູ້ວ່າການວິເຄາະການຖົດຖອຍຂອງເຈົ້າໄດ້ converged ຫຼື diverged.
- ຄລິກ ຕົກລົງ ເພື່ອປິດກ່ອງ.
- ສຸດທ້າຍ, ທ່ານຈະເຫັນຄ່າຂອງຕົວແປໃນຂອບເຂດຂອງເຊລ D16:D18 ຖືກປ່ຽນແປງ. ນອກຈາກນັ້ນ, ທ່ານຍັງຈະເຫັນຄ່າຂອງຖັນ E, F, G , ແລະ H ຍັງສະແດງຄວາມແຕກຕ່າງຈາກຂັ້ນຕອນທີ່ຜ່ານມາ.
🔍 ພາບປະກອບຂອງຜົນການວິເຄາະການຖົດຖອຍຖານສອງ
ຫຼັງຈາກສໍາເລັດການວິເຄາະການຖົດຖອຍຖານສອງໃນ Excel, ທ່ານຈະ ເຫັນວ່າຄ່າຕົວແປການຖົດຖອຍທີ່ສົມມຸດຕິຖານຂອງພວກເຮົາແມ່ນຖືກແທນທີ່ດ້ວຍຄ່າການວິເຄາະໃໝ່ ແລະຄ່າເຫຼົ່ານີ້ແມ່ນຄ່າຕົວແປການຖົດຖອຍທີ່ຖືກຕ້ອງຂອງຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ພວກເຮົາສາມາດພິຈາລະນາຜົນໄດ້ຮັບຂອງຂໍ້ມູນສະເພາະໃດຫນຶ່ງ, ເຊັ່ນ: ເຄື່ອງທີ່ມີອາຍຸ 68 ເດືອນແລະ 4 avg. ບໍ່ມີການປ່ຽນແປງຕໍ່ອາທິດ. ຄ່າຂອງ P(X) ແມ່ນ 0.67 . ມັນສະແດງໃຫ້ເຫັນພວກເຮົາວ່າຖ້າພວກເຮົາເບິ່ງສໍາລັບເຄື່ອງຈັກໃນສະພາບການເຮັດວຽກ ຄວາມເປັນໄປໄດ້ຂອງເຫດການນັ້ນແມ່ນປະມານ 67% .
ພວກເຮົາຍັງສາມາດສະແດງມັນແຍກຕ່າງຫາກ, ການນໍາໃຊ້ຄ່າສຸດທ້າຍຂອງຕົວແປ regression.
ດັ່ງນັ້ນ, ພວກເຮົາສາມາດເວົ້າໄດ້ວ່າຂັ້ນຕອນການເຮັດວຽກຂອງພວກເຮົາເຮັດວຽກຢ່າງສໍາເລັດຜົນ ແລະພວກເຮົາສາມາດເຮັດການວິເຄາະການຖົດຖອຍຂອງ binary logistic ໄດ້.
ສະຫຼຸບ
ນັ້ນແມ່ນໃນຕອນທ້າຍຂອງບົດຄວາມນີ້. . ຂ້າພະເຈົ້າຫວັງວ່າບົດຄວາມນີ້ຈະເປັນປະໂຫຍດສໍາລັບທ່ານແລະທ່ານຈະສາມາດເຮັດ logistic regression ໃນ Excel. ກະລຸນາແບ່ງປັນຄໍາຖາມຫຼືຄໍາແນະນໍາເພີ່ມເຕີມກັບພວກເຮົາໃນພາກສ່ວນຄໍາຄິດເຫັນຂ້າງລຸ່ມນີ້. ສືບຕໍ່ຮຽນຮູ້ວິທີການໃໝ່ໆ ແລະສືບຕໍ່ເຕີບໃຫຍ່!