ວິທີການເຮັດ Logistic Regression ໃນ Excel (ດ້ວຍຂັ້ນຕອນດ່ວນ)

  • ແບ່ງປັນນີ້
Hugh West

ການວິເຄາະການຖົດຖອຍ ເປັນການຄິດໄລ່ທາງສະຖິຕິທີ່ໃຊ້ຢ່າງກວ້າງຂວາງ. ພວກເຮົາມັກຈະເຮັດການຄິດໄລ່ປະເພດນີ້ຕາມຄວາມປາຖະຫນາຂອງພວກເຮົາ. ໃນ Excel, ພວກເຮົາສາມາດປະຕິບັດ ການວິເຄາະການຖົດຖອຍຫຼາຍປະເພດ . ໃນບົດຄວາມນີ້, ພວກເຮົາຈະສະແດງວິທີການເຮັດ logistic regression ໃນ Excel. ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ຍັງ​ມີ​ຄວາມ​ສົນ​ໃຈ​ທີ່​ຈະ​ຮຽນ​ຮູ້​ວິ​ເຄາະ​ນີ້​, ດາວ​ນ​໌​ໂຫລດ​ປື້ມ​ບັນ​ທຶກ​ການ​ປະ​ຕິ​ບັດ​ແລະ​ປະ​ຕິ​ບັດ​ຕາມ​ພວກ​ເຮົາ​. 6>

Logistic Regression.xlsx

Logistic Regression ແມ່ນຫຍັງ?

ການວິເຄາະການຖົດຖອຍຂອງ logistic ແມ່ນວິທີການຮຽນຮູ້ທາງສະຖິຕິທີ່ໃຊ້ເພື່ອຄາດຄະເນມູນຄ່າຂອງຕົວແປທີ່ຂຶ້ນກັບໂດຍອີງຕາມເງື່ອນໄຂທີ່ເປັນເອກະລາດບາງອັນ. ມັນຊ່ວຍໃຫ້ບຸກຄົນໃດຫນຶ່ງໄດ້ຮັບຜົນໄດ້ຮັບຈາກຊຸດຂໍ້ມູນຂະຫນາດໃຫຍ່ໂດຍອີງໃສ່ປະເພດທີ່ຕ້ອງການຂອງລາວ. ການວິເຄາະການຖົດຖອຍຂອງ Logistic Regression ສ່ວນໃຫຍ່ແມ່ນສາມປະເພດ:

  1. Binary Logistic Regression
  2. Multinomial Logistic Regression
  3. Ordinal Logistic Regression

Binary Logistic Regression: ໃນຮູບແບບການວິເຄາະ binary regression, ພວກເຮົາກໍານົດປະເພດຂອງພຽງແຕ່ສອງກໍລະນີ. ແມ່ນ/ບໍ່ ຫຼື ບວກ/ລົບ.

ການຖົດຖອຍຂອງລະບົບຂົນສົ່ງຫຼາຍດ້ານ: ການວິເຄາະທາງໂລຈິສຕິກ Multiminal ໃຊ້ໄດ້ກັບສາມປະເພດ ຫຼືຫຼາຍກວ່ານັ້ນ. ຖ້າພວກເຮົາມີຫຼາຍກວ່າສອງພາກສ່ວນເພື່ອຈັດປະເພດຂໍ້ມູນຂອງພວກເຮົາ, ພວກເຮົາສາມາດໃຊ້ແບບຈໍາລອງການວິເຄາະການຖົດຖອຍນີ້ໄດ້.

Ordinal LogisticRegression: ຮູບແບບການວິເຄາະການຖົດຖອຍນີ້ໃຊ້ໄດ້ຫຼາຍກວ່າສອງປະເພດ. ຢ່າງໃດກໍຕາມ, ໃນຮູບແບບນີ້, ພວກເຮົາຕ້ອງການຄໍາສັ່ງທີ່ກໍານົດໄວ້ລ່ວງຫນ້າເພື່ອຈັດປະເພດໃຫ້ເຂົາເຈົ້າ. ການວິເຄາະ. ປະເພດຂອງການວິເຄາະນີ້ໃຫ້ພວກເຮົາມີມູນຄ່າການຄາດຄະເນຂອງຕົວແປທີ່ຕ້ອງການ. ເພື່ອປະຕິບັດການວິເຄາະ, ພວກເຮົາພິຈາລະນາຊຸດຂໍ້ມູນຂອງ 10 ເຄື່ອງຈັກຈາກອຸດສາຫະກໍາ. ຄວາມພ້ອມຂອງເຄື່ອງສາມາດເປັນບວກ ຫຼືລົບ. ຕົວເລກຖານສອງ 1=positive , ແລະ 0=negative , ແລະຄ່າເຫຼົ່ານີ້ຖືກສະແດງຢູ່ໃນຖັນ B . ອາຍຸຂອງເຄື່ອງຈັກເຫຼົ່ານັ້ນຢູ່ໃນຖັນ C ແລະຊົ່ວໂມງປະຕິບັດໜ້າທີ່ສະເລ່ຍຕໍ່ອາທິດຢູ່ໃນຖັນ D . ດັ່ງນັ້ນ, ຊຸດຂໍ້ມູນຂອງພວກເຮົາແມ່ນຢູ່ໃນຂອບເຂດຂອງເຊລ B5:D14 . ຄ່າຂອງຕົວແປການແກ້ໄຂການຖົດຖອຍໃນເບື້ອງຕົ້ນແມ່ນຢູ່ໃນຂອບເຂດຂອງເຊລ C16:D18 . ຂັ້ນ​ຕອນ​ການ​ວິ​ເຄາະ​ທັງ​ຫມົດ​ແມ່ນ​ອະ​ທິ​ບາຍ​ເປັນ​ຂັ້ນ​ຕອນ​ຂ້າງ​ລຸ່ມ​ນີ້​:

ຂັ້ນ​ຕອນ​ທີ 1​: ການ​ປ້ອນ​ຂໍ້​ມູນ​ຂອງ​ທ່ານ

ໃນ​ຂັ້ນ​ຕອນ​ນີ້​, ພວກ​ເຮົາ​ຈະ​ນໍາ​ເຂົ້າ​ຊຸດ​ຂໍ້​ມູນ​ຂອງ​ທ່ານ​:

  • ກ່ອນອື່ນໝົດ, ປ້ອນຊຸດຂໍ້ມູນຂອງທ່ານເຂົ້າໃນ Excel ຢ່າງຖືກຕ້ອງ. ສໍາລັບການວິເຄາະຂອງພວກເຮົາ, ພວກເຮົາໃສ່ຊຸດຂໍ້ມູນໃນຂອບເຂດຂອງເຊລ B5:D14 .

  • ຈາກນັ້ນ, ໃສ່ <1 ຂອງທ່ານ>Solver Decision Variables' ພວກເຮົາໃສ່ພວກມັນຢູ່ໃນຂອບເຂດຂອງເຊລ D16:D18.
  • ພວກເຮົາສົມມຸດຄ່າຂອງຕົວແປທັງໝົດເປັນ 0.01 .

ອ່ານເພີ່ມເຕີມ: ການຖົດຖອຍຫຼາຍເສັ້ນໃນຊຸດຂໍ້ມູນ Excel (2 ວິທີ)

ຂັ້ນຕອນທີ 2: ການປະເມີນຄ່າ Logit

ໃນຂັ້ນຕອນນີ້, ພວກເຮົາຈະຄິດໄລ່ຄ່າ Logit ຄ່າສໍາລັບຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ພວກເຮົາກໍານົດ Logit ຄ່າເປັນ X ໃນການຄິດໄລ່ຂອງພວກເຮົາ. ສູດຂອງ Logit ຄ່າແມ່ນ:

ນີ້, b0, b1, ແລະ b2 ແມ່ນ regression ຕົວແປ.

  • ຂຽນສູດຕໍ່ໄປນີ້ໃນເຊລ E5 . ໃຊ້ເຄື່ອງໝາຍ Absolute ເພື່ອຈຶ້ງຄ່າເຊລຂອງຕົວແປ. ຖ້າທ່ານບໍ່ຮູ້ວິທີໃສ່ເຄື່ອງໝາຍ Absolute Cell Reference , ທ່ານສາມາດປ້ອນມັນໄດ້ຫຼາຍວິທີ.

=$D$16+$D$17*C5+$D$18*D5 <2

  • ຈາກນັ້ນ, ໃຫ້ກົດປຸ່ມ Enter ໃນແປ້ນພິມຂອງທ່ານ.

  • ຫຼັງຈາກນັ້ນ, ຄລິກສອງເທື່ອ ໃນໄອຄອນ Fill Handle ເພື່ອສຳເນົາສູດຄຳນວນຂຶ້ນໃສ່ຕາລາງ E14 .

  • ທ່ານຈະໄດ້ຮັບຄ່າທັງໝົດຂອງ X .

ອ່ານເພີ່ມເຕີມ: How to Do Simple Linear Regression in Excel (4 ວິທີງ່າຍໆ)

ຂັ້ນຕອນທີ 3: ກໍານົດ Exponential ຂອງ Logit ສໍາລັບແຕ່ລະຂໍ້ມູນ

ໃນທີ່ນີ້, ພວກເຮົາຈະຄິດໄລ່ຄ່າ exponential ຂອງ logit. ຄ່າ, ສຳລັບນັ້ນ, ພວກເຮົາຈະໃຊ້ ຟັງຊັນ EXP :

  • ເພື່ອກຳນົດຄ່າເລກກຳລັງຂອງ X , ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້ໃນເຊລ. F5 :

=EXP(E5)

  • ເຊັ່ນດຽວກັນ, ຄລິກສອງເທື່ອ ໃນໄອຄອນ Fill Handle ເພື່ອສຳເນົາສູດຄຳນວນເຊັ່ນ:ຂັ້ນ​ຕອນ​ທີ່​ຜ່ານ​ມາ​. ທ່ານຈະເປັນຄ່າເລກກຳລັງທັງໝົດຂອງ X .

ຂັ້ນຕອນທີ 4: ຄິດໄລ່ຄ່າຄວາມເປັນໄປໄດ້

P( X) ແມ່ນຄ່າຄວາມເປັນໄປໄດ້ສຳລັບການເກີດເຫດການ X . ຄວາມເປັນໄປໄດ້ຂອງເຫດການ X ສາມາດກຳນົດເປັນ:

  • ເພື່ອຄຳນວນມັນ, ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້ໃນເຊລ G5 .

=F5/(1+F5)

  • ກົດ Enter key.
  • ດຽວນີ້, ລາກໄອຄອນ Fill Handle ຂຶ້ນໄປທີ່ G15 ເພື່ອເອົາຄ່າຂອງຄ່າທັງໝົດ.

<27

ອ່ານເພີ່ມເຕີມ: ວິທີການຄິດໄລ່ຄ່າ P ໃນ Linear Regression ໃນ Excel (3 ວິທີ)

ຂັ້ນຕອນທີ 5: ປະເມີນຜົນລວມຂອງບັນທຶກ- Likelihood Value

ໃນຂັ້ນຕອນຕໍ່ໄປນີ້, ພວກເຮົາຈະປະເມີນຄ່າຂອງ Log-Likelihood. ຫຼັງຈາກນັ້ນພວກເຮົາຈະໃຊ້ ຟັງຊັນ SUM ເພື່ອເພີ່ມຂໍ້ມູນທັງໝົດ:

  • ເພື່ອຄິດໄລ່ຄ່າ Log-Likelihood , ພວກເຮົາຈະໄປ ໃຊ້ ການ LN ຟັງຊັນ ໃນຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ໃນຕາລາງ H5 , ໃຫ້ຂຽນສູດຄຳນວນຕໍ່ໄປນີ້:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • ດຽວນີ້, ກົດ ປຸ່ມ Enter ໃນແປ້ນພິມ.

  • ຈາກນັ້ນ, ຄລິກສອງເທື່ອ ຢູ່ໃນ ຕື່ມໃສ່ໄອຄອນ Handle ເພື່ອກຳນົດຄ່າຄວາມເປັນໄປໄດ້ຂອງບັນທຶກທັງໝົດ.

  • ຫຼັງຈາກນັ້ນ, ໃນຕາລາງ H15 , ໃຫ້ຂຽນລົງ ສູດຕໍ່ໄປນີ້ເພື່ອລວມຄ່າທັງໝົດ.

=SUM(H5:H14)

🔍 ລາຍລະອຽດຂອງສູດ

ພວກເຮົາກຳລັງເຮັດການແບ່ງສ່ວນນີ້ສໍາລັບຕາລາງ H5 .

👉 LN(G5): ຟັງຊັນນີ້ໃຫ້ຜົນກັບ -0.384.

👉 LN(1-G5): ຟັງຊັນນີ້ສົ່ງກັບ -1.144.

👉 (B5*LN(G5))+((1-B5)* LN(1-G5)): ຟັງຊັນນີ້ສົ່ງກັບ -0.384.

ຂັ້ນຕອນທີ 6: ໃຊ້ເຄື່ອງມືການວິເຄາະຕົວແກ້ໄຂສໍາລັບການວິເຄາະສຸດທ້າຍ

ຕອນນີ້, ພວກເຮົາຈະດໍາເນີນການ ການວິເຄາະການຖົດຖອຍສຸດທ້າຍ. ພວກເຮົາຈະເຮັດການວິເຄາະຜ່ານຄໍາສັ່ງ Solver . ຖ້າ​ຫາກ​ວ່າ​ທ່ານ​ບໍ່​ເຫັນ​ມັນ​ຢູ່​ໃນ​ແຖບ Data , ທ່ານ​ຕ້ອງ​ໄດ້​ເປີດ​ໃຊ້​ງານ Solver ຈາກ Excel Add-ins .

  • ເພື່ອເປີດໃຊ້ມັນ, ເລືອກ ໄຟລ໌ > ຕົວເລືອກ .

  • ດັ່ງນັ້ນ, ກ່ອງໂຕ້ຕອບທີ່ເອີ້ນວ່າ ຕົວເລືອກ Excel ຈະປາກົດຂຶ້ນ.
  • ໃນກ່ອງໂຕ້ຕອບນີ້, ເລືອກຕົວເລືອກ Add-ins .
  • ດຽວນີ້, ເລືອກຕົວເລືອກ Excel Add-ins ໃນສ່ວນ Manage . ແລະຄລິກ Go .

  • ກ່ອງໂຕ້ຕອບຂະໜາດນ້ອຍຫົວຂໍ້ Add-ins ຈະປາກົດຂຶ້ນ.<10
  • ຈາກນັ້ນ, ກວດເບິ່ງຕົວເລືອກ Solver Add-in ແລະຄລິກ ຕົກລົງ .

  • ຫຼັງຈາກນັ້ນ, ໃຫ້ໄປທີ່ແຖບ Data , ແລະທ່ານຈະເຫັນຄໍາສັ່ງ Solver ໃນກຸ່ມ ການວິເຄາະ .

<34

  • ດຽວນີ້, ຄລິກທີ່ Solver ຄຳສັ່ງ.
  • ກ່ອງໂຕ້ຕອບໃໝ່ທີ່ມີຊື່ວ່າ Solver Parameters ຈະປະກົດຂຶ້ນ.
  • ໃນປ່ອງ Set Objective , ເລືອກຕາລາງ $H$15 ດ້ວຍເມົ້າຂອງທ່ານ. ທ່ານຍັງສາມາດຂຽນການອ້າງອີງເຊລເທິງແປ້ນພິມຂອງທ່ານໄດ້. ໃຫ້ແນ່ໃຈວ່າທ່ານໃຊ້ Absolute Cell Reference ລົງຊື່ທີ່ນີ້.
  • ຕໍ່ໄປ, ໃນທາງເລືອກ ໂດຍການປ່ຽນເຊລທີ່ປ່ຽນແປງໄດ້ ເລືອກຂອບເຂດຂອງເຊລ $D$16:$D$18 .
  • ຈາກນັ້ນ, ຍົກເລີກການເລືອກ ເຮັດໃຫ້ຕົວແປທີ່ບໍ່ມີຂໍ້ຈໍາກັດທີ່ບໍ່ແມ່ນຄ່າລົບ ເພື່ອເອົາຄ່າລົບຖ້າມັນສະແດງເປັນໝາຍຖືກແລ້ວ.
  • ສຸດທ້າຍ, ຄລິກທີ່ ແກ້​ໄຂ ປຸ່ມ.

  • ດັ່ງ​ນັ້ນ, ປ່ອງ ຜົນ​ການ​ແກ້​ໄຂ ຈະ​ປະ​ກົດ​ຂຶ້ນ​ຕໍ່​ຫນ້າ​ທ່ານ.
  • ຕອນນີ້, ໃຫ້ເລືອກ Keep Solver Solution ກ່ອງນີ້ຍັງຈະສະແດງໃຫ້ທ່ານຮູ້ວ່າການວິເຄາະການຖົດຖອຍຂອງເຈົ້າໄດ້ converged ຫຼື diverged.
  • ຄລິກ ຕົກລົງ ເພື່ອປິດກ່ອງ.

  • ສຸດທ້າຍ, ທ່ານຈະເຫັນຄ່າຂອງຕົວແປໃນຂອບເຂດຂອງເຊລ D16:D18 ຖືກປ່ຽນແປງ. ນອກຈາກນັ້ນ, ທ່ານຍັງຈະເຫັນຄ່າຂອງຖັນ E, F, G , ແລະ H ຍັງສະແດງຄວາມແຕກຕ່າງຈາກຂັ້ນຕອນທີ່ຜ່ານມາ.

🔍 ພາບປະກອບຂອງຜົນການວິເຄາະການຖົດຖອຍຖານສອງ

ຫຼັງຈາກສໍາເລັດການວິເຄາະການຖົດຖອຍຖານສອງໃນ Excel, ທ່ານຈະ ເຫັນວ່າຄ່າຕົວແປການຖົດຖອຍທີ່ສົມມຸດຕິຖານຂອງພວກເຮົາແມ່ນຖືກແທນທີ່ດ້ວຍຄ່າການວິເຄາະໃໝ່ ແລະຄ່າເຫຼົ່ານີ້ແມ່ນຄ່າຕົວແປການຖົດຖອຍທີ່ຖືກຕ້ອງຂອງຊຸດຂໍ້ມູນຂອງພວກເຮົາ. ພວກ​ເຮົາ​ສາ​ມາດ​ພິ​ຈາ​ລະ​ນາ​ຜົນ​ໄດ້​ຮັບ​ຂອງ​ຂໍ້​ມູນ​ສະ​ເພາະ​ໃດ​ຫນຶ່ງ​, ເຊັ່ນ​: ເຄື່ອງ​ທີ່​ມີ​ອາ​ຍຸ 68 ເດືອນ​ແລະ 4 avg. ບໍ່ມີການປ່ຽນແປງຕໍ່ອາທິດ. ຄ່າຂອງ P(X) ແມ່ນ 0.67 . ມັນສະແດງໃຫ້ເຫັນພວກເຮົາວ່າຖ້າພວກເຮົາເບິ່ງສໍາລັບເຄື່ອງຈັກໃນສະພາບການເຮັດວຽກ ຄວາມເປັນໄປໄດ້ຂອງເຫດການນັ້ນແມ່ນປະມານ 67% .

ພວກເຮົາຍັງສາມາດສະແດງມັນແຍກຕ່າງຫາກ, ການນໍາໃຊ້ຄ່າສຸດທ້າຍຂອງຕົວແປ regression.

ດັ່ງນັ້ນ, ພວກເຮົາສາມາດເວົ້າໄດ້ວ່າຂັ້ນຕອນການເຮັດວຽກຂອງພວກເຮົາເຮັດວຽກຢ່າງສໍາເລັດຜົນ ແລະພວກເຮົາສາມາດເຮັດການວິເຄາະການຖົດຖອຍຂອງ binary logistic ໄດ້.

ສະຫຼຸບ

ນັ້ນແມ່ນໃນຕອນທ້າຍຂອງບົດຄວາມນີ້. . ຂ້າພະເຈົ້າຫວັງວ່າບົດຄວາມນີ້ຈະເປັນປະໂຫຍດສໍາລັບທ່ານແລະທ່ານຈະສາມາດເຮັດ logistic regression ໃນ Excel. ກະ​ລຸ​ນາ​ແບ່ງ​ປັນ​ຄໍາ​ຖາມ​ຫຼື​ຄໍາ​ແນະ​ນໍາ​ເພີ່ມ​ເຕີມ​ກັບ​ພວກ​ເຮົາ​ໃນ​ພາກ​ສ່ວນ​ຄໍາ​ຄິດ​ເຫັນ​ຂ້າງ​ລຸ່ມ​ນີ້​. ສືບຕໍ່ຮຽນຮູ້ວິທີການໃໝ່ໆ ແລະສືບຕໍ່ເຕີບໃຫຍ່!

Hugh West ເປັນຄູຝຶກ Excel ທີ່ມີປະສົບການສູງແລະນັກວິເຄາະທີ່ມີປະສົບການຫຼາຍກວ່າ 10 ປີໃນອຸດສາຫະກໍາ. ລາວຈົບປະລິນຍາຕີສາຂາບັນຊີ ແລະການເງິນ ແລະປະລິນຍາໂທສາຂາບໍລິຫານທຸລະກິດ. Hugh ມີຄວາມກະຕືລືລົ້ນໃນການສອນແລະໄດ້ພັດທະນາວິທີການສອນທີ່ເປັນເອກະລັກທີ່ງ່າຍຕໍ່ການຕິດຕາມແລະເຂົ້າໃຈ. ຄວາມຮູ້ຊ່ຽວຊານຂອງລາວກ່ຽວກັບ Excel ໄດ້ຊ່ວຍໃຫ້ນັກຮຽນແລະຜູ້ຊ່ຽວຊານຫລາຍພັນຄົນໃນທົ່ວໂລກປັບປຸງທັກສະຂອງເຂົາເຈົ້າແລະດີເລີດໃນອາຊີບຂອງພວກເຂົາ. ຜ່ານ blog ຂອງລາວ, Hugh ແບ່ງປັນຄວາມຮູ້ຂອງລາວກັບໂລກ, ສະຫນອງການສອນ Excel ຟຣີແລະການຝຶກອົບຮົມອອນໄລນ໌ເພື່ອຊ່ວຍໃຫ້ບຸກຄົນແລະທຸລະກິດສາມາດບັນລຸທ່າແຮງຂອງພວກເຂົາ.