ການວິເຄາະ Regression ຫຼາຍດ້ວຍ Excel

  • ແບ່ງປັນນີ້
Hugh West

ການວິເຄາະການຖົດຖອຍແບບງ່າຍດາຍ ແມ່ນໃຊ້ທົ່ວໄປເພື່ອປະເມີນຄວາມສຳພັນລະຫວ່າງຕົວແປສອງຕົວແປ, ຕົວຢ່າງ: ຄວາມສຳພັນລະຫວ່າງຜົນຜະລິດຂອງພືດ ແລະ ນ້ຳຝົນ ຫຼື ຄວາມສຳພັນລະຫວ່າງລົດຊາດຂອງເຂົ້າຈີ່ ແລະ ອຸນຫະພູມເຕົາອົບ. ຢ່າງໃດກໍ່ຕາມ, ພວກເຮົາຈໍາເປັນຕ້ອງໄດ້ສືບສວນຄວາມສໍາພັນລະຫວ່າງຕົວແປທີ່ຂຶ້ນກັບແລະສອງຕົວແປເອກະລາດຫຼາຍກວ່ານັ້ນ. ສໍາລັບຕົວຢ່າງ, ຕົວແທນອະສັງຫາລິມະສັບອາດຈະຕ້ອງການທີ່ຈະຮູ້ວ່າວິທີການແລະມາດຕະການເຊັ່ນ: ຂະຫນາດຂອງເຮືອນ, ຈໍາ​ນວນ​ຂອງ​ຫ້ອງ​ນອນ, ແລະ​ລາຍ​ໄດ້​ສະ​ເລ່ຍ​ຂອງ​ບ້ານ​ກ່ຽວ​ຂ້ອງ​ກັບ​ລາ​ຄາ​ທີ່​ເຮືອນ​ຖືກ​ຂາຍ. ບັນຫາແບບນີ້ສາມາດແກ້ໄຂໄດ້ໂດຍການໃຊ້ ການວິເຄາະການຖົດຖອຍຫຼາຍຕົວ. ແລະບົດຄວາມນີ້ຈະໃຫ້ບົດສະຫຼຸບກ່ຽວກັບວິທີໃຊ້ການວິເຄາະການຖົດຖອຍຫຼາຍແບບໂດຍໃຊ້ Excel.

ບັນຫາ

ສົມມຸດວ່າພວກເຮົາໄດ້ເອົາ 5 ຄົນຂາຍທີ່ສຸ່ມເລືອກ ແລະເກັບກໍາຂໍ້ມູນດັ່ງທີ່ສະແດງຢູ່ໃນຕາຕະລາງຂ້າງລຸ່ມນີ້. ບໍ່ວ່າຈະເປັນການສຶກສາ ຫຼືແຮງຈູງໃຈມີຜົນກະທົບຕໍ່ການຂາຍລາຍປີຫຼືບໍ່? ວັດແທກໂດຍ Higgins Motivation Scale ການຂາຍລາຍປີເປັນເງິນໂດລາ 12 32 $350,000 14 35 $399,765 15 45<10 $429,000 16 50 $435,000 18 65 $433,000

ສົມຜົນ

ໂດຍທົ່ວໄປແລ້ວ, ຄູນການວິເຄາະການຖົດຖອຍ ຖືວ່າມີຄວາມສຳພັນແບບເສັ້ນລະຫວ່າງຕົວແປທີ່ຂຶ້ນກັບ (y) ແລະຕົວແປເອກະລາດ (x1, x2, x3 … xn). ແລະປະເພດຂອງຄວາມສຳພັນແບບເສັ້ນນີ້ສາມາດຖືກອະທິບາຍໂດຍໃຊ້ສູດຕໍ່ໄປນີ້:

Y = ຄົງທີ່ + β1*x1 + β2*x2+…+ βn*xn

ນີ້ແມ່ນຄຳອະທິບາຍສຳລັບຄ່າຄົງທີ່ ແລະຄ່າສຳປະສິດ. :

Y ຄ່າຄາດຄະເນຂອງ Y
ຄົງທີ່ Y- intercept
β1 ການປ່ຽນແປງໃນ Y ໃນແຕ່ລະ 1 ເພີ່ມການປ່ຽນແປງໃນ x1
β2 The ການປ່ຽນແປງໃນ Y ແຕ່ລະ 1 ເພີ່ມການປ່ຽນແປງໃນ x2
βn ການປ່ຽນແປງ ໃນ Y ແຕ່ລະ 1 ການປ່ຽນແປງເພີ່ມຂຶ້ນໃນ xn

ຄົງທີ່ ແລະ β1, β2… βn ສາມາດຄິດໄລ່ໄດ້ໂດຍອີງໃສ່ຂໍ້ມູນຕົວຢ່າງທີ່ມີຢູ່. ຫຼັງຈາກທີ່ທ່ານໄດ້ຮັບຄ່າຄົງທີ່, β1, β2… βn, ທ່ານສາມາດນໍາໃຊ້ພວກມັນເພື່ອເຮັດໃຫ້ການຄາດຄະເນ.

ສໍາລັບບັນຫາຂອງພວກເຮົາ, ມີພຽງແຕ່ສອງປັດໃຈທີ່ພວກເຮົາມີຄວາມສົນໃຈ. ດັ່ງນັ້ນ, ສົມຜົນຈະເປັນ:

ຍອດຂາຍປະຈຳປີ = ຄົງທີ່ + β1*(ປີສູງສຸດຂອງໂຮງຮຽນສໍາເລັດ) + β2*(ແຮງຈູງໃຈທີ່ວັດແທກໄດ້ໂດຍ Higgins Motivation Scale)

ຕັ້ງຄ່າຕົວແບບ

ການຂາຍປະຈໍາປີ, ປີສູງສຸດຂອງໂຮງຮຽນສໍາເລັດແລະແຮງຈູງໃຈໄດ້ເຂົ້າໄປໃນຖັນ A, ຖັນ B, ແລະຖັນ C ດັ່ງທີ່ສະແດງຢູ່ໃນຮູບ 1. ມັນດີກວ່າທີ່ຈະເອົາຕົວແປທີ່ຂຶ້ນກັບ (ການຂາຍປະຈໍາປີຢູ່ທີ່ນີ້) ກ່ອນຕົວແປເອກະລາດ. .

ຮູບ 1

ດາວໂຫລດເຄື່ອງມືການວິເຄາະ

Excelສະເໜີໃຫ້ພວກເຮົາມີຄຸນສົມບັດການວິເຄາະຂໍ້ມູນທີ່ສາມາດສົ່ງຄືນຄ່າຂອງຄ່າຄົງທີ່ ແລະຄ່າສຳປະສິດ. ແຕ່ກ່ອນທີ່ຈະໃຊ້ຄຸນສົມບັດນີ້, ທ່ານຈໍາເປັນຕ້ອງໄດ້ດາວໂຫລດ Analysis ToolPak. ນີ້ແມ່ນວິທີທີ່ທ່ານສາມາດຕິດຕັ້ງມັນໄດ້.

ຄລິກທີ່ແຖບ File -> Options ແລະຫຼັງຈາກນັ້ນໃຫ້ຄລິກໃສ່ Add-Ins ໃນ ຕົວເລືອກ Excel ກ່ອງໂຕ້ຕອບ. ຄລິກທີ່ປຸ່ມ ໄປ ຢູ່ລຸ່ມສຸດຂອງ ຕົວເລືອກ Excel ກ່ອງໂຕ້ຕອບເພື່ອເປີດກ່ອງໂຕ້ຕອບ Add-Ins . ໃນກ່ອງໂຕ້ຕອບ Add-Ins , ເລືອກ Analysis TookPak checkbox ແລະຫຼັງຈາກນັ້ນໃຫ້ຄລິກໃສ່ Ok .

ດຽວນີ້ຖ້າທ່ານຄລິກໃສ່ ແຖບຂໍ້ມູນ , ທ່ານຈະເຫັນ ການວິເຄາະຂໍ້ມູນ ປາກົດຢູ່ໃນກຸ່ມ ການວິເຄາະ (ແຖບດ້ານຂວາ).

ຮູບ 2 [ຄລິກທີ່ຮູບເພື່ອ ໄດ້​ຮັບ​ການ​ເບິ່ງ​ຢ່າງ​ເຕັມ​ທີ່]

ການ​ວິ​ເຄາະ​ການ​ຖົດ​ຖອຍ​ຫຼາຍ​ປະ​ການ

ໃຫ້​ຄລິກ​ໃສ່ ການ​ວິ​ເຄາະ​ຂໍ້​ມູນ ໃນ​ກຸ່ມ ວິ​ເຄາະ ໃນ​ແຖບ ຂໍ້​ມູນ . ເລືອກ Regression ໃນກ່ອງໂຕ້ຕອບ ການວິເຄາະຂໍ້ມູນ . ທ່ານຍັງສາມາດເຮັດ ການວິເຄາະສະຖິຕິ ອື່ນໆເຊັ່ນ: t-test, ANOVA, ແລະອື່ນໆ.

ຮູບ 3.1

A Regression ກ່ອງໂຕ້ຕອບຈະຖືກເຕືອນຫຼັງຈາກທີ່ທ່ານເລືອກ Regression . ຕື່ມຂໍ້ມູນໃສ່ກ່ອງໂຕ້ຕອບດັ່ງທີ່ສະແດງຢູ່ໃນຮູບ 3.2.

ໄລຍະການປ້ອນຂໍ້ມູນ Y ມີຕົວແປທີ່ຂຶ້ນກັບ ແລະຂໍ້ມູນ ໃນຂະນະທີ່ຊ່ວງປ້ອນຂໍ້ມູນ X ມີຕົວແປເອກະລາດ ແລະຂໍ້ມູນ. ໃນທີ່ນີ້ຂ້ອຍຕ້ອງເຕືອນເຈົ້າວ່າຕົວແປເອກະລາດຄວນຈະຢູ່ໃນຖັນທີ່ຢູ່ຕິດກັນ. ແລະຈຳນວນຕົວແປເອກະລາດສູງສຸດແມ່ນ 15.

ຕັ້ງແຕ່ນັ້ນມາຊ່ວງ A1: C1 ປະກອບມີປ້າຍກຳກັບທີ່ປ່ຽນແປງໄດ້ ແລະ ສະນັ້ນ ກ່ອງໝາຍປ້າຍຄວນຖືກເລືອກ. ໃນຄວາມເປັນຈິງ, ຂ້າພະເຈົ້າແນະນໍາໃຫ້ທ່ານໃສ່ປ້າຍຊື່ທຸກໆຄັ້ງເມື່ອທ່ານຕື່ມໃສ່ Input Y Range ແລະ Input X Range. ປ້າຍກຳກັບເຫຼົ່ານີ້ມີປະໂຫຍດເມື່ອທ່ານກວດເບິ່ງບົດລາຍງານສະຫຼຸບທີ່ສົ່ງຄືນໂດຍ Excel.

ຮູບ 3.2

ໂດຍການເລືອກກ່ອງກາໝາຍທີ່ເຫຼືອ, ທ່ານສາມາດເປີດໃຊ້ Excel ເພື່ອສະແດງລາຍການທີ່ເຫຼືອສໍາລັບການສັງເກດແຕ່ລະອັນ. ເບິ່ງຮູບທີ 1, ມີ 5 ຂໍ້ສັງເກດທັງໝົດ ແລະ ທ່ານຈະໄດ້ຮັບ 5 ອັນທີ່ເຫຼືອ. ສ່ວນທີ່ເຫຼືອແມ່ນບາງສິ່ງບາງຢ່າງທີ່ເຫລືອໄວ້ເມື່ອທ່ານຫັກຄ່າທີ່ຄາດຄະເນຈາກມູນຄ່າທີ່ສັງເກດເຫັນ. ມາດຕະຖານ residual ແມ່ນ residual ແບ່ງອອກໂດຍ deviation ມາດຕະຖານຂອງຕົນ. ຈຳນວນຂອງຕອນທີ່ຕົກຄ້າງເທົ່າກັບຈຳນວນຕົວແປເອກະລາດ. ແຜນຜັງທີ່ເຫຼືອແມ່ນກາຟທີ່ສະແດງໃຫ້ເຫັນສິ່ງທີ່ເຫຼືອຢູ່ໃນແກນ Y ແລະຕົວແປເອກະລາດຢູ່ໃນແກນ x. ຈຸດກະແຈກກະຈາຍແບບສຸ່ມອ້ອມຮອບແກນ x ໃນຈຸດທີ່ຕົກຄ້າງ ໝາຍຄວາມວ່າຕົວແບບ linear regression ແມ່ນເໝາະສົມ. ຕົວຢ່າງ, ຮູບທີ 3.3 ສະແດງສາມຮູບແບບປົກກະຕິຂອງດິນຕອນທີ່ເຫຼືອ. ມີພຽງອັນດຽວໃນແຜງດ້ານຊ້າຍເທົ່ານັ້ນທີ່ຊີ້ບອກວ່າມັນເໝາະສົມກັບຕົວແບບເສັ້ນຊື່. ອີກສອງຮູບແບບແນະນຳໃຫ້ເໝາະສົມກັບຕົວແບບທີ່ບໍ່ແມ່ນເສັ້ນທີ່ດີຂຶ້ນ.

ຮູບ 3.3

Excel ຈະສົ່ງຄືນເສັ້ນທີ່ພໍດີຫາກທ່ານເລືອກກ່ອງໝາຍ Line Fit Plots. ແຜນຜັງເສັ້ນທີ່ເຫມາະສົມສາມາດວາງແຜນຄວາມສໍາພັນລະຫວ່າງຕົວແປທີ່ຂຶ້ນກັບຫນຶ່ງແລະຕົວແປເອກະລາດຫນຶ່ງ. ໃນຄໍາສັບຕ່າງໆອື່ນໆ, Excel ຈະສົ່ງຄືນໃຫ້ທ່ານຈໍານວນດຽວກັນຂອງເສັ້ນທີ່ເຫມາະສົມກັບຕົວແປເອກະລາດ. ຕົວຢ່າງ, ທ່ານຈະໄດ້ຮັບ 2 ເສັ້ນທີ່ເໝາະສົມກັບບັນຫາຂອງພວກເຮົາ.

ຜົນໄດ້ຮັບ

ຫຼັງຈາກທີ່ທ່ານຄລິກໃສ່ປຸ່ມ Ok, Excel ຈະສົ່ງຄືນບົດລາຍງານສະຫຼຸບດັ່ງລຸ່ມນີ້. ຕາລາງທີ່ເນັ້ນໃສ່ສີຂຽວ ແລະສີເຫຼືອງແມ່ນສ່ວນສຳຄັນທີ່ສຸດທີ່ເຈົ້າຄວນເອົາໃຈໃສ່.

ຮູບ 3.4

ຂະໜາດ R-square (ຕາລາງ F5), ຄວາມສຳພັນແໜ້ນໜາມີຢູ່. ລະຫວ່າງຕົວແປທີ່ຂຶ້ນກັບ ແລະຕົວແປເອກະລາດ. ແລະຄ່າສໍາປະສິດ (ຊ່ວງ F17: F19) ໃນຕາຕະລາງທີສາມສົ່ງຄືນຄ່າຂອງຄ່າຄົງທີ່ ແລະຄ່າສໍາປະສິດ. ສົມຜົນຄວນຈະເປັນການຂາຍປະຈໍາປີ = 1589.2 + 19928.3*(ປີສູງສຸດຂອງໂຮງຮຽນສໍາເລັດ) + 11.9*(ແຮງຈູງໃຈທີ່ວັດແທກໂດຍ Higgins Motivation Scale).

ແນວໃດກໍ່ຕາມ, ເພື່ອເບິ່ງວ່າຜົນໄດ້ຮັບທີ່ເຊື່ອຖືໄດ້, ທ່ານຍັງຕ້ອງການ. ເພື່ອກວດເບິ່ງຄ່າ p-value ທີ່ເນັ້ນເປັນສີເຫຼືອງ. ພຽງແຕ່ຖ້າ p-value ໃນເຊນ J12 ໜ້ອຍກວ່າ 0.05, ສົມຜົນການຖົດຖອຍທັງໝົດແມ່ນເຊື່ອຖືໄດ້. ແຕ່ທ່ານຍັງຈໍາເປັນຕ້ອງກວດເບິ່ງ p-values ​​ໃນໄລຍະ I17: I19 ເພື່ອເບິ່ງວ່າຕົວແປຄົງທີ່ແລະເອກະລາດແມ່ນເປັນປະໂຫຍດສໍາລັບການຄາດຄະເນຂອງຕົວແປທີ່ຂຶ້ນກັບ. ສໍາລັບບັນຫາຂອງພວກເຮົາ, ມັນດີກວ່າສໍາລັບພວກເຮົາທີ່ຈະປະຖິ້ມແຮງຈູງໃຈໃນເວລາທີ່ພິຈາລະນາຕົວແປເອກະລາດ.

ອ່ານເພີ່ມເຕີມ: ວິທີການຄິດໄລ່ຄ່າ P ໃນ Linear Regression ໃນ Excel (3ວິທີການ)

ເອົາແຮງຈູງໃຈອອກຈາກຕົວແປເອກະລາດ

ຫຼັງຈາກລຶບ Motivation ເປັນຕົວແປເອກະລາດ, ຂ້ອຍໄດ້ໃຊ້ວິທີດຽວກັນ ແລະເຮັດການວິເຄາະການຖົດຖອຍແບບງ່າຍໆ. ທ່ານສາມາດເບິ່ງວ່າຄ່າທັງຫມົດແມ່ນຫນ້ອຍກວ່າ 0.05 ໃນປັດຈຸບັນ. ສົມຜົນສຸດທ້າຍຄວນເປັນ:

ຍອດຂາຍປະຈຳປີ = 1167.8 + 19993.3*(ຈົບຊັ້ນສູງຂອງໂຮງຮຽນ)

ຮູບ 3.5 [ຄລິກທີ່ຮູບເພື່ອເບິ່ງເຕັມ]<3

ໝາຍເຫດ

ຮູບ 4

ນອກເໜືອໄປຈາກເຄື່ອງມື Add-Ins, ທ່ານຍັງສາມາດໃຊ້ຟັງຊັນ LINEST ເພື່ອເຮັດການວິເຄາະການຖົດຖອຍຫຼາຍອັນ. ຟັງຊັນ LINEST ແມ່ນຟັງຊັນ array ທີ່ສາມາດສົ່ງຜົນໄດ້ຮັບໃນຫນຶ່ງເຊລຫຼືໄລຍະຂອງເຊນ. ກ່ອນອື່ນໝົດ, ເລືອກຊ່ວງ A8:B12 ແລ້ວໃສ່ສູດ “=LINEST (A2:A6, B2:B6, TRUE, TRUE)” ເຂົ້າໄປໃນເຊລທຳອິດຂອງຊ່ວງນີ້ (A8). ຫຼັງ​ຈາກ​ທີ່​ທ່ານ​ກົດ CTRL + SHIFT +ENTER​, Excel ຈະ​ກັບ​ຄືນ​ຜົນ​ໄດ້​ຮັບ​ດັ່ງ​ລຸ່ມ​ນີ້​. ໂດຍການປຽບທຽບກັບຮູບ 3.4, ທ່ານສາມາດເຫັນໄດ້ວ່າ 19993.3 ແມ່ນຕົວຄູນຂອງປີສູງສຸດຂອງໂຮງຮຽນສໍາເລັດໃນຂະນະທີ່ 1167.8 ແມ່ນຄົງທີ່. ຢ່າງໃດກໍຕາມ, ຂ້າພະເຈົ້າແນະນໍາໃຫ້ທ່ານໃຊ້ເຄື່ອງມື Add-Ins. ມັນງ່າຍຂຶ້ນຫຼາຍ.

ອ່ານເພີ່ມເຕີມ…

Reverse What-If Analysis in Excel

<0 ວິທີໃຊ້ Wildcards ໃນ Excel?

ດາວໂຫລດໄຟລ໌ເຮັດວຽກ

ດາວໂຫລດໄຟລ໌ການເຮັດວຽກຈາກລິ້ງຂ້າງລຸ່ມນີ້.

Multiple-Regression-Analysis. xlsx

Hugh West ເປັນຄູຝຶກ Excel ທີ່ມີປະສົບການສູງແລະນັກວິເຄາະທີ່ມີປະສົບການຫຼາຍກວ່າ 10 ປີໃນອຸດສາຫະກໍາ. ລາວຈົບປະລິນຍາຕີສາຂາບັນຊີ ແລະການເງິນ ແລະປະລິນຍາໂທສາຂາບໍລິຫານທຸລະກິດ. Hugh ມີຄວາມກະຕືລືລົ້ນໃນການສອນແລະໄດ້ພັດທະນາວິທີການສອນທີ່ເປັນເອກະລັກທີ່ງ່າຍຕໍ່ການຕິດຕາມແລະເຂົ້າໃຈ. ຄວາມຮູ້ຊ່ຽວຊານຂອງລາວກ່ຽວກັບ Excel ໄດ້ຊ່ວຍໃຫ້ນັກຮຽນແລະຜູ້ຊ່ຽວຊານຫລາຍພັນຄົນໃນທົ່ວໂລກປັບປຸງທັກສະຂອງເຂົາເຈົ້າແລະດີເລີດໃນອາຊີບຂອງພວກເຂົາ. ຜ່ານ blog ຂອງລາວ, Hugh ແບ່ງປັນຄວາມຮູ້ຂອງລາວກັບໂລກ, ສະຫນອງການສອນ Excel ຟຣີແລະການຝຶກອົບຮົມອອນໄລນ໌ເພື່ອຊ່ວຍໃຫ້ບຸກຄົນແລະທຸລະກິດສາມາດບັນລຸທ່າແຮງຂອງພວກເຂົາ.