តារាងមាតិកា
ការវិភាគតំរែតំរង់ គឺជាការគណនាស្ថិតិដែលត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ។ ជាញឹកញាប់យើងធ្វើការគណនាប្រភេទនេះតាមបំណងប្រាថ្នារបស់យើង។ នៅក្នុង Excel យើងអាចអនុវត្ត ប្រភេទនៃការវិភាគតំរែតំរង់ជាច្រើន ។ នៅក្នុងអត្ថបទនេះ យើងនឹងបង្ហាញពីរបៀបធ្វើ logistic regression នៅក្នុង Excel ។ ប្រសិនបើអ្នកចាប់អារម្មណ៍ផងដែរដើម្បីរៀនការវិភាគនេះ សូមទាញយកសៀវភៅលំហាត់អនុវត្ត ហើយធ្វើតាមពួកយើង។
ទាញយកសៀវភៅលំហាត់អនុវត្ត
ទាញយកសៀវភៅលំហាត់នេះសម្រាប់ការអនុវត្ត ខណៈពេលដែលអ្នកកំពុងអានអត្ថបទនេះ។
Logistic Regression.xlsx
តើ Logistic Regression ជាអ្វី?
ការវិភាគតំរែតំរង់តក្កវិជ្ជាគឺជាក្បួនដោះស្រាយការសិក្សាស្ថិតិដែលប្រើដើម្បីទស្សន៍ទាយតម្លៃនៃអថេរអាស្រ័យដោយផ្អែកលើលក្ខណៈវិនិច្ឆ័យឯករាជ្យមួយចំនួន។ វាជួយមនុស្សម្នាក់ឱ្យទទួលបានលទ្ធផលពីសំណុំទិន្នន័យធំដោយផ្អែកលើប្រភេទដែលគាត់ចង់បាន។ ការវិភាគតំរែតំរង់នៃភស្តុភារជាចម្បងបីប្រភេទ៖
- តំរែតំរែតំរែតំរង់ប្រព័ន្ធគោលពីរ
- តំរែតំរង់ភស្តុភារពហុមុខងារ
- តំរែតំរង់ភស្តុភារធម្មតា
ប្រព័ន្ធគោលពីរ Logistic Regression៖ នៅក្នុងគំរូការវិភាគតំរែតំរង់គោលពីរ យើងកំណត់ប្រភេទមួយដោយករណីពីរប៉ុណ្ណោះ។ បាទ/ចាស/ទេ ឬវិជ្ជមាន/អវិជ្ជមាន។
ការតំរែតំរង់នៃភស្តុភារពហុនាម៖ ការវិភាគភ័ស្តុភារពហុមុខងារដំណើរការជាមួយនឹងការចាត់ថ្នាក់បី ឬច្រើន។ ប្រសិនបើយើងមានផ្នែកដែលបានចាត់ថ្នាក់ច្រើនជាងពីរដើម្បីចាត់ថ្នាក់ទិន្នន័យរបស់យើង នោះយើងអាចប្រើគំរូការវិភាគតំរែតំរង់នេះ។
Ordinal Logisticតំរែតំរង់៖ គំរូការវិភាគតំរែតំរង់នេះដំណើរការសម្រាប់ច្រើនជាងពីរប្រភេទ។ ទោះយ៉ាងណាក៏ដោយ នៅក្នុងគំរូនេះ យើងត្រូវការលំដាប់ដែលបានកំណត់ទុកជាមុនដើម្បីចាត់ថ្នាក់ពួកវា។
នីតិវិធីជាជំហាន ៗ ដើម្បីធ្វើការតំរែតំរង់ភ័ស្តុភារនៅក្នុង Excel
នៅក្នុងអត្ថបទនេះ យើងនឹងអនុវត្តការតំរែតំរង់តក្កកម្មប្រព័ន្ធគោលពីរ ការវិភាគ។ ប្រភេទនៃការវិភាគនេះផ្តល់ឱ្យយើងនូវតម្លៃព្យាករណ៍នៃអថេរដែលចង់បាន។ ដើម្បីអនុវត្តការវិភាគ យើងពិចារណាសំណុំទិន្នន័យនៃម៉ាស៊ីនចំនួន 10 ពីឧស្សាហកម្មមួយ។ ភាពអាចរកបានរបស់ម៉ាស៊ីនអាចជាវិជ្ជមាន ឬអវិជ្ជមាន។ លេខគោលពីរ 1=វិជ្ជមាន និង 0=អវិជ្ជមាន ហើយតម្លៃទាំងនេះត្រូវបានបង្ហាញក្នុងជួរឈរ B ។ អាយុរបស់ម៉ាស៊ីនទាំងនោះស្ថិតនៅក្នុងជួរ C ហើយម៉ោងកាតព្វកិច្ចជាមធ្យមរបស់ពួកវាក្នុងមួយសប្តាហ៍គឺស្ថិតនៅក្នុងជួរ D ។ ដូច្នេះ សំណុំទិន្នន័យរបស់យើងស្ថិតនៅក្នុងជួរក្រឡា B5:D14 ។ តម្លៃអថេរការដោះស្រាយការតំរែតំរង់ដំបូងគឺស្ថិតនៅក្នុងជួរក្រឡា C16:D18 ។ ដំណើរការវិភាគទាំងមូលត្រូវបានពន្យល់ជាជំហានៗដូចខាងក្រោម៖
ជំហានទី 1៖ បញ្ចូលសំណុំទិន្នន័យរបស់អ្នក
ក្នុងជំហាននេះ យើងនឹងនាំចូលសំណុំទិន្នន័យរបស់អ្នក៖
- ជាដំបូង បញ្ចូលសំណុំទិន្នន័យរបស់អ្នកឱ្យបានត្រឹមត្រូវទៅក្នុង Excel ។ សម្រាប់ការវិភាគរបស់យើង យើងបញ្ចូលសំណុំទិន្នន័យនៅក្នុងជួរនៃក្រឡា B5:D14 ។
- បន្ទាប់មកបញ្ចូល <1 របស់អ្នក>Solver Decision Variables' យើងបញ្ចូលពួកវានៅក្នុងជួរក្រឡា D16:D18។
- យើងកំពុងសន្មតតម្លៃរបស់អថេរទាំងអស់ជា 0.01 ។
អានច្រើនទៀត៖ ការតំរែតំរង់លីនេអ៊ែរច្រើននៅលើសំណុំទិន្នន័យ Excel (2 វិធីសាស្រ្ត)
ជំហានទី 2៖ វាយតម្លៃតម្លៃឡូជីខល
ក្នុងជំហាននេះ យើងនឹងគណនា តម្លៃ Logit សម្រាប់សំណុំទិន្នន័យរបស់យើង។ យើងកំណត់តម្លៃ Logit ជា X ក្នុងការគណនារបស់យើង។ រូបមន្តនៃតម្លៃ Logit គឺ៖
នៅទីនេះ b0, b1, និង b2 គឺជាតំរែតំរង់ អថេរ។
- សរសេររូបមន្តខាងក្រោមក្នុងក្រឡា E5 ។ ប្រើសញ្ញា Absolute ដើម្បីបង្កកតម្លៃក្រឡានៃអថេរ។ ប្រសិនបើអ្នកមិនដឹងពីរបៀបបញ្ចូលសញ្ញា Absolute Cell Reference អ្នកអាចបញ្ចូលវាតាមវិធីជាច្រើន។
=$D$16+$D$17*C5+$D$18*D5
<2
- បន្ទាប់មកចុចគ្រាប់ចុច Enter នៅលើក្តារចុចរបស់អ្នក។
- បន្ទាប់ពីនោះ ចុចពីរដង នៅលើរូបតំណាង Fill Handle ដើម្បីចម្លងរូបមន្តឡើងទៅក្រឡា E14 ។
- អ្នកនឹងទទួលបានតម្លៃទាំងអស់នៃ X ។
អានបន្ថែម៖ How to do Simple Linear Regression in Excel (4 Simple Methods)
ជំហានទី 3៖ កំណត់អិចស្ប៉ូណង់ស្យែលនៃឡូជីតសម្រាប់ទិន្នន័យនីមួយៗ
នៅទីនេះ យើងនឹងគណនាតម្លៃអិចស្ប៉ូណង់ស្យែលនៃឡូជីត តម្លៃ សម្រាប់នោះ យើងនឹងប្រើ អនុគមន៍ EXP :
- ដើម្បីកំណត់តម្លៃអិចស្ប៉ូណង់ស្យែលនៃ X សូមសរសេររូបមន្តខាងក្រោមក្នុងក្រឡា F5 :
=EXP(E5)
- ស្រដៀងគ្នានេះដែរ ចុចពីរដង នៅលើរូបតំណាង Fill Handle ដើម្បីចម្លងរូបមន្តដូចជាជំហានមុន។ អ្នកនឹងទទួលបានតម្លៃអិចស្ប៉ូណង់ស្យែលទាំងអស់នៃ X ។
ជំហានទី 4៖ គណនាតម្លៃប្រូបាប៊ីលីតេ
P( X) គឺជាតម្លៃប្រូបាប៊ីលីតេសម្រាប់ការកើតឡើងព្រឹត្តិការណ៍ X ។ ប្រូបាប៊ីលីតេនៃព្រឹត្តិការណ៍ X អាចកំណត់ជា៖
- ដើម្បីគណនាវា សូមសរសេររូបមន្តខាងក្រោមក្នុងក្រឡា G5 .
=F5/(1+F5)
- ចុច Enter key។
- ឥឡូវនេះ អូសរូបតំណាង Fill Handle រហូតដល់ G15 ដើម្បីទទួលបានតម្លៃសម្រាប់តម្លៃទាំងអស់។
អានបន្ថែម៖ របៀបគណនាតម្លៃ P ក្នុងតំរែតំរង់លីនេអ៊ែរក្នុង Excel (3 វិធី)
ជំហានទី 5៖ វាយតម្លៃផលបូកនៃកំណត់ហេតុ- តម្លៃលទ្ធភាព
នៅក្នុងជំហានខាងក្រោម យើងនឹងវាយតម្លៃតម្លៃនៃ Log-Likelihood ។ បន្ទាប់ពីនោះ យើងនឹងប្រើ អនុគមន៍ SUM ដើម្បីបន្ថែមទិន្នន័យទាំងអស់៖
- ដើម្បីគណនាតម្លៃ Log-Likelihood យើងនឹងទៅ ប្រើ មុខងារ LN មុខងារ នៅក្នុងសំណុំទិន្នន័យរបស់យើង។ នៅក្នុងក្រឡា H5 សូមសរសេររូបមន្តខាងក្រោម៖
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- ឥឡូវនេះ ចុច គ្រាប់ចុច Enter នៅលើក្តារចុច។
- បន្ទាប់មក ចុចពីរដង នៅលើ រូបតំណាង Fill Handle ដើម្បីកំណត់តម្លៃប្រហាក់ប្រហែលនៃកំណត់ហេតុទាំងអស់។
- បន្ទាប់ពីនោះ ក្នុងក្រឡា H15 សូមសរសេរចុះ រូបមន្តខាងក្រោមដើម្បីបូកសរុបតម្លៃទាំងអស់។
=SUM(H5:H14)
🔍 ការបំបែករូបមន្ត
យើងកំពុងធ្វើការបំបែកនេះសម្រាប់ក្រឡា H5 ។
👉
LN(G5): មុខងារនេះត្រឡប់ -0.384។
👉
LN(1-G5): មុខងារនេះត្រឡប់ -1.144។
👉
(B5*LN(G5))+((1-B5)* LN(1-G5)): មុខងារនេះត្រឡប់ -0.384។
ជំហានទី 6៖ ប្រើឧបករណ៍វិភាគដំណោះស្រាយសម្រាប់ការវិភាគចុងក្រោយ
ឥឡូវនេះ យើងនឹងធ្វើ ការវិភាគតំរែតំរង់ចុងក្រោយ។ យើងនឹងធ្វើការវិភាគតាមរយៈពាក្យបញ្ជា Solver ។ ប្រសិនបើអ្នកមិនឃើញវានៅក្នុងផ្ទាំង Data ទេ អ្នកត្រូវតែបើក Solver ពី Excel Add-ins ។
- ដើម្បីបើកវា ជ្រើសរើស ឯកសារ > Options .
- ជាលទ្ធផល ប្រអប់មួយដែលមានឈ្មោះថា Excel Options នឹងបង្ហាញឡើង។
- ក្នុងប្រអប់នេះ ជ្រើសរើសជម្រើស កម្មវិធីបន្ថែម ។
- ឥឡូវនេះ សូមជ្រើសរើសជម្រើស កម្មវិធីបន្ថែម Excel នៅក្នុងផ្នែក គ្រប់គ្រង ហើយចុច Go ។
- ប្រអប់តូចមួយដែលមានចំណងជើង កម្មវិធីបន្ថែម នឹងលេចឡើង។
- បន្ទាប់មក ពិនិត្យជម្រើស Solver Add-in ហើយចុច យល់ព្រម ។
- បន្ទាប់ពីនោះ សូមចូលទៅកាន់ផ្ទាំង Data ហើយអ្នកនឹងឃើញពាក្យបញ្ជា Solver នៅក្នុងក្រុម Analysis ។
- ឥឡូវនេះ សូមចុចលើពាក្យបញ្ជា Solver ។
- ប្រអប់ថ្មីមួយដែលមានចំណងជើងថា Solver Parameters នឹងបង្ហាញឡើង។
- ក្នុងប្រអប់ Set Objective សូមជ្រើសរើសក្រឡា $H$15 ដោយប្រើកណ្ដុររបស់អ្នក។ អ្នកក៏អាចសរសេរឯកសារយោងក្រឡានៅលើក្តារចុចរបស់អ្នកផងដែរ។ ត្រូវប្រាកដថាអ្នកប្រើ ការយោងក្រឡាដាច់ខាត ចុះហត្ថលេខានៅទីនេះ។
- បន្ទាប់ នៅក្នុងជម្រើស ដោយការផ្លាស់ប្តូរក្រឡាអថេរ ជ្រើសរើសជួរក្រឡា $D$16:$D$18 .
- បន្ទាប់មកដោះធីក ធ្វើឱ្យអថេរដែលមិនមានការរឹតបន្តឹងមិនអវិជ្ជមាន ដើម្បីទទួលបានតម្លៃអវិជ្ជមានប្រសិនបើវាត្រូវបានបង្ហាញរួចហើយដូចដែលបានគូស។
- ជាចុងក្រោយ សូមចុច ប៊ូតុង ដោះស្រាយ។
- ជាលទ្ធផល ប្រអប់ លទ្ធផលដំណោះស្រាយ នឹងបង្ហាញនៅពីមុខអ្នក។
- ឥឡូវនេះ សូមជ្រើសរើស Keep Solver Solution ប្រអប់នេះក៏នឹងបង្ហាញអ្នកផងដែរថាតើការវិភាគតំរែតំរង់របស់អ្នកបានបង្រួបបង្រួម ឬខុសគ្នា។
- ចុច យល់ព្រម ដើម្បីបិទប្រអប់។
- ជាចុងក្រោយ អ្នកនឹងឃើញតម្លៃនៃអថេរក្នុងជួរក្រឡា D16:D18 ត្រូវបានផ្លាស់ប្តូរ។ លើសពីនេះ អ្នកក៏នឹងឃើញតម្លៃនៃជួរឈរ E, F, G និង H ក៏បង្ហាញភាពខុសគ្នាពីជំហានមុនផងដែរ។
🔍 រូបភាពនៃលទ្ធផលការវិភាគប្រព័ន្ធគោលពីរ
បន្ទាប់ពីបញ្ចប់ការវិភាគតំរែតំរង់ប្រព័ន្ធគោលពីរក្នុង Excel អ្នកនឹង មើលថាតម្លៃអថេរតំរែតំរង់សន្មត់របស់យើងត្រូវបានជំនួសដោយតម្លៃវិភាគថ្មី ហើយតម្លៃទាំងនេះគឺជាតម្លៃអថេរតំរែតំរង់ត្រឹមត្រូវនៃសំណុំទិន្នន័យរបស់យើង។ យើងអាចពិចារណាពីលទ្ធផលនៃទិន្នន័យជាក់លាក់ណាមួយ ដូចជាម៉ាស៊ីនដែលមានអាយុកាល 68 ខែ និង 4 ជាមធ្យម។ គ្មានការផ្លាស់ប្តូរក្នុងមួយសប្តាហ៍។ តម្លៃនៃ P(X) គឺ 0.67 ។ វាបង្ហាញឱ្យយើងដឹងថាប្រសិនបើយើងមើលសម្រាប់ម៉ាស៊ីននៅក្នុងលក្ខខណ្ឌការងារ លទ្ធភាពនៃព្រឹត្តិការណ៍នោះគឺប្រហែល 67% ។
យើងក៏អាចបង្ហាញវាដាច់ដោយឡែកផងដែរ ដោយប្រើតម្លៃចុងក្រោយនៃអថេរតំរែតំរង់។
ដូច្នេះ យើងអាចនិយាយបានថានីតិវិធីការងាររបស់យើងដំណើរការដោយជោគជ័យ ហើយយើងអាចធ្វើការវិភាគតំរែតំរង់ប្រព័ន្ធគោលពីរបាន។
សេចក្តីសន្និដ្ឋាន
នោះជាចុងបញ្ចប់នៃអត្ថបទនេះ . ខ្ញុំសង្ឃឹមថាអត្ថបទនេះនឹងមានប្រយោជន៍សម្រាប់អ្នក ហើយអ្នកនឹងអាចធ្វើការតំរែតំរង់តំរែតំរង់ក្នុង Excel ។ សូមចែករំលែកសំណួរ ឬការណែនាំបន្ថែមជាមួយពួកយើងនៅក្នុងផ្នែកមតិយោបល់ខាងក្រោម។
កុំភ្លេចពិនិត្យមើលគេហទំព័ររបស់យើង ExcelWIKI សម្រាប់បញ្ហា និងដំណោះស្រាយដែលទាក់ទងនឹង Excel ជាច្រើន។ បន្តរៀនវិធីសាស្រ្តថ្មីៗ ហើយបន្តរីកចម្រើន!