วิธีการทำ Logistic Regression ใน Excel (ด้วยขั้นตอนด่วน)

  • แบ่งปันสิ่งนี้
Hugh West

การวิเคราะห์การถดถอย เป็นการคำนวณทางสถิติที่ใช้กันอย่างแพร่หลาย เรามักจะทำการคำนวณประเภทนี้ตามความต้องการของเรา ใน Excel เราสามารถดำเนินการ การวิเคราะห์การถดถอยได้หลายประเภท ในบทความนี้ เราจะสาธิตวิธีการถดถอยโลจิสติกใน Excel หากคุณสนใจที่จะเรียนรู้การวิเคราะห์นี้ ให้ดาวน์โหลดสมุดงานแบบฝึกหัดและติดตามเรา

ดาวน์โหลดแบบฝึกหัดแบบฝึกหัด

ดาวน์โหลดแบบฝึกหัดแบบฝึกหัดนี้เพื่อฝึกฝนขณะที่คุณกำลังอ่านบทความนี้

Logistic Regression.xlsx

Logistic Regression คืออะไร?

การวิเคราะห์การถดถอยโลจิสติกเป็นอัลกอริทึมการเรียนรู้ทางสถิติที่ใช้ในการทำนายค่าของตัวแปรตามตามเกณฑ์อิสระบางประการ ช่วยให้บุคคลได้รับผลลัพธ์จากชุดข้อมูลขนาดใหญ่ตามหมวดหมู่ที่ต้องการ การวิเคราะห์การถดถอยโลจิสติกส่วนใหญ่มี 3 ประเภท:

  1. การถดถอยโลจิสติกแบบไบนารี
  2. การถดถอยโลจิสติกพหุนาม
  3. การถดถอยโลจิสติกแบบลำดับ

ไบนารี การถดถอยโลจิสติก: ในรูปแบบการวิเคราะห์การถดถอยแบบไบนารี เรากำหนดหมวดหมู่ด้วยสองกรณีเท่านั้น ใช่/ไม่ใช่ หรือบวก/ลบ

การถดถอยลอจิสติกพหุนาม: การวิเคราะห์โลจิสติกพหุนามทำงานร่วมกับการจัดประเภทตั้งแต่สามประเภทขึ้นไป หากเรามีมากกว่าสองส่วนที่จำแนกประเภทเพื่อจัดหมวดหมู่ข้อมูลของเรา เราก็สามารถใช้โมเดลการวิเคราะห์การถดถอยนี้ได้

Ordinal Logisticการถดถอย: โมเดลการวิเคราะห์การถดถอยนี้ใช้ได้กับมากกว่าสองประเภท อย่างไรก็ตาม ในแบบจำลองนี้ เราจำเป็นต้องมีลำดับที่กำหนดไว้ล่วงหน้าเพื่อจัดหมวดหมู่

ขั้นตอนทีละขั้นตอนในการทำ Logistic Regression ใน Excel

ในบทความนี้ เราจะดำเนินการถดถอยโลจิสติกแบบไบนารี การวิเคราะห์. การวิเคราะห์ประเภทนี้ทำให้เรามีค่าการทำนายของตัวแปรที่ต้องการ ในการวิเคราะห์ เราพิจารณาชุดข้อมูล 10 เครื่องจากอุตสาหกรรมหนึ่งๆ ความพร้อมใช้งานของเครื่องอาจเป็นบวกหรือลบก็ได้ เลขฐานสอง 1=บวก และ 0=ลบ และค่าเหล่านี้จะแสดงในคอลัมน์ B อายุของเครื่องจักรเหล่านั้นอยู่ในคอลัมน์ C และชั่วโมงการทำงานโดยเฉลี่ยของเครื่องจักรเหล่านั้นต่อสัปดาห์อยู่ในคอลัมน์ D ดังนั้น ชุดข้อมูลของเราจึงอยู่ในช่วงของเซลล์ B5:D14 ค่าเริ่มต้นของตัวแปรตัวแก้การถดถอยอยู่ในช่วงของเซลล์ C16:D18 ขั้นตอนการวิเคราะห์ทั้งหมดอธิบายไว้ด้านล่างทีละขั้นตอน:

ขั้นตอนที่ 1: ป้อนชุดข้อมูลของคุณ

ในขั้นตอนนี้ เราจะนำเข้าชุดข้อมูลของคุณ:

  • ก่อนอื่น ใส่ชุดข้อมูลของคุณลงใน Excel ให้ถูกต้อง สำหรับการวิเคราะห์ของเรา เราป้อนข้อมูลชุดข้อมูลในช่วงของเซลล์ B5:D14 .

  • จากนั้น ป้อน Solver Decision Varibles' เราป้อนข้อมูลในช่วงของเซลล์ D16:D18
  • เราถือว่าค่าของตัวแปรทั้งหมดเป็น 0.01 .

อ่านเพิ่มเติม: การถดถอยเชิงเส้นพหุบนชุดข้อมูล Excel (2 วิธี)

ขั้นตอนที่ 2: ประเมินค่า Logit

ในขั้นตอนนี้ เราจะคำนวณ ค่า Logit สำหรับชุดข้อมูลของเรา เรากำหนดค่า Logit เป็น X ในการคำนวณของเรา สูตรของค่า Logit คือ:

ที่นี่ b0, b1, และ b2 คือการถดถอย ตัวแปร

  • จดสูตรต่อไปนี้ในเซลล์ E5 ใช้เครื่องหมาย Absolute เพื่อหยุดค่าเซลล์ของตัวแปร หากคุณไม่ทราบวิธีป้อนเครื่องหมาย การอ้างอิงเซลล์สัมบูรณ์ คุณสามารถป้อนได้หลายวิธี

=$D$16+$D$17*C5+$D$18*D5 <2

  • จากนั้น กดปุ่ม Enter บนแป้นพิมพ์

  • หลังจากนั้น ดับเบิลคลิก บนไอคอน Fill Handle เพื่อคัดลอกสูตรไปยังเซลล์ E14 .

  • คุณจะได้รับค่าทั้งหมดของ X .

อ่านเพิ่มเติม: วิธีทำ Simple Linear Regression ใน Excel (4 วิธีง่ายๆ)

ขั้นตอนที่ 3: กำหนด Exponential ของ Logit สำหรับแต่ละข้อมูล

ที่นี่ เราจะคำนวณค่าเอกซ์โปเนนเชียลของ Logit ค่า เพื่อที่เราจะใช้ ฟังก์ชัน EXP :

  • ในการกำหนดค่าเลขชี้กำลังของ X ให้จดสูตรต่อไปนี้ลงในเซลล์ F5 :

=EXP(E5)

  • ในทำนองเดียวกัน ดับเบิลคลิก บนไอคอน Fill Handle เพื่อคัดลอกสูตร เช่นขั้นตอนก่อนหน้า คุณจะหาค่าเลขชี้กำลังทั้งหมดของ X .

ขั้นตอนที่ 4: คำนวณค่าความน่าจะเป็น

P( X) คือค่าความน่าจะเป็นที่จะเกิดเหตุการณ์ X ความน่าจะเป็นของเหตุการณ์ X สามารถกำหนดเป็น:

  • ในการคำนวณ ให้จดสูตรต่อไปนี้ในเซลล์ G5 .

=F5/(1+F5)

  • กดปุ่ม Enter key.
  • ตอนนี้ ลากไอคอน Fill Handle ขึ้นไปที่ G15 เพื่อรับค่าสำหรับค่าทั้งหมด

อ่านเพิ่มเติม: วิธีคำนวณค่า P ในการถดถอยเชิงเส้นใน Excel (3 วิธี)

ขั้นตอนที่ 5: ประเมินผลรวมของ Log- ค่าความน่าจะเป็น

ในขั้นตอนต่อไปนี้ เราจะประเมินค่าของ ความน่าจะเป็นของบันทึก หลังจากนั้น เราจะใช้ ฟังก์ชัน SUM เพื่อเพิ่มข้อมูลทั้งหมด:

  • ในการคำนวณค่า Log-Likelihood เราจะ ใช้ LN ฟังก์ชัน ในชุดข้อมูลของเรา ในเซลล์ H5 เขียนสูตรต่อไปนี้:

=(B5*LN(G5))+((1-B5)*LN(1-G5))

  • ตอนนี้ กด ปุ่ม Enter บนแป้นพิมพ์

  • จากนั้น ดับเบิลคลิก บนปุ่ม ไอคอน Fill Handle เพื่อกำหนดค่าความเป็นไปได้ในการบันทึกทั้งหมด

  • หลังจากนั้น ในเซลล์ H15 ให้จด สูตรต่อไปนี้เพื่อรวมค่าทั้งหมด

=SUM(H5:H14)

🔍 รายละเอียดสูตร

เรากำลังดำเนินการรายละเอียดนี้สำหรับเซลล์ H5 .

👉 LN(G5): ฟังก์ชันนี้ส่งคืน -0.384.

👉 LN(1-G5): ฟังก์ชันนี้จะคืนค่า -1.144.

👉 (B5*LN(G5))+((1-B5)* LN(1-G5)): ฟังก์ชันนี้จะคืนค่า -0.384

ขั้นตอนที่ 6: ใช้เครื่องมือวิเคราะห์โปรแกรมสำหรับการวิเคราะห์ขั้นสุดท้าย

ตอนนี้ เราจะดำเนินการ การวิเคราะห์การถดถอยขั้นสุดท้าย เราจะทำการวิเคราะห์ผ่านคำสั่ง Solver หากคุณไม่เห็นในแท็บ ข้อมูล คุณต้องเปิดใช้งาน โปรแกรมแก้ปัญหา จาก โปรแกรมเสริมของ Excel

  • หากต้องการเปิดใช้งาน ให้เลือก ไฟล์ > ตัวเลือก .

  • ด้วยเหตุนี้ กล่องโต้ตอบชื่อ ตัวเลือก Excel จะปรากฏขึ้น
  • ในกล่องโต้ตอบนี้ เลือกตัวเลือก ส่วนเสริม
  • ตอนนี้ เลือกตัวเลือก ส่วนเสริมของ Excel ในส่วน จัดการ และคลิก ไป .

  • กล่องโต้ตอบขนาดเล็กชื่อ ส่วนเสริม จะปรากฏขึ้น
  • จากนั้น ทำเครื่องหมายที่ตัวเลือก Solver Add-in และคลิก ตกลง

  • หลังจากนั้น ไปที่แท็บ ข้อมูล และคุณจะพบคำสั่ง โปรแกรมแก้ปัญหา ในกลุ่ม การวิเคราะห์

  • ตอนนี้ คลิกคำสั่ง Solver
  • กล่องโต้ตอบใหม่ที่ชื่อว่า Solver Parameters จะปรากฏขึ้น
  • ในช่อง กำหนดวัตถุประสงค์ ให้เลือกเซลล์ $H$15 ด้วยเมาส์ของคุณ คุณยังสามารถเขียนการอ้างอิงเซลล์บนแป้นพิมพ์ได้อีกด้วย ตรวจสอบให้แน่ใจว่าคุณใช้ เครื่องหมายอ้างอิงเซลล์สัมบูรณ์ ที่นี่
  • ถัดไป ในตัวเลือก โดยการเปลี่ยนตัวแปรเซลล์ เลือกช่วงของเซลล์ $D$16:$D$18 .
  • จากนั้น ยกเลิกการเลือก ทำให้ตัวแปรที่ไม่มีข้อจำกัดไม่เป็นค่าลบ เพื่อรับค่าลบหากค่านั้นแสดงเป็นเครื่องหมายถูกแล้ว
  • สุดท้าย คลิกปุ่ม แก้ปัญหา ปุ่ม

  • ด้วยเหตุนี้ กล่อง ผลการแก้โจทย์ จะปรากฏขึ้นต่อหน้าคุณ
  • ตอนนี้ เลือก Keep Solver Solution ช่องนี้จะแสดงให้คุณเห็นว่าการวิเคราะห์การถดถอยของคุณรวมหรือแยกออกจากกัน
  • คลิก ตกลง เพื่อปิดกล่อง

  • ในที่สุด คุณจะเห็นค่าของตัวแปรในช่วงของเซลล์ D16:D18 เปลี่ยนไป นอกจากนี้ คุณจะเห็นค่าของคอลัมน์ E, F, G และ H แสดงความแตกต่างจากขั้นตอนก่อนหน้านี้ด้วย

🔍 ภาพประกอบผลการวิเคราะห์การถดถอยแบบไบนารี

หลังจากเสร็จสิ้นการวิเคราะห์การถดถอยโลจิสติกแบบไบนารีใน Excel คุณจะ ดูว่าค่าตัวแปรการถดถอยที่เราสันนิษฐานถูกแทนที่ด้วยค่าการวิเคราะห์ใหม่ และค่าเหล่านี้เป็นค่าตัวแปรการถดถอยที่ถูกต้องของชุดข้อมูลของเรา เราสามารถพิจารณาผลลัพธ์ของข้อมูลเฉพาะ เช่น เครื่องที่มีอายุ 68 เดือน และ 4 เฉลี่ย ไม่มีการเปลี่ยนแปลงต่อสัปดาห์ ค่าของ P(X) คือ 0.67 มันแสดงให้เราเห็นว่าถ้าเราดูสำหรับเครื่องจักรในสภาพการทำงาน ความเป็นไปได้ของเหตุการณ์นั้นประมาณ 67% .

เรายังสามารถแสดงแยกกันได้ โดยใช้ค่าสุดท้ายของตัวแปรการถดถอย

ดังนั้น เราสามารถพูดได้ว่าขั้นตอนการทำงานของเราประสบความสำเร็จ และเราสามารถทำการวิเคราะห์การถดถอยโลจิสติกแบบไบนารีได้

สรุป

นั่นคือจุดสิ้นสุดของบทความนี้ . ฉันหวังว่าบทความนี้จะเป็นประโยชน์สำหรับคุณ และคุณจะสามารถทำการถดถอยโลจิสติกใน Excel ได้ โปรดแบ่งปันคำถามหรือคำแนะนำเพิ่มเติมกับเราในส่วนความคิดเห็นด้านล่าง

อย่าลืมตรวจสอบเว็บไซต์ของเรา ExcelWIKI เพื่อดูปัญหาและแนวทางแก้ไขต่างๆ ที่เกี่ยวข้องกับ Excel เรียนรู้วิธีการใหม่ ๆ และเติบโตต่อไป!

Hugh West เป็นผู้ฝึกอบรมและนักวิเคราะห์ Excel ที่มีประสบการณ์สูงและมีประสบการณ์มากกว่า 10 ปีในอุตสาหกรรมนี้ เขาสำเร็จการศึกษาระดับปริญญาตรีสาขาการบัญชีและการเงิน และปริญญาโทสาขาบริหารธุรกิจ Hugh มีความหลงใหลในการสอนและได้พัฒนาแนวทางการสอนที่เป็นเอกลักษณ์ซึ่งง่ายต่อการติดตามและเข้าใจ ความรู้ความเชี่ยวชาญของเขาเกี่ยวกับ Excel ช่วยให้นักเรียนและผู้เชี่ยวชาญหลายพันคนทั่วโลกพัฒนาทักษะและความเป็นเลิศในอาชีพการงาน ฮิวจ์แบ่งปันความรู้ของเขากับคนทั้งโลกผ่านบล็อก โดยเสนอบทช่วยสอน Excel ฟรีและการฝึกอบรมออนไลน์เพื่อช่วยให้บุคคลและธุรกิจบรรลุศักยภาพสูงสุดของตนเอง