สารบัญ
การถดถอยอย่างง่าย มักใช้เพื่อประเมินความสัมพันธ์ระหว่างตัวแปรสองตัว เช่น ความสัมพันธ์ระหว่างผลผลิตพืชผลกับปริมาณน้ำฝน หรือความสัมพันธ์ระหว่างรสชาติของขนมปังกับอุณหภูมิเตาอบ อย่างไรก็ตาม เราจำเป็นต้องตรวจสอบความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระตั้งแต่สองตัวขึ้นไปบ่อยกว่านั้น ตัวอย่างเช่น ตัวแทนอสังหาริมทรัพย์อาจต้องการทราบว่ามาตรการต่างๆ เช่น ขนาดของบ้าน จำนวนห้องนอน และรายได้เฉลี่ยของพื้นที่ใกล้เคียงนั้นสัมพันธ์กับราคาขายบ้านหรือไม่และอย่างไร ปัญหาประเภทนี้สามารถแก้ไขได้โดยใช้ การวิเคราะห์การถดถอยพหุคูณ และบทความนี้จะสรุปวิธีการใช้การวิเคราะห์การถดถอยพหุคูณโดยใช้ Excel
ปัญหา
สมมติว่าเราสุ่มเลือกพนักงานขาย 5 คนและรวบรวมข้อมูลดังตารางด้านล่าง การศึกษาหรือแรงจูงใจมีผลกระทบต่อยอดขายประจำปีหรือไม่
เรียนจบชั้นปีสูงสุด | แรงจูงใจในฐานะ วัดจาก Higgins Motivation Scale | ยอดขายประจำปีเป็นดอลลาร์ |
12 | 32 | $350,000 |
14 | 35 | $399,765 |
15 | 45<10 | $429,000 |
16 | 50 | $435,000 |
18 | 65 | $433,000 |
สมการ
โดยทั่วไป ทวีคูณการวิเคราะห์การถดถอย ถือว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตาม (y) และตัวแปรอิสระ (x1, x2, x3 … xn) และความสัมพันธ์เชิงเส้นประเภทนี้สามารถอธิบายได้โดยใช้สูตรต่อไปนี้:
Y = ค่าคงที่ + β1*x1 + β2*x2+…+ βn*xn
นี่คือคำอธิบายสำหรับค่าคงที่และค่าสัมประสิทธิ์ :
Y | ค่าที่คาดการณ์ของ Y |
ค่าคงที่ | Y- การสกัดกั้น |
β1 | การเปลี่ยนแปลงใน Y แต่ละ 1 การเปลี่ยนแปลงที่เพิ่มขึ้นใน x1 |
β2 | The การเปลี่ยนแปลงใน Y ทุกๆ 1 การเปลี่ยนแปลงที่เพิ่มขึ้นใน x2 |
… | … |
βn | การเปลี่ยนแปลง ใน Y แต่ละการเปลี่ยนแปลงที่เพิ่มขึ้น 1 ใน xn |
ค่าคงที่และ β1, β2… βn สามารถคำนวณได้จากข้อมูลตัวอย่างที่มีอยู่ หลังจากที่คุณได้ค่าคงที่ β1, β2… βn แล้ว คุณก็สามารถใช้ค่าเหล่านี้ในการคาดคะเนได้
สำหรับปัญหาของเรา มีเพียงสองปัจจัยเท่านั้นที่เราสนใจ ดังนั้น สมการจะเป็น:
ยอดขายประจำปี = ค่าคงที่ + β1*(ปีสูงสุดที่เรียนจบ) + β2*(แรงจูงใจที่วัดโดย Higgins Motivation Scale)
ตั้งค่าโมเดล
ยอดขายประจำปี ปีการศึกษาสูงสุดที่เรียนจบ และแรงจูงใจ ถูกป้อนลงในคอลัมน์ A คอลัมน์ B และคอลัมน์ C ดังแสดงในรูปที่ 1 เป็นการดีกว่าที่จะใส่ตัวแปรตามเสมอ (ยอดขายประจำปีที่นี่) ก่อนตัวแปรอิสระเสมอ .
รูปที่ 1
ดาวน์โหลด Analysis ToolPak
Excelเสนอคุณสมบัติการวิเคราะห์ข้อมูลซึ่งสามารถส่งคืนค่าคงที่และค่าสัมประสิทธิ์ แต่ก่อนที่จะใช้คุณลักษณะนี้ คุณต้องดาวน์โหลด Analysis ToolPak นี่คือวิธีที่คุณสามารถติดตั้งได้
คลิกที่แท็บ ไฟล์ -> ตัวเลือก จากนั้นคลิกที่ ส่วนเสริม ใน ตัวเลือก Excel กล่องโต้ตอบ คลิกที่ปุ่ม ไป ที่ด้านล่างของกล่องโต้ตอบ ตัวเลือก Excel เพื่อเปิดกล่องโต้ตอบ ส่วนเสริม ในกล่องโต้ตอบ Add-Ins เลือกช่องทำเครื่องหมาย Analysis TookPak จากนั้นคลิกที่ ตกลง .
ตอนนี้ หากคุณคลิกที่ แท็บข้อมูล คุณจะเห็น การวิเคราะห์ข้อมูล ปรากฏในกลุ่ม การวิเคราะห์ (แผงด้านขวา)
รูปที่ 2 [คลิกที่ภาพเพื่อ รับมุมมองแบบเต็ม]
การวิเคราะห์การถดถอยพหุคูณ
คลิกที่ การวิเคราะห์ข้อมูล ในกลุ่ม การวิเคราะห์ บนแท็บ ข้อมูล . เลือก การถดถอย ในกล่องโต้ตอบ การวิเคราะห์ข้อมูล พร้อมท์ คุณยังสามารถทำ การวิเคราะห์ทางสถิติ อื่นๆ เช่น t-test, ANOVA และอื่นๆ
รูปที่ 3.1
A Regression กล่องโต้ตอบจะได้รับแจ้งหลังจากที่คุณเลือก การถดถอย เติมกล่องโต้ตอบดังแสดงในรูปที่ 3.2
ช่วง Y อินพุตประกอบด้วยตัวแปรตามและข้อมูล ในขณะที่ช่วงอินพุต X มีตัวแปรและข้อมูลอิสระ ฉันต้องเตือนคุณว่าตัวแปรอิสระควรอยู่ในคอลัมน์ที่อยู่ติดกัน และจำนวนสูงสุดของตัวแปรอิสระคือ 15
ตั้งแต่ช่วง A1: C1 มีป้ายกำกับตัวแปร ดังนั้นควรเลือกช่องทำเครื่องหมายป้ายกำกับ อันที่จริง ฉันแนะนำให้คุณใส่ป้ายกำกับทุกครั้งเมื่อคุณเติมช่วงอินพุต Y และช่วงอินพุต X ป้ายกำกับเหล่านี้มีประโยชน์เมื่อคุณตรวจทานรายงานสรุปที่ส่งคืนโดย Excel
รูปที่ 3.2
โดยการเลือกช่องทำเครื่องหมาย ส่วนที่เหลือ คุณสามารถเปิดใช้งาน Excel เพื่อแสดงรายการส่วนที่เหลือสำหรับการสังเกตแต่ละครั้ง ดูรูปที่ 1 มีข้อสังเกตทั้งหมด 5 ข้อและคุณจะได้ 5 ข้อที่เหลือ ส่วนที่เหลือคือสิ่งที่เหลืออยู่เมื่อคุณลบค่าที่คาดการณ์ออกจากค่าที่สังเกตได้ Standardized residual คือส่วนที่เหลือหารด้วยส่วนเบี่ยงเบนมาตรฐาน
คุณยังสามารถเลือกกล่องกาเครื่องหมาย Residual Plot ซึ่งสามารถเปิดใช้งาน Excel เพื่อส่งคืนการพล็อตที่เหลือ จำนวนของพล็อตที่เหลือเท่ากับจำนวนของตัวแปรอิสระ แผนภาพที่เหลือคือกราฟที่แสดงข้อมูลที่เหลือบนแกน Y และตัวแปรอิสระบนแกน x จุดกระจายแบบสุ่มรอบแกน x ในพล็อตที่เหลือหมายความว่าแบบจำลอง การถดถอยเชิงเส้น เหมาะสม ตัวอย่างเช่น รูปที่ 3.3 แสดงสามรูปแบบทั่วไปของแผนภาพที่เหลือ เฉพาะในแผงด้านซ้ายเท่านั้นที่ระบุว่าเหมาะสำหรับโมเดลเชิงเส้น อีกสองรูปแบบแนะนำว่าเหมาะสมกว่าสำหรับโมเดลที่ไม่ใช่เชิงเส้น
รูปที่ 3.3
Excel จะส่งคืนพล็อตเส้นที่พอดี หากคุณเลือกช่องทำเครื่องหมาย Line Fit Plots พล็อตเส้นพอดีสามารถพล็อตความสัมพันธ์ระหว่างตัวแปรตามหนึ่งตัวกับตัวแปรอิสระหนึ่งตัว กล่าวอีกนัยหนึ่ง Excel จะแสดงแผนภาพเส้นที่พอดีกับตัวแปรอิสระในจำนวนที่เท่ากัน ตัวอย่างเช่น คุณจะได้รับแผนภาพเส้นพอดี 2 เส้นสำหรับปัญหาของเรา
ผลลัพธ์
หลังจากที่คุณคลิกที่ปุ่มตกลง Excel จะส่งรายงานสรุปกลับตามด้านล่าง เซลล์ที่เน้นด้วยสีเขียวและสีเหลืองเป็นส่วนที่สำคัญที่สุดที่คุณควรให้ความสนใจ
รูปที่ 3.4
ค่า R-square ที่สูงขึ้น (เซลล์ F5) แสดงว่ามีความสัมพันธ์แน่นแฟ้น ระหว่างตัวแปรตามและตัวแปรอิสระ และค่าสัมประสิทธิ์ (ช่วง F17: F19) ในตารางที่สามจะแสดงค่าคงที่และค่าสัมประสิทธิ์ให้คุณ สมการควรเป็นยอดขายประจำปี = 1589.2 + 19928.3*(ปีสูงสุดของการเรียนที่จบ) + 11.9*(แรงจูงใจที่วัดโดย Higgins Motivation Scale)
อย่างไรก็ตาม เพื่อดูว่าผลลัพธ์เชื่อถือได้หรือไม่ คุณต้องมี เพื่อตรวจสอบค่า p ที่เน้นด้วยสีเหลือง เฉพาะในกรณีที่ค่า p ในเซลล์ J12 น้อยกว่า 0.05 สมการการถดถอยทั้งหมดจะเชื่อถือได้ แต่คุณต้องตรวจสอบค่า p ในช่วง I17: I19 เพื่อดูว่าตัวแปรคงที่และตัวแปรอิสระมีประโยชน์สำหรับการทำนายตัวแปรตามหรือไม่ สำหรับปัญหาของเรา เป็นการดีกว่าที่เราจะละทิ้งแรงจูงใจเมื่อพิจารณาตัวแปรอิสระ
อ่านเพิ่มเติม: วิธีคำนวณค่า P ในการถดถอยเชิงเส้นใน Excel (3วิธี)
ลบแรงจูงใจออกจากตัวแปรอิสระ
หลังจากลบแรงจูงใจที่เป็นตัวแปรอิสระแล้ว ฉันก็ใช้วิธีการเดียวกันและทำการวิเคราะห์การถดถอยอย่างง่าย คุณจะเห็นว่าตอนนี้ค่าทั้งหมดน้อยกว่า 0.05 สมการสุดท้ายควรเป็น:
ยอดขายประจำปี = 1167.8 + 19993.3*(ปีสูงสุดที่เรียนจบ)
รูปที่ 3.5 [คลิกที่ภาพเพื่อดูแบบเต็ม]<3
หมายเหตุ
รูปที่ 4
นอกจากเครื่องมือ Add-Ins แล้ว คุณยังสามารถใช้ฟังก์ชัน LINEST เพื่อวิเคราะห์การถดถอยพหุคูณได้อีกด้วย ฟังก์ชัน LINEST เป็นฟังก์ชันอาร์เรย์ที่สามารถส่งกลับผลลัพธ์เป็นเซลล์เดียวหรือหลายช่วงเซลล์ก็ได้ ก่อนอื่น เลือกช่วง A8:B12 แล้วป้อนสูตร “=LINEST (A2:A6, B2:B6, TRUE, TRUE)” ลงในเซลล์แรกของช่วงนี้ (A8) หลังจากที่คุณกด CTRL + SHIFT +ENTER แล้ว Excel จะแสดงผลลัพธ์ดังนี้ เมื่อเปรียบเทียบกับรูปที่ 3.4 คุณจะเห็นว่า 19993.3 เป็นค่าสัมประสิทธิ์ของปีการศึกษาสูงสุดที่เรียนจบ ในขณะที่ 1167.8 เป็นค่าคงที่ อย่างไรก็ตาม ฉันขอแนะนำให้คุณใช้เครื่องมือ Add-Ins ง่ายกว่ามาก
อ่านเพิ่มเติม…
ย้อนกลับการวิเคราะห์แบบ What-If ใน Excel
จะใช้สัญลักษณ์แทนใน Excel ได้อย่างไร
ดาวน์โหลดไฟล์การทำงาน
ดาวน์โหลดไฟล์การทำงานจากลิงก์ด้านล่าง
การวิเคราะห์การถดถอยพหุคูณ xlsx