การวิเคราะห์การถดถอยพหุคูณด้วย Excel

  • แบ่งปันสิ่งนี้
Hugh West
การวิเคราะห์

การถดถอยอย่างง่าย มักใช้เพื่อประเมินความสัมพันธ์ระหว่างตัวแปรสองตัว เช่น ความสัมพันธ์ระหว่างผลผลิตพืชผลกับปริมาณน้ำฝน หรือความสัมพันธ์ระหว่างรสชาติของขนมปังกับอุณหภูมิเตาอบ อย่างไรก็ตาม เราจำเป็นต้องตรวจสอบความสัมพันธ์ระหว่างตัวแปรตามกับตัวแปรอิสระตั้งแต่สองตัวขึ้นไปบ่อยกว่านั้น ตัวอย่างเช่น ตัวแทนอสังหาริมทรัพย์อาจต้องการทราบว่ามาตรการต่างๆ เช่น ขนาดของบ้าน จำนวนห้องนอน และรายได้เฉลี่ยของพื้นที่ใกล้เคียงนั้นสัมพันธ์กับราคาขายบ้านหรือไม่และอย่างไร ปัญหาประเภทนี้สามารถแก้ไขได้โดยใช้ การวิเคราะห์การถดถอยพหุคูณ และบทความนี้จะสรุปวิธีการใช้การวิเคราะห์การถดถอยพหุคูณโดยใช้ Excel

ปัญหา

สมมติว่าเราสุ่มเลือกพนักงานขาย 5 คนและรวบรวมข้อมูลดังตารางด้านล่าง การศึกษาหรือแรงจูงใจมีผลกระทบต่อยอดขายประจำปีหรือไม่

เรียนจบชั้นปีสูงสุด แรงจูงใจในฐานะ วัดจาก Higgins Motivation Scale ยอดขายประจำปีเป็นดอลลาร์
12 32 $350,000
14 35 $399,765
15 45<10 $429,000
16 50 $435,000
18 65 $433,000

สมการ

โดยทั่วไป ทวีคูณการวิเคราะห์การถดถอย ถือว่ามีความสัมพันธ์เชิงเส้นตรงระหว่างตัวแปรตาม (y) และตัวแปรอิสระ (x1, x2, x3 … xn) และความสัมพันธ์เชิงเส้นประเภทนี้สามารถอธิบายได้โดยใช้สูตรต่อไปนี้:

Y = ค่าคงที่ + β1*x1 + β2*x2+…+ βn*xn

นี่คือคำอธิบายสำหรับค่าคงที่และค่าสัมประสิทธิ์ :

Y ค่าที่คาดการณ์ของ Y
ค่าคงที่ Y- การสกัดกั้น
β1 การเปลี่ยนแปลงใน Y แต่ละ 1 การเปลี่ยนแปลงที่เพิ่มขึ้นใน x1
β2 The การเปลี่ยนแปลงใน Y ทุกๆ 1 การเปลี่ยนแปลงที่เพิ่มขึ้นใน x2
βn การเปลี่ยนแปลง ใน Y แต่ละการเปลี่ยนแปลงที่เพิ่มขึ้น 1 ใน xn

ค่าคงที่และ β1, β2… βn สามารถคำนวณได้จากข้อมูลตัวอย่างที่มีอยู่ หลังจากที่คุณได้ค่าคงที่ β1, β2… βn แล้ว คุณก็สามารถใช้ค่าเหล่านี้ในการคาดคะเนได้

สำหรับปัญหาของเรา มีเพียงสองปัจจัยเท่านั้นที่เราสนใจ ดังนั้น สมการจะเป็น:

ยอดขายประจำปี = ค่าคงที่ + β1*(ปีสูงสุดที่เรียนจบ) + β2*(แรงจูงใจที่วัดโดย Higgins Motivation Scale)

ตั้งค่าโมเดล

ยอดขายประจำปี ปีการศึกษาสูงสุดที่เรียนจบ และแรงจูงใจ ถูกป้อนลงในคอลัมน์ A คอลัมน์ B และคอลัมน์ C ดังแสดงในรูปที่ 1 เป็นการดีกว่าที่จะใส่ตัวแปรตามเสมอ (ยอดขายประจำปีที่นี่) ก่อนตัวแปรอิสระเสมอ .

รูปที่ 1

ดาวน์โหลด Analysis ToolPak

Excelเสนอคุณสมบัติการวิเคราะห์ข้อมูลซึ่งสามารถส่งคืนค่าคงที่และค่าสัมประสิทธิ์ แต่ก่อนที่จะใช้คุณลักษณะนี้ คุณต้องดาวน์โหลด Analysis ToolPak นี่คือวิธีที่คุณสามารถติดตั้งได้

คลิกที่แท็บ ไฟล์ -> ตัวเลือก จากนั้นคลิกที่ ส่วนเสริม ใน ตัวเลือก Excel กล่องโต้ตอบ คลิกที่ปุ่ม ไป ที่ด้านล่างของกล่องโต้ตอบ ตัวเลือก Excel เพื่อเปิดกล่องโต้ตอบ ส่วนเสริม ในกล่องโต้ตอบ Add-Ins เลือกช่องทำเครื่องหมาย Analysis TookPak จากนั้นคลิกที่ ตกลง .

ตอนนี้ หากคุณคลิกที่ แท็บข้อมูล คุณจะเห็น การวิเคราะห์ข้อมูล ปรากฏในกลุ่ม การวิเคราะห์ (แผงด้านขวา)

รูปที่ 2 [คลิกที่ภาพเพื่อ รับมุมมองแบบเต็ม]

การวิเคราะห์การถดถอยพหุคูณ

คลิกที่ การวิเคราะห์ข้อมูล ในกลุ่ม การวิเคราะห์ บนแท็บ ข้อมูล . เลือก การถดถอย ในกล่องโต้ตอบ การวิเคราะห์ข้อมูล พร้อมท์ คุณยังสามารถทำ การวิเคราะห์ทางสถิติ อื่นๆ เช่น t-test, ANOVA และอื่นๆ

รูปที่ 3.1

A Regression กล่องโต้ตอบจะได้รับแจ้งหลังจากที่คุณเลือก การถดถอย เติมกล่องโต้ตอบดังแสดงในรูปที่ 3.2

ช่วง Y อินพุตประกอบด้วยตัวแปรตามและข้อมูล ในขณะที่ช่วงอินพุต X มีตัวแปรและข้อมูลอิสระ ฉันต้องเตือนคุณว่าตัวแปรอิสระควรอยู่ในคอลัมน์ที่อยู่ติดกัน และจำนวนสูงสุดของตัวแปรอิสระคือ 15

ตั้งแต่ช่วง A1: C1 มีป้ายกำกับตัวแปร ดังนั้นควรเลือกช่องทำเครื่องหมายป้ายกำกับ อันที่จริง ฉันแนะนำให้คุณใส่ป้ายกำกับทุกครั้งเมื่อคุณเติมช่วงอินพุต Y และช่วงอินพุต X ป้ายกำกับเหล่านี้มีประโยชน์เมื่อคุณตรวจทานรายงานสรุปที่ส่งคืนโดย Excel

รูปที่ 3.2

โดยการเลือกช่องทำเครื่องหมาย ส่วนที่เหลือ คุณสามารถเปิดใช้งาน Excel เพื่อแสดงรายการส่วนที่เหลือสำหรับการสังเกตแต่ละครั้ง ดูรูปที่ 1 มีข้อสังเกตทั้งหมด 5 ข้อและคุณจะได้ 5 ข้อที่เหลือ ส่วนที่เหลือคือสิ่งที่เหลืออยู่เมื่อคุณลบค่าที่คาดการณ์ออกจากค่าที่สังเกตได้ Standardized residual คือส่วนที่เหลือหารด้วยส่วนเบี่ยงเบนมาตรฐาน

คุณยังสามารถเลือกกล่องกาเครื่องหมาย Residual Plot ซึ่งสามารถเปิดใช้งาน Excel เพื่อส่งคืนการพล็อตที่เหลือ จำนวนของพล็อตที่เหลือเท่ากับจำนวนของตัวแปรอิสระ แผนภาพที่เหลือคือกราฟที่แสดงข้อมูลที่เหลือบนแกน Y และตัวแปรอิสระบนแกน x จุดกระจายแบบสุ่มรอบแกน x ในพล็อตที่เหลือหมายความว่าแบบจำลอง การถดถอยเชิงเส้น เหมาะสม ตัวอย่างเช่น รูปที่ 3.3 แสดงสามรูปแบบทั่วไปของแผนภาพที่เหลือ เฉพาะในแผงด้านซ้ายเท่านั้นที่ระบุว่าเหมาะสำหรับโมเดลเชิงเส้น อีกสองรูปแบบแนะนำว่าเหมาะสมกว่าสำหรับโมเดลที่ไม่ใช่เชิงเส้น

รูปที่ 3.3

Excel จะส่งคืนพล็อตเส้นที่พอดี หากคุณเลือกช่องทำเครื่องหมาย Line Fit Plots พล็อตเส้นพอดีสามารถพล็อตความสัมพันธ์ระหว่างตัวแปรตามหนึ่งตัวกับตัวแปรอิสระหนึ่งตัว กล่าวอีกนัยหนึ่ง Excel จะแสดงแผนภาพเส้นที่พอดีกับตัวแปรอิสระในจำนวนที่เท่ากัน ตัวอย่างเช่น คุณจะได้รับแผนภาพเส้นพอดี 2 เส้นสำหรับปัญหาของเรา

ผลลัพธ์

หลังจากที่คุณคลิกที่ปุ่มตกลง Excel จะส่งรายงานสรุปกลับตามด้านล่าง เซลล์ที่เน้นด้วยสีเขียวและสีเหลืองเป็นส่วนที่สำคัญที่สุดที่คุณควรให้ความสนใจ

รูปที่ 3.4

ค่า R-square ที่สูงขึ้น (เซลล์ F5) แสดงว่ามีความสัมพันธ์แน่นแฟ้น ระหว่างตัวแปรตามและตัวแปรอิสระ และค่าสัมประสิทธิ์ (ช่วง F17: F19) ในตารางที่สามจะแสดงค่าคงที่และค่าสัมประสิทธิ์ให้คุณ สมการควรเป็นยอดขายประจำปี = 1589.2 + 19928.3*(ปีสูงสุดของการเรียนที่จบ) + 11.9*(แรงจูงใจที่วัดโดย Higgins Motivation Scale)

อย่างไรก็ตาม เพื่อดูว่าผลลัพธ์เชื่อถือได้หรือไม่ คุณต้องมี เพื่อตรวจสอบค่า p ที่เน้นด้วยสีเหลือง เฉพาะในกรณีที่ค่า p ในเซลล์ J12 น้อยกว่า 0.05 สมการการถดถอยทั้งหมดจะเชื่อถือได้ แต่คุณต้องตรวจสอบค่า p ในช่วง I17: I19 เพื่อดูว่าตัวแปรคงที่และตัวแปรอิสระมีประโยชน์สำหรับการทำนายตัวแปรตามหรือไม่ สำหรับปัญหาของเรา เป็นการดีกว่าที่เราจะละทิ้งแรงจูงใจเมื่อพิจารณาตัวแปรอิสระ

อ่านเพิ่มเติม: วิธีคำนวณค่า P ในการถดถอยเชิงเส้นใน Excel (3วิธี)

ลบแรงจูงใจออกจากตัวแปรอิสระ

หลังจากลบแรงจูงใจที่เป็นตัวแปรอิสระแล้ว ฉันก็ใช้วิธีการเดียวกันและทำการวิเคราะห์การถดถอยอย่างง่าย คุณจะเห็นว่าตอนนี้ค่าทั้งหมดน้อยกว่า 0.05 สมการสุดท้ายควรเป็น:

ยอดขายประจำปี = 1167.8 + 19993.3*(ปีสูงสุดที่เรียนจบ)

รูปที่ 3.5 [คลิกที่ภาพเพื่อดูแบบเต็ม]<3

หมายเหตุ

รูปที่ 4

นอกจากเครื่องมือ Add-Ins แล้ว คุณยังสามารถใช้ฟังก์ชัน LINEST เพื่อวิเคราะห์การถดถอยพหุคูณได้อีกด้วย ฟังก์ชัน LINEST เป็นฟังก์ชันอาร์เรย์ที่สามารถส่งกลับผลลัพธ์เป็นเซลล์เดียวหรือหลายช่วงเซลล์ก็ได้ ก่อนอื่น เลือกช่วง A8:B12 แล้วป้อนสูตร “=LINEST (A2:A6, B2:B6, TRUE, TRUE)” ลงในเซลล์แรกของช่วงนี้ (A8) หลังจากที่คุณกด CTRL + SHIFT +ENTER แล้ว Excel จะแสดงผลลัพธ์ดังนี้ เมื่อเปรียบเทียบกับรูปที่ 3.4 คุณจะเห็นว่า 19993.3 เป็นค่าสัมประสิทธิ์ของปีการศึกษาสูงสุดที่เรียนจบ ในขณะที่ 1167.8 เป็นค่าคงที่ อย่างไรก็ตาม ฉันขอแนะนำให้คุณใช้เครื่องมือ Add-Ins ง่ายกว่ามาก

อ่านเพิ่มเติม…

ย้อนกลับการวิเคราะห์แบบ What-If ใน Excel

จะใช้สัญลักษณ์แทนใน Excel ได้อย่างไร

ดาวน์โหลดไฟล์การทำงาน

ดาวน์โหลดไฟล์การทำงานจากลิงก์ด้านล่าง

การวิเคราะห์การถดถอยพหุคูณ xlsx

Hugh West เป็นผู้ฝึกอบรมและนักวิเคราะห์ Excel ที่มีประสบการณ์สูงและมีประสบการณ์มากกว่า 10 ปีในอุตสาหกรรมนี้ เขาสำเร็จการศึกษาระดับปริญญาตรีสาขาการบัญชีและการเงิน และปริญญาโทสาขาบริหารธุรกิจ Hugh มีความหลงใหลในการสอนและได้พัฒนาแนวทางการสอนที่เป็นเอกลักษณ์ซึ่งง่ายต่อการติดตามและเข้าใจ ความรู้ความเชี่ยวชาญของเขาเกี่ยวกับ Excel ช่วยให้นักเรียนและผู้เชี่ยวชาญหลายพันคนทั่วโลกพัฒนาทักษะและความเป็นเลิศในอาชีพการงาน ฮิวจ์แบ่งปันความรู้ของเขากับคนทั้งโลกผ่านบล็อก โดยเสนอบทช่วยสอน Excel ฟรีและการฝึกอบรมออนไลน์เพื่อช่วยให้บุคคลและธุรกิจบรรลุศักยภาพสูงสุดของตนเอง