Phân tích hồi quy bội với Excel

  • Chia Sẻ Cái Này
Hugh West

Phân tích hồi quy đơn giản thường được sử dụng để ước tính mối quan hệ giữa hai biến, ví dụ: mối quan hệ giữa năng suất cây trồng và lượng mưa hoặc mối quan hệ giữa hương vị của bánh mì và nhiệt độ lò nướng. Tuy nhiên, chúng ta cần điều tra mối quan hệ giữa một biến phụ thuộc và hai hoặc nhiều biến độc lập thường xuyên hơn. Ví dụ, một đại lý bất động sản có thể muốn biết liệu các thước đo như diện tích ngôi nhà, số phòng ngủ và thu nhập trung bình của khu vực lân cận có liên quan đến giá bán một ngôi nhà hay không và bằng cách nào. Loại vấn đề này có thể được giải quyết bằng cách áp dụng phân tích hồi quy bội. Và bài viết này sẽ cung cấp cho bạn bản tóm tắt về cách sử dụng phân tích hồi quy bội bằng Excel.

Vấn đề

Giả sử chúng ta chọn ngẫu nhiên 5 nhân viên bán hàng và thu thập thông tin như trong bảng bên dưới. Giáo dục hay động lực có ảnh hưởng đến doanh thu hàng năm hay không?

Hoàn thành năm học cao nhất Động lực như Được đo lường bằng Thang đo động lực Higgins Doanh thu hàng năm tính bằng đô la
12 32 $350.000
14 35 $399.765
15 45 $429.000
16 50 $435.000
18 65 $433.000

Phương trình

Nói chung, bội sốphân tích hồi quy giả định rằng có mối quan hệ tuyến tính giữa biến phụ thuộc (y) và các biến độc lập (x1, x2, x3 … xn). Và loại mối quan hệ tuyến tính này có thể được mô tả bằng công thức sau:

Y = hằng số + β1*x1 + β2*x2+…+ βn*xn

Dưới đây là giải thích cho các hằng số và hệ số :

Y Giá trị dự đoán của Y
Hằng số Y- chặn
β1 Sự thay đổi trong Y mỗi lần tăng 1 thay đổi trong x1
β2 Các thay đổi trong Y mỗi lần tăng 1 thay đổi trong x2
βn Sự thay đổi trong Y, mỗi 1 gia số thay đổi trong xn

Hằng số và β1, β2… βn có thể được tính toán dựa trên dữ liệu mẫu có sẵn. Sau khi bạn nhận được các giá trị của hằng số, β1, β2… βn, bạn có thể sử dụng chúng để đưa ra dự đoán.

Đối với vấn đề của chúng ta, chỉ có hai yếu tố mà chúng ta quan tâm. Do đó, phương trình sẽ là:

Doanh số hàng năm = hằng số + β1*(Hoàn thành năm học cao nhất) + β2*(Động lực được đo bằng Thang đo động lực Higgins)

Thiết lập mô hình

Doanh số hàng năm, năm học cao nhất đã hoàn thành và Động lực được nhập vào cột A, cột B và cột C như trong Hình 1. Tốt hơn là luôn đặt biến phụ thuộc (Doanh số hàng năm ở đây) trước các biến độc lập .

Hình 1

Tải xuống ToolPak phân tích

Excelcung cấp cho chúng tôi tính năng Phân tích dữ liệu có thể trả về các giá trị của hằng số và hệ số. Nhưng trước khi sử dụng tính năng này, bạn cần tải xuống Analysis ToolPak. Đây là cách bạn có thể cài đặt nó.

Nhấp vào tab Tệp -> Tùy chọn rồi nhấp vào Phần bổ trợ trong Hộp thoại Tùy chọn Excel . Nhấp vào nút Go ở cuối hộp thoại Tùy chọn Excel để mở hộp thoại Add-Ins . Trong hộp thoại Add-Ins , chọn hộp kiểm Analysis TookPak rồi nhấp vào Ok .

Bây giờ nếu bạn nhấp vào Data , bạn sẽ thấy Data Analysis xuất hiện trong nhóm Analysis (bảng bên phải).

Hình 2 [nhấp vào hình ảnh để xem xem toàn bộ]

Phân tích hồi quy bội

Nhấp vào Phân tích dữ liệu trong nhóm Phân tích trên tab Dữ liệu . Chọn Hồi quy Trong hộp thoại Phân tích dữ liệu được nhắc. Bạn cũng có thể thực hiện phân tích thống kê khác như kiểm định t, ANOVA, v.v.

Hình 3.1

A Hồi quy hộp thoại sẽ được nhắc sau khi bạn chọn Hồi quy . Điền vào hộp thoại như trong Hình 3.2.

Phạm vi đầu vào Y chứa biến phụ thuộc và dữ liệu trong khi Phạm vi đầu vào X chứa các biến và dữ liệu độc lập. Ở đây tôi phải nhắc bạn rằng các biến độc lập nên nằm trong các cột liền kề. Và số biến độc lập tối đa là 15.

Vìphạm vi A1: C1 bao gồm các nhãn biến và do đó nên chọn hộp kiểm Nhãn. Trên thực tế, tôi khuyên bạn nên bao gồm các nhãn mỗi khi bạn điền vào Phạm vi đầu vào Y và Phạm vi đầu vào X. Các nhãn này hữu ích khi bạn xem xét các báo cáo tóm tắt do Excel trả về.

Hình 3.2

Bằng cách chọn hộp kiểm Dư, bạn có thể cho phép Excel liệt kê các dư cho mỗi lần quan sát. Nhìn vào Hình 1, có tổng cộng 5 quan sát và bạn sẽ nhận được 5 phần dư. Phần dư là thứ còn lại khi bạn trừ giá trị dự đoán khỏi giá trị quan sát được. Phần dư được chuẩn hóa là phần dư chia cho độ lệch chuẩn của nó.

Bạn cũng có thể chọn hộp kiểm Biểu đồ phần dư có thể cho phép Excel trả về các ô phần dư. Số lượng ô dư bằng số lượng biến độc lập. Đồ thị phần dư là biểu đồ hiển thị phần dư trên trục Y và các biến độc lập trên trục x. Các điểm phân tán ngẫu nhiên xung quanh trục x trong biểu đồ phần dư ngụ ý rằng mô hình hồi quy tuyến tính là phù hợp. Ví dụ, Hình 3.3 cho thấy ba mẫu điển hình của các ô dư. Chỉ cái ở bảng bên trái chỉ ra rằng nó phù hợp với mô hình tuyến tính. Hai mẫu còn lại gợi ý cách phù hợp hơn cho mô hình phi tuyến tính.

Hình 3.3

Excel sẽ trả về một biểu đồ đường vừa khớp nếu bạn chọn hộp kiểm Biểu đồ vừa với đường. Một biểu đồ đường được trang bịcó thể vẽ biểu đồ mối quan hệ giữa một biến phụ thuộc và một biến độc lập. Nói cách khác, Excel sẽ trả về cho bạn cùng số lượng ô đường phù hợp với biến độc lập. Ví dụ: bạn sẽ nhận được 2 biểu đồ đường phù hợp cho bài toán của chúng ta.

Kết quả

Sau khi bạn nhấp vào nút Ok, Excel sẽ trả về một báo cáo tóm tắt như bên dưới. Các ô được đánh dấu màu xanh lá cây và màu vàng là phần quan trọng nhất mà bạn nên chú ý.

Hình 3.4

R-square (ô F5) càng cao thì mối quan hệ càng chặt chẽ giữa biến phụ thuộc và biến độc lập. Và các hệ số (phạm vi F17: F19) trong bảng thứ ba trả về cho bạn các giá trị của hằng số và hệ số. Phương trình phải là Doanh số hàng năm = 1589,2 + 19928,3*(Hoàn thành năm học cao nhất) + 11,9*(Động lực được đo bằng Thang đo động lực của Higgins).

Tuy nhiên, để xem kết quả có đáng tin cậy hay không, bạn cũng cần để kiểm tra giá trị p được đánh dấu màu vàng. Chỉ khi giá trị p trong ô J12 nhỏ hơn 0,05 thì toàn bộ phương trình hồi quy mới đáng tin cậy. Nhưng bạn cũng cần kiểm tra các giá trị p trong phạm vi I17:I19 để xem liệu các biến độc lập và hằng số có hữu ích cho việc dự đoán biến phụ thuộc hay không. Đối với vấn đề của chúng ta, tốt hơn hết là chúng ta nên loại bỏ động lực khi xem xét các biến độc lập.

Đọc thêm: Cách tính giá trị P trong hồi quy tuyến tính trong Excel (3Cách)

Xóa Động lực khỏi các biến độc lập

Sau khi xóa Động lực khỏi biến độc lập, tôi đã áp dụng phương pháp tương tự và thực hiện phân tích hồi quy đơn giản. Bạn có thể thấy rằng tất cả các giá trị hiện đều nhỏ hơn 0,05. Phương trình cuối cùng phải là:

Doanh số hàng năm = 1167,8 + 19993,3*(Hoàn thành năm học cao nhất)

Hình 3.5 [nhấp vào hình ảnh để xem toàn bộ]

Lưu ý

Hình 4

Bên cạnh công cụ Add-Ins, bạn cũng có thể sử dụng hàm LINEST để thực hiện phân tích hồi quy bội. Hàm LINEST là một hàm mảng có thể trả về kết quả trong một ô hoặc một dải ô. Trước hết, chọn dải ô A8:B12 rồi nhập công thức “=LINEST (A2:A6, B2:B6, TRUE, TRUE)” vào ô đầu tiên của dải ô này (A8). Sau khi bạn nhấn CTRL + SHIFT + ENTER, Excel sẽ trả về kết quả như bên dưới. So sánh với Hình 3.4, bạn có thể thấy rằng 19993,3 là hệ số Hoàn thành năm học cao nhất trong khi 1167,8 là hằng số. Dù sao, tôi khuyên bạn nên sử dụng công cụ Add-Ins. Nó dễ dàng hơn nhiều.

Đọc thêm…

Phân tích What-If ngược trong Excel

Cách sử dụng Ký tự đại diện trong Excel?

Tải xuống tệp làm việc

Tải xuống tệp làm việc từ liên kết bên dưới.

Phân tích hồi quy nhiều lần. xlsx

Hugh West là một nhà phân tích và huấn luyện viên Excel giàu kinh nghiệm với hơn 10 năm kinh nghiệm trong ngành. Ông có bằng Cử nhân Tài chính Kế toán và bằng Thạc sĩ Quản trị Kinh doanh. Hugh có niềm đam mê giảng dạy và đã phát triển một phương pháp giảng dạy độc đáo, dễ hiểu và dễ theo dõi. Kiến thức chuyên môn về Excel của ông đã giúp hàng nghìn sinh viên và chuyên gia trên toàn thế giới cải thiện kỹ năng và xuất sắc trong sự nghiệp của họ. Thông qua blog của mình, Hugh chia sẻ kiến ​​thức của mình với mọi người, cung cấp các hướng dẫn Excel miễn phí và đào tạo trực tuyến để giúp các cá nhân và doanh nghiệp phát huy hết tiềm năng của họ.