Mục lục
Phân tích hồi quy là một phép tính thống kê được sử dụng rộng rãi. Chúng tôi thường làm loại tính toán này theo mong muốn của chúng tôi. Trong Excel, chúng ta có thể thực hiện nhiều loại phân tích hồi quy . Trong bài viết này, chúng tôi sẽ trình bày cách thực hiện hồi quy logistic trong Excel. Nếu bạn cũng muốn tìm hiểu phân tích này, hãy tải xuống sách bài tập thực hành và theo dõi chúng tôi.
Tải xuống Sách bài tập thực hành
Tải xuống sách bài tập thực hành này để thực hành khi bạn đang đọc bài viết này.
Hồi quy logistic.xlsx
Hồi quy logistic là gì?
Phân tích hồi quy logistic là một thuật toán học thống kê sử dụng để dự đoán giá trị của một biến phụ thuộc dựa trên một số tiêu chí độc lập. Nó giúp một người có được kết quả từ một tập dữ liệu lớn dựa trên danh mục mong muốn của anh ta. Phân tích hồi quy logistic chủ yếu có ba loại:
- Hồi quy logistic nhị phân
- Hồi quy logistic đa thức
- Hồi quy logistic thông thường
Nhị phân Hồi quy logistic: Trong mô hình phân tích hồi quy nhị phân, chúng tôi chỉ xác định một danh mục theo hai trường hợp. Có/Không hoặc Tích cực/Phủ định.
Hồi quy logistic đa thức: Phân tích logistic đa thức hoạt động với ba phân loại trở lên. Nếu chúng tôi có nhiều hơn hai phần được phân loại để phân loại dữ liệu của mình thì chúng tôi có thể sử dụng mô hình phân tích hồi quy này.
Logistic thông thườngHồi quy: Mô hình phân tích hồi quy này hoạt động cho hơn hai danh mục. Tuy nhiên, trong mô hình này, chúng ta cần một thứ tự xác định trước để phân loại chúng.
Quy trình từng bước để thực hiện hồi quy logistic trong Excel
Trong bài viết này, chúng ta sẽ thực hiện hồi quy logistic nhị phân phân tích. Loại phân tích này cung cấp cho chúng ta giá trị dự đoán của biến mong muốn. Để thực hiện phân tích, chúng tôi xem xét bộ dữ liệu gồm 10 máy từ một ngành. Tính khả dụng của máy có thể là tích cực hoặc tiêu cực. Các chữ số nhị phân 1=dương và 0=âm và các giá trị này được hiển thị trong cột B . Tuổi của những máy đó nằm trong cột C và số giờ làm việc trung bình của chúng mỗi tuần nằm trong cột D . Vì vậy, tập dữ liệu của chúng ta nằm trong phạm vi ô B5:D14 . Biến bộ giải hồi quy ban đầu có giá trị nằm trong phạm vi ô C16:D18 . Toàn bộ quy trình phân tích được giải thích từng bước bên dưới:
Bước 1: Nhập tập dữ liệu của bạn
Trong bước này, chúng tôi sẽ nhập tập dữ liệu của bạn:
- Trước hết, hãy nhập chính xác tập dữ liệu của bạn vào Excel. Đối với phân tích của chúng tôi, chúng tôi nhập tập dữ liệu trong phạm vi ô B5:D14 .
- Sau đó, nhập <1 của bạn>Biến quyết định của bộ giải' Chúng tôi nhập chúng vào phạm vi ô D16:D18.
- Chúng tôi giả sử giá trị của tất cả các biến là 0,01 .
ĐọcThêm: Phép hồi quy tuyến tính nhiều lần trên tập dữ liệu Excel (2 phương pháp)
Bước 2: Đánh giá giá trị logit
Trong bước này, chúng ta sẽ tính toán Logit giá trị cho tập dữ liệu của chúng tôi. Chúng tôi xác định giá trị Logit là X trong phép tính của mình. Công thức của giá trị Logit là:
Ở đây, b0, b1, và b2 là hồi quy biến.
- Viết công thức sau vào ô E5 . Sử dụng dấu Tuyệt đối để đóng băng giá trị ô của các biến. Nếu bạn không biết cách nhập ký hiệu Tham chiếu ô tuyệt đối , bạn có thể nhập ký hiệu đó theo nhiều cách.
=$D$16+$D$17*C5+$D$18*D5
- Sau đó, nhấn phím Enter trên bàn phím của bạn.
- Sau đó, nhấp đúp vào vào biểu tượng Fill Handle để sao chép công thức đến ô E14 .
- Bạn sẽ nhận được tất cả các giá trị của X .
Đọc thêm: Cách thực hiện hồi quy tuyến tính đơn giản trong Excel (4 phương pháp đơn giản)
Bước 3: Xác định hàm mũ của logit cho từng dữ liệu
Sau đây, chúng ta sẽ tính giá trị hàm mũ của logit giá trị, Để làm được điều đó, chúng ta sẽ sử dụng hàm EXP :
- Để xác định giá trị hàm mũ của X , hãy viết công thức sau vào ô F5 :
=EXP(E5)
- Tương tự, nhấp đúp chuột vào biểu tượng Fill Handle để sao chép công thức nhưbước trước đó. Bạn sẽ biết tất cả các giá trị hàm mũ của X .
Bước 4: Tính giá trị xác suất
P( X) là giá trị xác suất xảy ra sự kiện X . Xác suất của sự kiện X có thể định nghĩa là:
- Để tính xác suất, hãy viết công thức sau vào ô G5 .
=F5/(1+F5)
- Nhấn Enter key.
- Bây giờ, hãy kéo biểu tượng Fill Handle lên đến G15 để nhận giá trị cho tất cả các giá trị.
Đọc thêm: Cách tính giá trị P theo phương pháp hồi quy tuyến tính trong Excel (3 cách)
Bước 5: Tính tổng log- Giá trị khả năng
Trong các bước sau, chúng ta sẽ đánh giá giá trị của Khả năng đăng nhập. Sau đó, chúng tôi sẽ sử dụng hàm SUM để thêm tất cả dữ liệu:
- Để tính giá trị Khả năng ghi nhật ký , chúng tôi sẽ sử dụng hàm LN trong bộ dữ liệu của chúng tôi. Trong ô H5 , hãy viết công thức sau:
=(B5*LN(G5))+((1-B5)*LN(1-G5))
- Bây giờ, nhấn phím Enter trên bàn phím.
- Sau đó, nhấp đúp vào trên Điền vào biểu tượng Handle để xác định tất cả các giá trị khả năng ghi nhật ký.
- Sau đó, trong ô H15 , hãy viết ra công thức sau để tính tổng tất cả các giá trị.
=SUM(H5:H14)
🔍 Phân tích công thức
Chúng tôi đang làmphân tích này cho ô H5 .
👉
LN(G5): Hàm này trả về -0.384.
👉
LN(1-G5): Hàm này trả về -1.144.
👉
(B5*LN(G5))+((1-B5)* LN(1-G5)): Hàm này trả về -0.384.
Bước 6: Sử dụng Công cụ phân tích bộ giải để phân tích cuối cùng
Bây giờ, chúng ta sẽ tiến hành phân tích hồi quy cuối cùng. Chúng tôi sẽ thực hiện phân tích thông qua lệnh Solver . Nếu bạn không nhìn thấy nó trong tab Dữ liệu , bạn phải bật Bộ giải từ Phần bổ trợ Excel .
- Để bật nó, hãy chọn Tệp > Tùy chọn .
- Kết quả là hộp thoại có tên Tùy chọn Excel sẽ xuất hiện.
- Trong hộp thoại này, hãy chọn tùy chọn Phần bổ trợ .
- Bây giờ, hãy chọn tùy chọn Phần bổ trợ Excel trong phần Quản lý và nhấp vào Go .
- Một hộp thoại nhỏ có tiêu đề Add-ins sẽ xuất hiện.
- Sau đó, hãy chọn tùy chọn Phần bổ trợ bộ giải và nhấp vào OK .
- Sau đó, chuyển đến tab Dữ liệu và bạn sẽ tìm thấy lệnh Solver trong nhóm Analysis .
- Bây giờ, hãy nhấp vào lệnh Bộ giải .
- Một hộp thoại mới có tên Tham số bộ giải sẽ xuất hiện.
- Trong hộp Đặt mục tiêu , chọn ô $H$15 bằng chuột. Bạn cũng có thể viết tham chiếu ô trên bàn phím của mình. Hãy chắc chắn rằng bạn sử dụng Tham chiếu ô tuyệt đối ký tên tại đây.
- Tiếp theo, trong tùy chọn Bằng cách thay đổi ô biến đổi , hãy chọn phạm vi ô $D$16:$D$18 .
- Sau đó, bỏ chọn Biến các biến không giới hạn thành không âm để nhận các giá trị âm nếu nó đã hiển thị là đã chọn.
- Cuối cùng, nhấp vào Nút Giải.
- Kết quả là hộp Kết quả Bộ giải sẽ xuất hiện trước mặt bạn.
- Bây giờ, hãy chọn Giữ Giải pháp Bộ giải Hộp này cũng sẽ cho bạn biết phân tích hồi quy của bạn hội tụ hay phân kỳ.
- Nhấp vào OK để đóng hộp.
- Cuối cùng, bạn sẽ thấy các giá trị của biến trong phạm vi ô D16:D18 được thay đổi. Bên cạnh đó, bạn cũng sẽ thấy giá trị của các cột E, F, G và H cũng cho thấy sự khác biệt so với các bước trước đó.
🔍 Minh họa kết quả phân tích hồi quy nhị phân
Sau khi hoàn thành phân tích hồi quy logistic nhị phân trong Excel, bạn sẽ thấy rằng giá trị biến hồi quy giả định của chúng tôi được thay thế bằng giá trị phân tích mới và các giá trị này là giá trị biến hồi quy chính xác của tập dữ liệu của chúng tôi. Chúng tôi có thể xem xét kết quả của bất kỳ dữ liệu cụ thể nào, chẳng hạn như máy có tuổi 68 tháng và 4 trung bình. không có ca trong tuần. Giá trị của P(X) là 0,67 . Nó minh họa cho chúng ta thấy rằng nếu chúng ta nhìnđối với máy ở tình trạng hoạt động, khả năng xảy ra sự kiện đó là khoảng 67% .
Chúng tôi cũng có thể hiển thị riêng sự kiện đó bằng cách sử dụng các giá trị cuối cùng của biến hồi quy.
Vì vậy, có thể nói rằng quy trình làm việc của chúng tôi đã hoạt động thành công và chúng tôi có thể thực hiện phân tích hồi quy logistic nhị phân.
Kết luận
Đến đây là hết bài viết . Tôi hy vọng rằng bài viết này sẽ hữu ích cho bạn và bạn sẽ có thể thực hiện hồi quy logistic trong Excel. Vui lòng chia sẻ bất kỳ câu hỏi hoặc đề xuất nào khác với chúng tôi trong phần nhận xét bên dưới.
Đừng quên kiểm tra trang web ExcelWIKI của chúng tôi để biết một số vấn đề và giải pháp liên quan đến Excel. Hãy tiếp tục học các phương pháp mới và tiếp tục phát triển!