Სარჩევი
მარტივი რეგრესიული ანალიზი ჩვეულებრივ გამოიყენება ორ ცვლადს შორის ურთიერთობის შესაფასებლად, მაგალითად, მოსავლის მოსავლიანობასა და ნალექებს შორის ან კავშირი პურის გემოსა და ღუმელის ტემპერატურას შორის. თუმცა, უფრო ხშირად უნდა გამოვიკვლიოთ კავშირი დამოკიდებულ ცვლადსა და ორ ან მეტ დამოუკიდებელ ცვლადს შორის. მაგალითად, უძრავი ქონების აგენტს შეიძლება სურდეს იცოდეს, არის თუ არა და როგორ არის დაკავშირებული ზომები, როგორიცაა სახლის ზომა, საძინებლების რაოდენობა და უბნის საშუალო შემოსავალი იმ ფასთან, რომლითაც იყიდება სახლი. ამ სახის პრობლემის გადაჭრა შესაძლებელია მრავალჯერადი რეგრესიული ანალიზის გამოყენებით. და ეს სტატია მოგცემთ მოკლედ, თუ როგორ გამოიყენოთ მრავალჯერადი რეგრესიის ანალიზი Excel-ის გამოყენებით.
პრობლემა
დავუშვათ, რომ ჩვენ ავიღეთ შემთხვევით შერჩეული 5 გამყიდველი და შევაგროვეთ ინფორმაცია, როგორც ეს მოცემულია ქვემოთ მოცემულ ცხრილში. აქვს თუ არა გავლენა განათლებას ან მოტივაციას წლიურ გაყიდვებზე თუ არა?
დასრულებულია სკოლის უმაღლესი წელი | მოტივაცია როგორც გაზომილია ჰიგინსის მოტივაციის სკალის მიხედვით | წლიური გაყიდვები დოლარში |
12 | 32 | $350,000 |
14 | 35 | $399765 |
15 | 45 | 429,000$ |
16 | 50 | 435000$ |
18 | 65 | $433,000 |
განტოლება
ზოგადად, მრავლობითირეგრესიული ანალიზი ვარაუდობს, რომ არსებობს წრფივი კავშირი დამოკიდებულ ცვლადსა (y) და დამოუკიდებელ ცვლადებს შორის (x1, x2, x3 … xn). და ამ სახის წრფივი ურთიერთობა შეიძლება აღწერილი იყოს შემდეგი ფორმულის გამოყენებით:
Y = მუდმივი + β1*x1 + β2*x2+…+ βn*xn
აქ არის მუდმივებისა და კოეფიციენტების ახსნა :
Y | Y-ის პროგნოზირებული მნიშვნელობა |
მუდმივი | Y- გადაკვეთა |
β1 | Y-ში ცვლილება ყოველ 1 ნამატში იცვლება x1 |
β2 | ცვლილება Y-ში ყოველი 1 ნამატი იცვლება x2 |
… | … |
bn | ცვლილება Y-ში ყოველი 1 ინკრეტული ცვლილება xn |
მუდმივი და β1, β2… βn შეიძლება გამოითვალოს არსებული ნიმუშის მონაცემების საფუძველზე. მას შემდეგ, რაც მიიღებთ მუდმივ, β1, β2… βn მნიშვნელობებს, შეგიძლიათ მათი გამოყენება პროგნოზების გასაკეთებლად.
რაც შეეხება ჩვენს პრობლემას, არსებობს მხოლოდ ორი ფაქტორი, რომლითაც ჩვენ გვაქვს ინტერესი. მაშასადამე, განტოლება იქნება:
წლიური გაყიდვები = მუდმივი + β1*(სკოლის უმაღლესი წელი დასრულებული) + β2*(მოტივაცია გაზომილი ჰიგინსის მოტივაციის სკალის მიხედვით)
მოდელის დაყენება
წლიური გაყიდვები, სკოლის დასრულებული უმაღლესი წელი და მოტივაცია შეყვანილი იყო A სვეტში, სვეტში B და C სვეტში, როგორც ნაჩვენებია სურათზე 1. უმჯობესია ყოველთვის დააყენოთ დამოკიდებული ცვლადი (აქ წლიური გაყიდვები) დამოუკიდებელ ცვლადებზე წინ. .
სურათი 1
ჩამოტვირთვა Analysis ToolPak
Excelგვთავაზობს მონაცემთა ანალიზის ფუნქციას, რომელსაც შეუძლია დააბრუნოს მუდმივების და კოეფიციენტების მნიშვნელობები. მაგრამ ამ ფუნქციის გამოყენებამდე, თქვენ უნდა ჩამოტვირთოთ Analysis ToolPak. აი, როგორ შეგიძლიათ დააინსტალიროთ იგი.
დააწკაპუნეთ ფაილი ჩანართზე -> პარამეტრები და შემდეგ დააწკაპუნეთ დამატებები -ში Excel Options დიალოგური ფანჯარა. დააწკაპუნეთ ღილაკზე გადადით Excel Options დიალოგური ფანჯრის ბოლოში Add-Ins დიალოგური ფანჯრის გასახსნელად. Add-Ins დიალოგურ ფანჯარაში აირჩიეთ Analysis TookPak ჩამრთველი და შემდეგ დააწკაპუნეთ Ok .
ახლა თუ დააწკაპუნეთ მონაცემთა ჩანართი, ნახავთ მონაცემთა ანალიზი გამოჩნდება ანალიზი ჯგუფში (მარჯვენა პანელი).
სურათი 2 [დააწკაპუნეთ სურათზე მიიღეთ სრული ხედი]
მრავალჯერადი რეგრესიული ანალიზი
დააწკაპუნეთ მონაცემთა ანალიზზე ანალიზი ჯგუფში მონაცემები ჩანართზე . აირჩიეთ რეგრესია მოთხოვნილ მონაცემთა ანალიზი დიალოგურ ფანჯარაში. თქვენ ასევე შეგიძლიათ გააკეთოთ სხვა სტატისტიკური ანალიზი როგორიცაა t-ტესტი, ANOVA და ასე შემდეგ.
სურათი 3.1
A რეგრესია დიალოგური ფანჯარა გამოჩნდება მას შემდეგ, რაც აირჩიეთ რეგრესია . შეავსეთ დიალოგური ფანჯარა, როგორც ნაჩვენებია სურათზე 3.2.
შეყვანის Y დიაპაზონი შეიცავს დამოკიდებულ ცვლადს და მონაცემებს, ხოლო შეყვანის X დიაპაზონი შეიცავს დამოუკიდებელ ცვლადებს და მონაცემებს. აქვე უნდა შეგახსენოთ, რომ დამოუკიდებელი ცვლადები უნდა იყოს მიმდებარე სვეტებში. ხოლო დამოუკიდებელი ცვლადების მაქსიმალური რაოდენობაა 15.
მას შემდეგდიაპაზონი A1: C1 მოიცავს ცვლად ლეიბლებს და, შესაბამისად, ლეიბლების ველი უნდა იყოს არჩეული. ფაქტობრივად, გირჩევთ, ჩართოთ ეტიკეტები ყოველ ჯერზე, როდესაც ავსებთ Input Y დიაპაზონს და Input X დიაპაზონს. ეს ეტიკეტები გამოსადეგია Excel-ის მიერ დაბრუნებული შემაჯამებელი ანგარიშების განხილვისას.
სურათი 3.2
ნარჩენების მონიშვნის ველის არჩევით, შეგიძლიათ ჩართოთ Excel-ის ჩამონათვალში ნარჩენები თითოეული დაკვირვებისთვის. შეხედეთ სურათს 1, სულ არის 5 დაკვირვება და მიიღებთ 5 ნარჩენს. ნარჩენი არის ის, რაც რჩება, როდესაც წინასწარ გამოაკლებთ დაკვირვებულ მნიშვნელობას. სტანდარტიზებული ნარჩენი არის ნარჩენი გაყოფილი მის სტანდარტულ გადახრაზე.
ასევე შეგიძლიათ აირჩიოთ ნარჩენი ნაკვეთის ჩამრთველი, რომელიც საშუალებას აძლევს Excel-ს დააბრუნოს ნარჩენი ნაკვეთები. ნარჩენი ნაკვეთების რაოდენობა უდრის დამოუკიდებელი ცვლადების რაოდენობას. ნარჩენი ნაკვეთი არის გრაფიკი, რომელიც აჩვენებს ნარჩენებს Y ღერძზე და დამოუკიდებელ ცვლადებს x ღერძზე. შემთხვევითი დისპერსიული წერტილები x-ღერძის გარშემო ნარჩენი ნახაზით ნიშნავს, რომ წრფივი რეგრესიის მოდელი შესაბამისია. მაგალითად, ნახაზი 3.3 გვიჩვენებს ნარჩენი ნაკვეთების სამ ტიპურ შაბლონს. მხოლოდ მარცხენა პანელზე მიუთითებს, რომ ის კარგად შეესაბამება ხაზოვან მოდელს. დანარჩენი ორი ნიმუში გვთავაზობს უკეთესად მორგებას არაწრფივი მოდელისთვის.
სურათი 3.3
Excel დააბრუნებს მორგებულ ხაზების ნახაზს, თუ თქვენ აირჩიეთ Line Fit Plots მოსანიშნი ველი. მორგებული ხაზის ნაკვეთიშეუძლია დახატოს ურთიერთობა ერთ დამოკიდებულ ცვლადსა და ერთ დამოუკიდებელ ცვლადს შორის. სხვა სიტყვებით რომ ვთქვათ, Excel დაგიბრუნებთ იმავე რაოდენობის დაყენებულ ხაზის ნახაზებს, როგორც დამოუკიდებელი ცვლადი. მაგალითად, თქვენ მიიღებთ 2 დამონტაჟებულ ხაზს ჩვენი პრობლემისთვის.
შედეგები
ღილაკზე Ok დაწკაპუნების შემდეგ, Excel დააბრუნებს შემაჯამებელ ანგარიშს, როგორც ქვემოთ. მწვანე და ყვითლად ხაზგასმული უჯრედები არის ყველაზე მნიშვნელოვანი ნაწილი, რომელსაც ყურადღება უნდა მიაქციოთ.
სურათი 3.4
რაც უფრო მაღალია R-კვადრატი (უჯრედი F5), მჭიდრო ურთიერთობა არსებობს. დამოკიდებულ ცვლადებსა და დამოუკიდებელ ცვლადებს შორის. და კოეფიციენტებმა (დიაპაზონი F17: F19) მესამე ცხრილში დაგიბრუნეთ მუდმივების და კოეფიციენტების მნიშვნელობები. განტოლება უნდა იყოს წლიური გაყიდვები = 1589.2 + 19928.3* (სასწავლო დასრულებული უმაღლესი წელი) + 11.9* (მოტივაცია გაზომილი ჰიგინსის მოტივაციის სკალის მიხედვით).
თუმცა, რომ ნახოთ შედეგები სანდოა, თქვენ ასევე გჭირდებათ ყვითლად მონიშნული p-მნიშვნელობების შესამოწმებლად. მხოლოდ იმ შემთხვევაში, თუ p-მნიშვნელობა J12 უჯრედში 0,05-ზე ნაკლებია, რეგრესიის მთელი განტოლება საიმედოა. მაგრამ თქვენ ასევე უნდა შეამოწმოთ p-მნიშვნელობები I17: I19 დიაპაზონში, რათა ნახოთ არის თუ არა მუდმივი და დამოუკიდებელი ცვლადები სასარგებლო დამოკიდებული ცვლადის პროგნოზირებისთვის. ჩვენი პრობლემის გამო, ჩვენთვის უკეთესია უარი თქვან მოტივაციაზე დამოუკიდებელი ცვლადების განხილვისას.
წაიკითხეთ მეტი: როგორ გამოვთვალოთ P მნიშვნელობა ხაზოვან რეგრესიაში Excel-ში (3გზები)
ამოიღეთ Motivation დამოუკიდებელი ცვლადებიდან
მოტივაციის, როგორც დამოუკიდებელი ცვლადის წაშლის შემდეგ, მე იგივე მიდგომა გამოვიყენე და გავაკეთე მარტივი რეგრესიის ანალიზი. თქვენ ხედავთ, რომ ყველა მნიშვნელობა ახლა 0.05-ზე ნაკლებია. საბოლოო განტოლება უნდა იყოს:
წლიური გაყიდვები = 1167.8 + 19993.3*(სასწავლო დასრულებული უმაღლესი წელი)
სურათი 3.5 [დააწკაპუნეთ სურათზე სრული სანახავად]
შენიშვნა
სურათი 4
დამატებების ხელსაწყოს გარდა, თქვენ ასევე შეგიძლიათ გამოიყენოთ LINEST ფუნქცია მრავალჯერადი რეგრესიული ანალიზის გასაკეთებლად. LINEST ფუნქცია არის მასივის ფუნქცია, რომელსაც შეუძლია შედეგის დაბრუნება ერთ უჯრედში ან უჯრედების დიაპაზონში. უპირველეს ყოვლისა, აირჩიეთ დიაპაზონი A8:B12 და შემდეგ შეიყვანეთ ფორმულა „=LINEST (A2:A6, B2:B6, TRUE, TRUE)“ ამ დიაპაზონის პირველ უჯრედში (A8). CTRL + SHIFT +ENTER დაჭერის შემდეგ, Excel დააბრუნებს შედეგებს, როგორც ქვემოთ. სურათი 3.4-თან შედარებით, ხედავთ, რომ 19993.3 არის სკოლის დასრულებული უმაღლესი წლის კოეფიციენტი, ხოლო 1167.8 მუდმივია. ყოველ შემთხვევაში, გირჩევთ გამოიყენოთ Add-Ins ინსტრუმენტი. ეს ბევრად უფრო ადვილია.
დაწვრილებით…
შებრუნებული What-If ანალიზი Excel-ში
როგორ გამოვიყენოთ Wildcards Excel-ში?
ჩამოტვირთეთ სამუშაო ფაილი
ჩამოტვირთეთ სამუშაო ფაილი ქვემოთ მოცემული ბმულიდან.
Multiple-Regression-Analysis. xlsx