Բովանդակություն
Պարզ ռեգրեսիոն վերլուծությունը սովորաբար օգտագործվում է երկու փոփոխականների միջև կապը գնահատելու համար, օրինակ՝ բերքի բերքի և տեղումների միջև կապը կամ հացի համի և ջեռոցի ջերմաստիճանի միջև կապը: Այնուամենայնիվ, մենք պետք է ավելի հաճախ ուսումնասիրենք կախված փոփոխականի և երկու կամ ավելի անկախ փոփոխականների միջև կապը: Օրինակ, անշարժ գույքի գործակալը կարող է ցանկանալ իմանալ, թե արդյոք և ինչպես են այն չափերը, ինչպիսիք են տան չափը, ննջասենյակների քանակը և շրջակայքի միջին եկամուտը, առնչվում են այն գնին, որով վաճառվում է տունը: Այս տեսակի խնդիրը կարող է լուծվել բազմակի ռեգրեսիոն վերլուծության կիրառմամբ: Եվ այս հոդվածը ձեզ կտրամադրի ամփոփում, թե ինչպես կարելի է օգտագործել բազմակի ռեգրեսիոն վերլուծություն Excel-ի միջոցով:
Խնդիր
Ենթադրենք, որ մենք վերցրել ենք պատահականության սկզբունքով ընտրված 5 վաճառողներ և հավաքել ենք տեղեկատվությունը, ինչպես ցույց է տրված ստորև բերված աղյուսակում: Արդյոք կրթությունը կամ մոտիվացիան ազդում է տարեկան վաճառքի վրա, թե ոչ: Չափվում է Հիգինսի մոտիվացիայի սանդղակով Տարեկան վաճառքները դոլարով 12 32 $350,000 14 35 $399765 15 45 429000$ 16 50 435000$ 18 65 $433,000
Հավասարում
Ընդհանուր առմամբ, բազմապատիկռեգրեսիոն վերլուծություն ենթադրում է, որ կախված փոփոխականի (y) և անկախ փոփոխականների (x1, x2, x3 … xn) միջև կա գծային հարաբերություն: Եվ այս տեսակի գծային հարաբերությունները կարելի է նկարագրել հետևյալ բանաձևով.
Y = հաստատուն + β1*x1 + β2*x2+…+ βn*xn
Ահա հաստատունների և գործակիցների բացատրությունները. :
Y | Y |
Կոնստանտի կանխատեսված արժեքը | Y- ընդհատում |
β1 | Y-ի փոփոխությունը յուրաքանչյուր 1 աճի փոփոխություն x1-ում |
β2 | Y-ի փոփոխություն յուրաքանչյուր 1 աճի փոփոխություն x2-ում |
… | … |
bn | Փոփոխությունը Y-ում xn |
Հաստատուն և β1, β2… βn-ի յուրաքանչյուր 1 հավելում փոփոխություն կարող է հաշվարկվել առկա նմուշի տվյալների հիման վրա: Վ1, β2… βn հաստատունի արժեքները ստանալուց հետո կարող եք դրանք օգտագործել կանխատեսումներ անելու համար:
Ինչ վերաբերում է մեր խնդրին, ապա կա միայն երկու գործոն, որոնցում մենք շահագրգռված ենք: Հետևաբար, հավասարումը կլինի՝
Տարեկան վաճառք = հաստատուն + β1*(Ավարտված դպրոցի ամենաբարձր տարին) + β2*(Մոտիվացիա՝ չափված Հիգինսի մոտիվացիայի սանդղակով)
Ստեղծել մոդել
Տարեկան վաճառքները, ավարտված դպրոցի ամենաբարձր տարին և մոտիվացիան մուտքագրվել են A սյունակում, սյունակ B և C սյունակում, ինչպես ցույց է տրված Նկար 1-ում: Ավելի լավ է միշտ դնել կախյալ փոփոխականը (Տարեկան վաճառք այստեղ) անկախ փոփոխականներից առաջ: .
Նկար 1
Ներբեռնել վերլուծության գործիքակազմ
Excelմեզ առաջարկում է Տվյալների վերլուծության հատկություն, որը կարող է վերադարձնել հաստատունների և գործակիցների արժեքները: Բայց նախքան այս հնարավորությունն օգտագործելը, դուք պետք է ներբեռնեք Analysis ToolPak-ը: Ահա թե ինչպես կարող եք տեղադրել այն:
Սեղմեք Ֆայլ ներդիրի վրա -> Ընտրանքներ և այնուհետև սեղմեք Ավելացումներ -ում: 1>Excel Ընտրանքներ երկխոսության տուփ: Սեղմեք Գնալ կոճակը Excel Options երկխոսության տուփի ներքևում` Հավելումներ երկխոսության տուփը բացելու համար: Add-Ins երկխոսության վանդակում ընտրեք Analysis TookPak վանդակը և այնուհետև սեղմեք Ok :
Այժմ, եթե սեղմեք Տվյալների ներդիրը, կտեսնեք, որ Տվյալների վերլուծություն հայտնվում է Վերլուծություն խմբում (աջ վահանակ):
Նկար 2 [սեղմեք նկարի վրա՝ ստանալ ամբողջական տեսք]
Բազմակի ռեգրեսիոն վերլուծություն
Սեղմեք Տվյալների վերլուծություն Վերլուծություն խմբում Տվյալներ ներդիրում: . Ընտրեք Հետընթաց հուշվող Տվյալների վերլուծություն երկխոսության վանդակում: Դուք կարող եք նաև կատարել այլ վիճակագրական վերլուծություն , ինչպիսիք են t-test, ANOVA և այլն:
Նկար 3.1
A Regression Regression ընտրելուց հետո երկխոսության տուփ կհայտնվի: Լրացրեք երկխոսության տուփը, ինչպես ցույց է տրված Նկար 3.2-ում:
Input Y Range-ը պարունակում է կախված փոփոխական և տվյալներ, մինչդեռ Input X Range-ը պարունակում է անկախ փոփոխականներ և տվյալներ: Այստեղ ես պետք է հիշեցնեմ, որ անկախ փոփոխականները պետք է լինեն հարակից սյունակներում: Իսկ անկախ փոփոխականների առավելագույն թիվը 15 է։
Սկսածմիջակայք A1. C1-ը ներառում է փոփոխական պիտակներ և, հետևաբար, Labels վանդակը պետք է ընտրվի: Իրականում, ես ձեզ խորհուրդ եմ տալիս ամեն անգամ ներառել պիտակներ, երբ լրացնում եք Input Y Range-ը և Input X Range-ը: Այս պիտակները օգտակար են, երբ վերանայում եք Excel-ի կողմից վերադարձված ամփոփ հաշվետվությունները:
Նկար 3.2
Ընտրելով մնացորդներ վանդակը, դուք կարող եք միացնել Excel-ին ցուցակագրելու մնացորդները յուրաքանչյուր դիտարկման համար: Նայեք Նկար 1-ին, ընդհանուր առմամբ կա 5 դիտարկում, և դուք կստանաք 5 մնացորդ: Մնացորդը մի բան է, որը մնում է, երբ կանխատեսված արժեքը հանում եք դիտարկված արժեքից: Ստանդարտացված մնացորդը այն մնացորդն է, որը բաժանվում է իր ստանդարտ շեղման վրա:
Դուք կարող եք նաև ընտրել մնացորդային հողամասի վանդակը, որը կարող է Excel-ին հնարավորություն տալ վերադարձնել մնացորդային սյուժեները: Մնացորդային հողամասերի թիվը հավասար է անկախ փոփոխականների թվին: Մնացորդային գծապատկերը գրաֆիկ է, որը ցույց է տալիս մնացորդները Y առանցքի վրա և անկախ փոփոխականները x առանցքի վրա: Պատահականորեն ցրված կետերը x առանցքի շուրջ մնացորդային գծապատկերում ենթադրում է, որ գծային ռեգրեսիայի մոդելը տեղին է: Օրինակ, Նկար 3.3-ը ցույց է տալիս մնացորդային հողամասերի երեք բնորոշ օրինաչափություններ: Միայն ձախ վահանակում նշվածը ցույց է տալիս, որ այն լավ է համապատասխանում գծային մոդելին: Մյուս երկու օրինաչափությունները առաջարկում են ավելի լավ տեղավորել ոչ գծային մոդելի համար:
Նկար 3.3
Excel-ը կվերադարձնի համապատասխան գծերի գծապատկեր, եթե ընտրեք Line Fit Plots վանդակը: Կահավորված գծի հողամասկարող է գծագրել կապը մեկ կախյալ փոփոխականի և մեկ անկախ փոփոխականի միջև: Այլ կերպ ասած, Excel-ը ձեզ կվերադարձնի նույն թվով տեղադրված գծերի սյուժեները անկախ փոփոխականի հետ: Օրինակ, դուք կստանաք 2 հարմարեցված գծապատկեր մեր խնդրի համար:
Արդյունքներ
Ok կոճակը սեղմելուց հետո Excel-ը կվերադարձնի ամփոփ հաշվետվություն, ինչպես ստորև: Կանաչ և դեղին գույներով ընդգծված բջիջները ամենակարևոր մասն են, որոնց պետք է ուշադրություն դարձնեք:
Նկար 3.4
Որքան բարձր է R-քառակուսին (F5 բջիջ), այնքան ամուր հարաբերություններ կան: կախված փոփոխականների և անկախ փոփոխականների միջև: Իսկ երրորդ աղյուսակի գործակիցները (F17: F19 միջակայքը) ձեզ վերադարձրին հաստատունների և գործակիցների արժեքները: Հավասարումը պետք է լինի Տարեկան վաճառք = 1589.2 + 19928.3* (Ավարտված դպրոցի ամենաբարձր տարին) + 11.9* (Մոտիվացիա, ինչպես չափվում է Հիգինսի մոտիվացիայի սանդղակով):
Սակայն տեսնելու համար, թե արդյոք արդյունքները հավաստի են, անհրաժեշտ է նաև. դեղինով ընդգծված p-արժեքները ստուգելու համար: Միայն եթե J12 բջիջում p-արժեքը 0,05-ից փոքր է, ռեգրեսիայի ամբողջ հավասարումը հուսալի է: Բայց դուք նաև պետք է ստուգեք p-արժեքները I17: I19 միջակայքում, որպեսզի տեսնեք, թե արդյոք հաստատուն և անկախ փոփոխականները օգտակար են կախված փոփոխականի կանխատեսման համար: Մեր խնդրի համար ավելի լավ է, որ մենք հրաժարվենք շարժառիթից անկախ փոփոխականները դիտարկելիս:
Կարդալ ավելին. Ինչպես հաշվարկել P արժեքը գծային ռեգրեսիայում Excel-ում (3ուղիներ)
Հեռացնել Motivation-ը անկախ փոփոխականներից
Motivation-ը որպես անկախ փոփոխական ջնջելուց հետո ես կիրառեցի նույն մոտեցումը և կատարեցի պարզ ռեգրեսիոն վերլուծություն։ Դուք կարող եք տեսնել, որ այժմ բոլոր արժեքները 0,05-ից պակաս են: Վերջնական հավասարումը պետք է լինի.
Տարեկան վաճառք = 1167.8 + 19993.3*(Ավարտված դպրոցի ամենաբարձր տարին)
Նկար 3.5 [սեղմեք նկարի վրա ամբողջական տեսք ստանալու համար]
Նշում
Նկար 4
Բացի հավելումների գործիքից, դուք կարող եք նաև օգտագործել LINEST ֆունկցիան` բազմակի ռեգրեսիա վերլուծություն կատարելու համար: LINEST ֆունկցիան զանգվածային ֆունկցիա է, որը կարող է արդյունքը վերադարձնել կամ մեկ բջիջում կամ մի շարք բջիջներում: Նախ ընտրեք A8:B12 միջակայքը և այնուհետև մուտքագրեք «=LINEST (A2:A6, B2:B6, TRUE, TRUE)» բանաձևը այս տիրույթի առաջին բջիջում (A8): CTRL + SHIFT +ENTER սեղմելուց հետո Excel-ը կվերադարձնի ստորև նշված արդյունքները: Համեմատելով Նկար 3.4-ի հետ՝ կարող եք տեսնել, որ 19993.3-ը ավարտված դպրոցի ամենաբարձր տարվա գործակիցն է, մինչդեռ 1167.8-ը հաստատուն է: Ինչևէ, խորհուրդ եմ տալիս օգտագործել Add-Ins գործիքը։ Դա շատ ավելի հեշտ է:
Կարդալ ավելին…
Հակադարձ What-If վերլուծությունը Excel-ում
Ինչպե՞ս օգտագործել Wildcards Excel-ում:
Ներբեռնել աշխատանքային ֆայլը
Ներբեռնել աշխատանքային ֆայլը ստորև նշված հղումից:
Multiple-Regression-Analysis: xlsx