Բովանդակություն
Ռեգրեսիոն վերլուծությունը կա գրեթե բոլոր տեսակի վիճակագրական ծրագրերում, ինչպիսիք են SPSS , R, և էլ չասած Excel-ում: Ռեգրեսիան կարող է մեզ տալ մեծ պատկեր փոփոխականների միջև փոխհարաբերությունների վերաբերյալ: Գծային ռեգրեսիան կարելի է բավականին արագ կատարել Excel-ում՝ օգտագործելով Տվյալների վերլուծություն գործիքը: Այս հոդվածը ցույց կտա, թե ինչպես կարող եք մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում:
Ներբեռնել Practice Workbook
Ներբեռնեք այս գործնական աշխատանքային գիրքը ստորև:
Մեկնաբանել ռեգրեսիայի արդյունքները.xlsx
Ի՞նչ է ռեգրեսիան:
Տվյալների վերլուծության մեջ ռեգրեսիոն վերլուծությունը հաճախ օգտագործվում է բազմաթիվ փոփոխականների միջև կապերը որոշելու համար: Ռեգրեսիոն վերլուծությունը թույլ է տալիս ընտրել, թե ինչ կլինի կախված փոփոխականի հետ, եթե անկախ փոփոխականներից մեկը փոխվի: Այն նաև թույլ է տալիս մաթեմատիկորեն պարզել, թե որ անկախ փոփոխականներն են ազդում:
Պարզ գծային ռեգրեսիան տարբերվում է բազմակի գծային ռեգրեսիայից վիճակագրության մեջ: Օգտագործելով գծային ֆունկցիա՝ պարզ գծային ռեգրեսիոն վերլուծում է փոփոխականների և մեկ անկախ փոփոխականի միջև կապը: Բազմակի գծային ռեգրեսիա այն է, երբ փոփոխականները որոշելու համար օգտագործվում են երկու կամ ավելի բացատրական գործոններ: Կախված փոփոխականի փոխարեն ոչ գծային ռեգրեսիայի օգտագործումը նկարագրվում է որպես ոչ գծային ֆունկցիա, քանի որ տվյալների հարաբերությունները գծային չեն: Այս հոդվածը կկենտրոնանա բազմաթիվ գծերի վրառեգրեսիա ցույց տալու համար, թե ինչպես կարող եք մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում:
Քայլեր Excel-ում ռեգրեսիա կատարելու համար
Ռեգեսիայի նպատակների համար մենք կօգտագործենք ստորև բերված տվյալների բազան վերլուծության նպատակները. Այստեղ անկախ փոփոխականը կլինի Գին սյունակը և Վաճառված սյունակը: անկախ սյունակը կլինի Պահանջարկ սյունակը:
Քայլեր
- Մենք պետք է գնանք Տվյալներ ներդիր և սեղմենք Տվյալների վերլուծություն ` ռեգրեսիա անելու համար :
- Կլինի նոր պատուհան; ընտրեք կախված փոփոխականը և անկախ փոփոխականի տվյալների տիրույթը:
- Այնուհետև նշեք Պիտակներ տուփը և Վստահություն վանդակը:
- Այնուհետև կտտացրեք ելքային բջիջների տիրույթին: վանդակում ընտրեք ելքային բջիջի հասցեն
- Հաջորդը, նշեք Մնացորդային մնացորդները հաշվարկելու համար:
- Դրանից հետո նշեք Մնացորդային գծապատկերները և Line Fit Plots տուփեր
- Սեղմեք OK Սրանից հետո:
- Սեղմելուց հետո Լավ, վերլուծության առաջնային ելքային պարամետրերը կլինեն նշված բջիջներում:
- Այնուհետև դուք նույնպես կստանաք որոշ պարամետրեր ինչպիսին է Նշանակություն արժեքը և այլն ANOVA ( Վարիանսի վերլուծություն ) աղյուսակում:
- Այստեղ df նշանակում է ազատության աստիճանը՝ կապված շեղումների աղբյուրի հետ:
- SS նշանակում է քառակուսիների գումարը: Ձեր մոդելը ավելի լավ կարտացոլի տվյալները, եթե Մնացորդային SS-ը փոքր է Ընդամենը SS-ից:
- MS նշանակում է քառակուսի:
- F նշանակում է F -թեստը զրոյական վարկածի համար:
- F նշանակությունը նշանակում է P -արժեքը F :
- Այնուհետև աղյուսակում կստանաք նաև փոփոխականի գործակիցները, նշանակալի արժեքը և այլն:
- Այնուհետև դուք կստանաք վերջնական աղյուսակ, որը գտնվում է գործակիցների աղյուսակի տակ, որը պարունակում է յուրաքանչյուր մուտքի մնացորդային արժեքը:
- Հաջորդը, դուք կստանաք Պահանջարկը ընդդեմ Գինը ռեգեսիոն աղյուսակը` միտումի գծով:
- Հետո սա, դուք ստանում եք Պահանջարկ ընդդեմ Վաճառված ռեգեսիոն գծապատկերը միտումով:
- Կա մեկ այլ գծապատկեր, որը ցույց է տալիս Վաճառված փոփոխականից յուրաքանչյուր մուտքի մնացորդների բաշխումը: Գին փոփոխականից յուրաքանչյուր մուտքի համար: n մեկնաբանեք այս ռեգրեսիայի արդյունքները Excel-ում:
Կարդալ ավելին. Ինչպես կատարել լոգիստիկ ռեգրեսիա Excel-ում (արագ քայլերով)
Ինչպես մեկնաբանել Ռեգրեսիայի արդյունքները Excel-ում
Հաջորդ բանը, որ դուք պետք է անեք ռեգրեսիայի վերլուծությունը կատարելուց և դրանք մեկնաբանելուց հետո: Արդյունքները նկարագրված և մշակված են ստորև:
Բազմակի R-քառակուսի ռեգրեսիոն արժեքի վերլուծություն
The R-քառակուսի թիվը ցույց է տալիս, թե որքան սերտորեն կապված են տվյալների բազայի տարրերը և որքանով է ռեգրեսիոն գիծը համապատասխանում տվյալներին: Մենք պատրաստվում ենք օգտագործել բազմակի գծային ռեգրեսիոն վերլուծություն, որտեղ մենք պատրաստվում ենք որոշել երկու կամ ավելի փոփոխականների ազդեցությունը հիմնական գործոնի վրա: Սա վերաբերում է նրան, թե ինչպես է փոխվում կախված փոփոխականը, քանի որ փոխվում է անկախ փոփոխականներից մեկը: Այս գործակցի միջակայքը -1-ից 1 է: Այստեղ
- 1 նշանակում է սերտ դրական հարաբերություն
- 0 նշանակում է, որ փոփոխականների միջև հարաբերություններ չկան: Այլ կերպ ասած, տվյալների կետերը պատահական են:
- -1 նշանակում է փոփոխականների հակադարձ կամ բացասական հարաբերություններ:
Վերևում ցուցադրված ելքային արդյունքներում տրված բազմակի R-արժեքը տվյալների հավաքածուն o.7578 է ( մոտ ), որը ցույց է տալիս փոփոխականների միջև ամուր հարաբերություններ:
R քառակուսի
R քառակուսի արժեքը բացատրում է, թե ինչպես է կախված փոփոխականների արձագանքը տատանվում անկախ փոփոխականին: Մեր դեպքում արժեքը 0.574 է (մոտավորապես), որը կարող է մեկնաբանվել որպես փոփոխականների միջև ողջամտորեն նորմալ հարաբերություն:
Ճշգրտված R-Squared
Սա պարզապես R քառակուսի արժեքի այլընտրանքային տարբերակ: Սա պարզապես խառնում է կանխատեսիչ փոփոխականները` կանխատեսելով պատասխան փոփոխականը: Այն հաշվարկվում է որպես
R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]
Ահա, R^2 . R^2 արժեքը, որը մենք ստացել ենքտվյալների բազան.
n ՝ դիտումների քանակը։
K ՝ կանխատեսող փոփոխականների թիվը։
Նշանակությունը այս արժեքն առաջանում է երկու կանխատեսիչ փոփոխականների միջև ռեգրեսիոն վերլուծություն կատարելիս: Եթե տվյալների հավաքածուում կա մեկից ավելի կանխատեսիչ փոփոխական, ապա R քառակուսի արժեքը կուռճացվի, ինչը խիստ անցանկալի է: Ճշգրտված R քառակուսի արժեքը ճշգրտում է այս գնաճը և տալիս է փոփոխականների ճշգրիտ պատկերը:
Ստանդարտ սխալ
Մի այլ պիտանիության չափիչ դա ցույց է տալիս ձեր ռեգրեսիոն վերլուծության ճշգրտությունը. որքան ցածր է արժեքը, այնքան ավելի վստահ կարող եք լինել ձեր ռեգրեսիոն վերլուծության մեջ:
Ստանդարտ սխալ էմպիրիկ չափիչ է, որը ներկայացնում է միջին հեռավորությունը, որով կետերը շեղվում են միտումի գծից: Ի հակադրություն, R2 ներկայացնում է կախված փոփոխականի տատանումների համամասնությունը: Այս դեպքում Ստանդարտ սխալ արժեքը 288,9 է ( մոտ ), ինչը նշանակում է, որ մեր տվյալների կետերը միջինում 288,9-ով իջնում են միտումի գծից:
Դիտարկումներ
Նշեք դիտարկումների կամ գրառումների քանակը:
Որոշեք նշանակալի փոփոխական
Նշանակության արժեքը ցույց է տալիս մեր վերլուծության վստահելիությունը (վիճակագրորեն հիմնավոր): Այլ կերպ ասած, դա նշանակում է մեր տվյալների հավաքածուի սխալ լինելու հավանականությունը: Այս արժեքը պետք է լինի 5%-ից ցածր: Բայց այս դեպքում մեր նշանակալի արժեքը 0,00117 է,ինչը թարգմանաբար նշանակում է 0,1%, ինչը շատ ցածր է 5%-ից: Այսպիսով, մեր վերլուծությունը լավ է: Հակառակ դեպքում, մենք կարող ենք ստիպված լինել ընտրել տարբեր փոփոխականներ մեր վերլուծության համար:
P-արժեքը ռեգրեսիոն վերլուծության մեջ
սերտորեն կապված է նշանակալի արժեքի հետ, P- արժեքը նշանակում է գործակցի արժեքի սխալ լինելու հավանականությունը: P-արժեքը նշանակում է զրոյական վարկածի կապը փոփոխականների հետ:
Եթե ձեր p-արժեքը < Նշանակության համարը, կան բավարար ապացույցներ՝ մերժելու զրոյական արժեքի վարկածը: Սա նշանակում է, որ փոփոխականների միջև գոյություն ունի ոչ զրոյական հարաբերակցություն:
Բայց եթե p-արժեքը > Նշանակություն արժեքը, ապա բավարար ապացույցներ չեն լինի` մերժելու համար: զրոյական վարկած. Դա նշանակում է, որ փոփոխականների միջև փոխկապակցվածություն չի կարող լինել:
Այն դեպքում, P-արժեքը փոփոխականի Գին =0,000948 < 0.00117 (նշանակության արժեք),
Այսպիսով, այստեղ ոչ մի զրոյական վարկած չկա, և կան բավարար ապացույցներ փոփոխականների միջև հարաբերակցություն հայտարարելու համար:
Մյուս կողմից, <1 փոփոխականի համար>Վաճառված է , (P-արժեքը) 0,0038515 < 0.0011723 (նշանակության արժեք)
Այսպիսով, այստեղ կարող է լինել զրոյական վարկած, և բավարար ապացույցներ չկան փոփոխականների միջև ոչ զրոյական հարաբերակցություն հայտարարելու համար:
Շատ դեպքերում այս P-ն -արժեքը որոշում է՝ փոփոխականը կլինի տվյալների բազայում, թե ոչ: Օրինակ, մենք պետք է հեռացնենք Վաճառված -ըփոփոխական՝ տվյալների բազայի կայունությունը պահպանելու համար:
Ռեգրեսիոն հավասարում
Քանի որ մենք որոշում ենք գծային ռեգրեսիայի վերլուծությունը Excel-ում, միտումի գիծը նույնպես պետք է լինի գծային: Ընդհանուր ձևը հետևյալն է՝
Y=mX+C։
Այստեղ Y կախված փոփոխականն է։
Եվ X-ն այստեղ անկախ փոփոխական է, ինչը նշանակում է, որ մենք կորոշենք x փոփոխականի փոփոխության ազդեցությունը Y փոփոխականի վրա:
C պարզապես կլինի Y-առանցքի հատման արժեքը: տող:
Այս դեպքում C հատման արժեքը հավասար է 9502.109853
Իսկ երկու փոփոխականների համար m-ի արժեքը -809.265 և 0.424818 է:
0>Այսպիսով, մենք ունենք երկու առանձին փոփոխականների վերջնական հավասարումը:
Առաջինը հետևյալն է.
Y=-809.265771X+9502.12Իսկ երկրորդ փոփոխականի հավասարումը հետևյալն է.
Y=0.4248X+9502.12Գործակիցներ
Մեր ստացած գործակիցներն են m1=-809.2655 և m2=04248 : Եվ ընդհատիչ, C= 9502.12 ։
- Նախ, ընդհատիչի արժեքը ցույց է տալիս, որ պահանջարկը կլինի 9502, երբ գինը զրոյական է։
- Իսկ արժեքները m նշանակում է գնի փոփոխության մեկ միավորի դիմաց պահանջարկի փոփոխության տեմպը: Գնի գործակցի արժեքը -809.265 է, ինչը ցույց է տալիս, որ մեկ միավորի գնի աճը կնվազեցնի պահանջարկը մոտավորապես 809 միավորով:
- Երկրորդ փոփոխականի՝ Վաճառվածի համար, m արժեքը 0.424 է: Սա նշանակում է, որ վաճառված միավորի հաշվով փոփոխությունըկհանգեցնի արտադրանքի միավորի 0424 անգամ ավելացմանը:
Մնացորդներ
Մնացորդային տարբերությունը բնօրինակի և հաշվարկվածի միջև: ռեգրեսիայի գծից մուտքը տարբերությունն է: Մնացորդները ցույց են տալիս, թե որքան հեռու է իրական արժեքը տողից: Օրինակ, ռեգրեսիոն վերլուծությունից հաշվարկված մուտքը առաջին մուտքի համար 9497 է: Իսկ առաջին սկզբնական արժեքը 9500 է: Այսպիսով, մնացորդը մոտ 2,109 է:
T-վիճակագրական արժեքը
T-statics արժեքը գործակիցի բաժանումն է ստանդարտ արժեքի: Որքան մեծ է արժեքը, այնքան ավելի լավ է վկայում գործակիցի հուսալիությունը:
Այս արժեքի մեկ այլ նշանակություն կա, որը պահանջվում է P-արժեքը հաշվարկելու համար:
95% վստահության միջակայքը
Ահա փոփոխականի վստահությունը, որը մենք սկզբում սահմանել ենք 95: Այնուամենայնիվ, այն կարող է փոխվել:
- Այստեղ ստորին 95%-ի գործակցի արժեքը հաշվարկվում է որպես 8496.84 նշանակում է, որ վերին 95%-ը հաշվարկվում է որպես 10507.37,
- Սա նշանակում է, որ մինչ մեր հիմնական գործակիցը մոտ է, 9502.1: Մեծ հավանականություն կա, որ արժեքը կարող է լինել 8496-ից ցածր դեպքերի 95%-ի համար և 5% հավանականություն, որ այն լինի ավելի քան 10507.37
Կարդալ ավելին.
Հիշելու բաներ
✎ Ռեգեսիոն վերլուծության մեթոդը գնահատում է բացառապես ուսումնասիրվող փոփոխականների միջև կապը: Պատճառահետեւանքային կապ չի հաստատում: Այլ կերպ՝ միայն ասպեկտըհարաբերակցությունը համարում է. Երբ ինչ-որ գործողություն ինչ-որ բան է առաջացնում, այն դառնում է պատճառահետևանք: Երբ մեկ փոփոխականի փոփոխությունը փոփոխություններ է առաջացնում, այն կարելի է համարել պատճառահետևանք:
✎ Ռեգրեսիոն վերլուծությունը մեծապես խոչընդոտում է արտաքուստ ցուցանիշներին: Նախքան վերլուծությունը կատարելը պետք է հեռացվեն բոլոր տեսակի արտանետումները: Excel-ում ռեգրեսիոն վերլուծության արդյունքները վերլուծելու և մեկնաբանելու համար դուք պետք է հաշվի առնեք այս կետերը:
Եզրակացություն
Ամփոփելու համար «Ինչպես մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում» հարցին տրված է մանրամասն պատասխան. վերլուծելով և հետագայում մեկնաբանելով այն: Վերլուծությունը կատարվում է Տվյալների վերլուծություն գործիքի միջոցով Տվյալներ ներդիրում:
Այս խնդրի համար հասանելի է աշխատանքային գրքույկ ներբեռնման համար, որտեղ կարող եք կիրառել ռեգրեսիոն վերլուծություն և մեկնաբանել: այն:
Ազատորեն տրամադրեք ցանկացած հարց կամ կարծիք մեկնաբանությունների բաժնի միջոցով: Exceldemy համայնքի բարելավմանն ուղղված ցանկացած առաջարկ շատ գնահատելի կլինի: