Ինչպես մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում (մանրամասն վերլուծություն)

Hugh West

Ռեգրեսիոն վերլուծությունը կա գրեթե բոլոր տեսակի վիճակագրական ծրագրերում, ինչպիսիք են SPSS , R, և էլ չասած Excel-ում: Ռեգրեսիան կարող է մեզ տալ մեծ պատկեր փոփոխականների միջև փոխհարաբերությունների վերաբերյալ: Գծային ռեգրեսիան կարելի է բավականին արագ կատարել Excel-ում՝ օգտագործելով Տվյալների վերլուծություն գործիքը: Այս հոդվածը ցույց կտա, թե ինչպես կարող եք մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում:

Ներբեռնել Practice Workbook

Ներբեռնեք այս գործնական աշխատանքային գիրքը ստորև:

Մեկնաբանել ռեգրեսիայի արդյունքները.xlsx

Ի՞նչ է ռեգրեսիան:

Տվյալների վերլուծության մեջ ռեգրեսիոն վերլուծությունը հաճախ օգտագործվում է բազմաթիվ փոփոխականների միջև կապերը որոշելու համար: Ռեգրեսիոն վերլուծությունը թույլ է տալիս ընտրել, թե ինչ կլինի կախված փոփոխականի հետ, եթե անկախ փոփոխականներից մեկը փոխվի: Այն նաև թույլ է տալիս մաթեմատիկորեն պարզել, թե որ անկախ փոփոխականներն են ազդում:

Պարզ գծային ռեգրեսիան տարբերվում է բազմակի գծային ռեգրեսիայից վիճակագրության մեջ: Օգտագործելով գծային ֆունկցիա՝ պարզ գծային ռեգրեսիոն վերլուծում է փոփոխականների և մեկ անկախ փոփոխականի միջև կապը: Բազմակի գծային ռեգրեսիա այն է, երբ փոփոխականները որոշելու համար օգտագործվում են երկու կամ ավելի բացատրական գործոններ: Կախված փոփոխականի փոխարեն ոչ գծային ռեգրեսիայի օգտագործումը նկարագրվում է որպես ոչ գծային ֆունկցիա, քանի որ տվյալների հարաբերությունները գծային չեն: Այս հոդվածը կկենտրոնանա բազմաթիվ գծերի վրառեգրեսիա ցույց տալու համար, թե ինչպես կարող եք մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում:

Քայլեր Excel-ում ռեգրեսիա կատարելու համար

Ռեգեսիայի նպատակների համար մենք կօգտագործենք ստորև բերված տվյալների բազան վերլուծության նպատակները. Այստեղ անկախ փոփոխականը կլինի Գին սյունակը և Վաճառված սյունակը: անկախ սյունակը կլինի Պահանջարկ սյունակը:

Քայլեր

  • Մենք պետք է գնանք Տվյալներ ներդիր և սեղմենք Տվյալների վերլուծություն ` ռեգրեսիա անելու համար :

  • Կլինի նոր պատուհան; ընտրեք կախված փոփոխականը և անկախ փոփոխականի տվյալների տիրույթը:
  • Այնուհետև նշեք Պիտակներ տուփը և Վստահություն վանդակը:
  • Այնուհետև կտտացրեք ելքային բջիջների տիրույթին: վանդակում ընտրեք ելքային բջիջի հասցեն
  • Հաջորդը, նշեք Մնացորդային մնացորդները հաշվարկելու համար:
  • Դրանից հետո նշեք Մնացորդային գծապատկերները և Line Fit Plots տուփեր
  • Սեղմեք OK Սրանից հետո:

  • Սեղմելուց հետո Լավ, վերլուծության առաջնային ելքային պարամետրերը կլինեն նշված բջիջներում:

  • Այնուհետև դուք նույնպես կստանաք որոշ պարամետրեր ինչպիսին է Նշանակություն արժեքը և այլն ANOVA ( Վարիանսի վերլուծություն ) աղյուսակում:
  • Այստեղ df նշանակում է ազատության աստիճանը՝ կապված շեղումների աղբյուրի հետ:
  • SS նշանակում է քառակուսիների գումարը: Ձեր մոդելը ավելի լավ կարտացոլի տվյալները, եթե Մնացորդային SS-ը փոքր է Ընդամենը SS-ից:
  • MS նշանակում է քառակուսի:
  • F նշանակում է F -թեստը զրոյական վարկածի համար:
  • F նշանակությունը նշանակում է P -արժեքը F :

  • Այնուհետև աղյուսակում կստանաք նաև փոփոխականի գործակիցները, նշանակալի արժեքը և այլն:

  • Այնուհետև դուք կստանաք վերջնական աղյուսակ, որը գտնվում է գործակիցների աղյուսակի տակ, որը պարունակում է յուրաքանչյուր մուտքի մնացորդային արժեքը:

  • Հաջորդը, դուք կստանաք Պահանջարկը ընդդեմ Գինը ռեգեսիոն աղյուսակը` միտումի գծով:

  • Հետո սա, դուք ստանում եք Պահանջարկ ընդդեմ Վաճառված ռեգեսիոն գծապատկերը միտումով:

  • Կա մեկ այլ գծապատկեր, որը ցույց է տալիս Վաճառված փոփոխականից յուրաքանչյուր մուտքի մնացորդների բաշխումը: Գին փոփոխականից յուրաքանչյուր մուտքի համար: n մեկնաբանեք այս ռեգրեսիայի արդյունքները Excel-ում:

Կարդալ ավելին. Ինչպես կատարել լոգիստիկ ռեգրեսիա Excel-ում (արագ քայլերով)

Ինչպես մեկնաբանել Ռեգրեսիայի արդյունքները Excel-ում

Հաջորդ բանը, որ դուք պետք է անեք ռեգրեսիայի վերլուծությունը կատարելուց և դրանք մեկնաբանելուց հետո: Արդյունքները նկարագրված և մշակված են ստորև:

Բազմակի R-քառակուսի ռեգրեսիոն արժեքի վերլուծություն

The R-քառակուսի թիվը ցույց է տալիս, թե որքան սերտորեն կապված են տվյալների բազայի տարրերը և որքանով է ռեգրեսիոն գիծը համապատասխանում տվյալներին: Մենք պատրաստվում ենք օգտագործել բազմակի գծային ռեգրեսիոն վերլուծություն, որտեղ մենք պատրաստվում ենք որոշել երկու կամ ավելի փոփոխականների ազդեցությունը հիմնական գործոնի վրա: Սա վերաբերում է նրան, թե ինչպես է փոխվում կախված փոփոխականը, քանի որ փոխվում է անկախ փոփոխականներից մեկը: Այս գործակցի միջակայքը -1-ից 1 է: Այստեղ

  • 1 նշանակում է սերտ դրական հարաբերություն
  • 0 նշանակում է, որ փոփոխականների միջև հարաբերություններ չկան: Այլ կերպ ասած, տվյալների կետերը պատահական են:
  • -1 նշանակում է փոփոխականների հակադարձ կամ բացասական հարաբերություններ:

Վերևում ցուցադրված ելքային արդյունքներում տրված բազմակի R-արժեքը տվյալների հավաքածուն o.7578 է ( մոտ ), որը ցույց է տալիս փոփոխականների միջև ամուր հարաբերություններ:

R քառակուսի

R քառակուսի արժեքը բացատրում է, թե ինչպես է կախված փոփոխականների արձագանքը տատանվում անկախ փոփոխականին: Մեր դեպքում արժեքը 0.574 է (մոտավորապես), որը կարող է մեկնաբանվել որպես փոփոխականների միջև ողջամտորեն նորմալ հարաբերություն:

Ճշգրտված R-Squared

Սա պարզապես R քառակուսի արժեքի այլընտրանքային տարբերակ: Սա պարզապես խառնում է կանխատեսիչ փոփոխականները` կանխատեսելով պատասխան փոփոխականը: Այն հաշվարկվում է որպես

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

Ահա, R^2 . R^2 արժեքը, որը մենք ստացել ենքտվյալների բազան.

n ՝ դիտումների քանակը։

K ՝ կանխատեսող փոփոխականների թիվը։

Նշանակությունը այս արժեքն առաջանում է երկու կանխատեսիչ փոփոխականների միջև ռեգրեսիոն վերլուծություն կատարելիս: Եթե ​​տվյալների հավաքածուում կա մեկից ավելի կանխատեսիչ փոփոխական, ապա R քառակուսի արժեքը կուռճացվի, ինչը խիստ անցանկալի է: Ճշգրտված R քառակուսի արժեքը ճշգրտում է այս գնաճը և տալիս է փոփոխականների ճշգրիտ պատկերը:

Ստանդարտ սխալ

Մի այլ պիտանիության չափիչ դա ցույց է տալիս ձեր ռեգրեսիոն վերլուծության ճշգրտությունը. որքան ցածր է արժեքը, այնքան ավելի վստահ կարող եք լինել ձեր ռեգրեսիոն վերլուծության մեջ:

Ստանդարտ սխալ էմպիրիկ չափիչ է, որը ներկայացնում է միջին հեռավորությունը, որով կետերը շեղվում են միտումի գծից: Ի հակադրություն, R2 ներկայացնում է կախված փոփոխականի տատանումների համամասնությունը: Այս դեպքում Ստանդարտ սխալ արժեքը 288,9 է ( մոտ ), ինչը նշանակում է, որ մեր տվյալների կետերը միջինում 288,9-ով իջնում ​​են միտումի գծից:

Դիտարկումներ

Նշեք դիտարկումների կամ գրառումների քանակը:

Որոշեք նշանակալի փոփոխական

Նշանակության արժեքը ցույց է տալիս մեր վերլուծության վստահելիությունը (վիճակագրորեն հիմնավոր): Այլ կերպ ասած, դա նշանակում է մեր տվյալների հավաքածուի սխալ լինելու հավանականությունը: Այս արժեքը պետք է լինի 5%-ից ցածր: Բայց այս դեպքում մեր նշանակալի արժեքը  0,00117 է,ինչը թարգմանաբար նշանակում է 0,1%, ինչը շատ ցածր է 5%-ից: Այսպիսով, մեր վերլուծությունը լավ է: Հակառակ դեպքում, մենք կարող ենք ստիպված լինել ընտրել տարբեր փոփոխականներ մեր վերլուծության համար:

P-արժեքը ռեգրեսիոն վերլուծության մեջ

սերտորեն կապված է նշանակալի արժեքի հետ, P- արժեքը նշանակում է գործակցի արժեքի սխալ լինելու հավանականությունը: P-արժեքը նշանակում է զրոյական վարկածի կապը փոփոխականների հետ:

Եթե ձեր p-արժեքը < Նշանակության համարը, կան բավարար ապացույցներ՝ մերժելու զրոյական արժեքի վարկածը: Սա նշանակում է, որ փոփոխականների միջև գոյություն ունի ոչ զրոյական հարաբերակցություն:

Բայց եթե p-արժեքը > Նշանակություն արժեքը, ապա բավարար ապացույցներ չեն լինի` մերժելու համար: զրոյական վարկած. Դա նշանակում է, որ փոփոխականների միջև փոխկապակցվածություն չի կարող լինել:

Այն դեպքում, P-արժեքը փոփոխականի Գին =0,000948 < 0.00117 (նշանակության արժեք),

Այսպիսով, այստեղ ոչ մի զրոյական վարկած չկա, և կան բավարար ապացույցներ փոփոխականների միջև հարաբերակցություն հայտարարելու համար:

Մյուս կողմից, <1 փոփոխականի համար>Վաճառված է , (P-արժեքը) 0,0038515 < 0.0011723 (նշանակության արժեք)

Այսպիսով, այստեղ կարող է լինել զրոյական վարկած, և բավարար ապացույցներ չկան փոփոխականների միջև ոչ զրոյական հարաբերակցություն հայտարարելու համար:

Շատ դեպքերում այս P-ն -արժեքը որոշում է՝ փոփոխականը կլինի տվյալների բազայում, թե ոչ: Օրինակ, մենք պետք է հեռացնենք Վաճառված -ըփոփոխական՝ տվյալների բազայի կայունությունը պահպանելու համար:

Ռեգրեսիոն հավասարում

Քանի որ մենք որոշում ենք գծային ռեգրեսիայի վերլուծությունը Excel-ում, միտումի գիծը նույնպես պետք է լինի գծային: Ընդհանուր ձևը հետևյալն է՝

Y=mX+C։

Այստեղ Y կախված փոփոխականն է։

Եվ X-ն այստեղ անկախ փոփոխական է, ինչը նշանակում է, որ մենք կորոշենք x փոփոխականի փոփոխության ազդեցությունը Y փոփոխականի վրա:

C պարզապես կլինի Y-առանցքի հատման արժեքը: տող:

Այս դեպքում C  հատման արժեքը հավասար է 9502.109853

Իսկ երկու փոփոխականների համար m-ի արժեքը -809.265 և 0.424818 է:

0>Այսպիսով, մենք ունենք երկու առանձին փոփոխականների վերջնական հավասարումը:

Առաջինը հետևյալն է.

Y=-809.265771X+9502.12

Իսկ երկրորդ փոփոխականի հավասարումը հետևյալն է.

Y=0.4248X+9502.12

Գործակիցներ

Մեր ստացած գործակիցներն են m1=-809.2655 և m2=04248 : Եվ ընդհատիչ, C= 9502.12 ։

  • Նախ, ընդհատիչի արժեքը ցույց է տալիս, որ պահանջարկը կլինի 9502, երբ գինը զրոյական է։
  • Իսկ արժեքները m նշանակում է գնի փոփոխության մեկ միավորի դիմաց պահանջարկի փոփոխության տեմպը: Գնի գործակցի արժեքը -809.265 է, ինչը ցույց է տալիս, որ մեկ միավորի գնի աճը կնվազեցնի պահանջարկը մոտավորապես 809 միավորով:
  • Երկրորդ փոփոխականի՝ Վաճառվածի համար, m արժեքը 0.424 է: Սա նշանակում է, որ վաճառված միավորի հաշվով փոփոխությունըկհանգեցնի արտադրանքի միավորի 0424 անգամ ավելացմանը:

Մնացորդներ

Մնացորդային տարբերությունը բնօրինակի և հաշվարկվածի միջև: ռեգրեսիայի գծից մուտքը տարբերությունն է: Մնացորդները ցույց են տալիս, թե որքան հեռու է իրական արժեքը տողից: Օրինակ, ռեգրեսիոն վերլուծությունից հաշվարկված մուտքը առաջին մուտքի համար 9497 է: Իսկ առաջին սկզբնական արժեքը 9500 է: Այսպիսով, մնացորդը մոտ 2,109 է:

T-վիճակագրական արժեքը

T-statics արժեքը գործակիցի բաժանումն է ստանդարտ արժեքի: Որքան մեծ է արժեքը, այնքան ավելի լավ է վկայում գործակիցի հուսալիությունը:

Այս արժեքի մեկ այլ նշանակություն կա, որը պահանջվում է P-արժեքը հաշվարկելու համար:

95% վստահության միջակայքը

Ահա փոփոխականի վստահությունը, որը մենք սկզբում սահմանել ենք 95: Այնուամենայնիվ, այն կարող է փոխվել:

  • Այստեղ ստորին 95%-ի գործակցի արժեքը հաշվարկվում է որպես 8496.84 նշանակում է, որ վերին 95%-ը հաշվարկվում է որպես 10507.37,
  • Սա նշանակում է, որ մինչ մեր հիմնական գործակիցը մոտ է, 9502.1: Մեծ հավանականություն կա, որ արժեքը կարող է լինել 8496-ից ցածր դեպքերի 95%-ի համար և 5% հավանականություն, որ այն լինի ավելի քան 10507.37

Կարդալ ավելին.

Հիշելու բաներ

Ռեգեսիոն վերլուծության մեթոդը գնահատում է բացառապես ուսումնասիրվող փոփոխականների միջև կապը: Պատճառահետեւանքային կապ չի հաստատում: Այլ կերպ՝ միայն ասպեկտըհարաբերակցությունը համարում է. Երբ ինչ-որ գործողություն ինչ-որ բան է առաջացնում, այն դառնում է պատճառահետևանք: Երբ մեկ փոփոխականի փոփոխությունը փոփոխություններ է առաջացնում, այն կարելի է համարել պատճառահետևանք:

Ռեգրեսիոն վերլուծությունը մեծապես խոչընդոտում է արտաքուստ ցուցանիշներին: Նախքան վերլուծությունը կատարելը պետք է հեռացվեն բոլոր տեսակի արտանետումները: Excel-ում ռեգրեսիոն վերլուծության արդյունքները վերլուծելու և մեկնաբանելու համար դուք պետք է հաշվի առնեք այս կետերը:

Եզրակացություն

Ամփոփելու համար «Ինչպես մեկնաբանել ռեգրեսիայի արդյունքները Excel-ում» հարցին տրված է մանրամասն պատասխան. վերլուծելով և հետագայում մեկնաբանելով այն: Վերլուծությունը կատարվում է Տվյալների վերլուծություն գործիքի միջոցով Տվյալներ ներդիրում:

Այս խնդրի համար հասանելի է աշխատանքային գրքույկ ներբեռնման համար, որտեղ կարող եք կիրառել ռեգրեսիոն վերլուծություն և մեկնաբանել: այն:

Ազատորեն տրամադրեք ցանկացած հարց կամ կարծիք մեկնաբանությունների բաժնի միջոցով: Exceldemy համայնքի բարելավմանն ուղղված ցանկացած առաջարկ շատ գնահատելի կլինի:

Հյու Ուեսթը բարձր փորձառու Excel-ի մարզիչ և վերլուծաբան է, որն ունի ավելի քան 10 տարվա փորձ այս ոլորտում: Նա հաշվապահական հաշվառման և ֆինանսների բակալավրի և բիզնեսի կառավարման մագիստրոսի կոչում է ստացել: Հյուը կիրք ունի դասավանդելու նկատմամբ և մշակել է ուսուցման յուրահատուկ մոտեցում, որը հեշտ է հետևել և հասկանալ: Excel-ի նրա փորձագիտական ​​գիտելիքներն օգնել են հազարավոր ուսանողների և մասնագետների ամբողջ աշխարհում բարելավել իրենց հմտությունները և առաջադիմել իրենց կարիերայում: Իր բլոգի միջոցով Հյուն կիսվում է իր գիտելիքներով աշխարհի հետ՝ առաջարկելով Excel-ի անվճար ձեռնարկներ և առցանց ուսուցում, որոնք կօգնեն անհատներին և ձեռնարկություններին հասնել իրենց ողջ ներուժին: