Како да се толкуваат резултатите од регресијата во Excel (детална анализа)

  • Споделете Го Ова
Hugh West

Регресивната анализа е во речиси секој тип на статистички софтвер како SPSS , R, а да не зборуваме за Excel. Регресијата може да ни ја даде големата слика за односите помеѓу променливите. Линеарната регресија може да се направи прилично брзо во Excel со помош на алатката Анализа на податоци . Оваа статија ќе покаже како можете да ги толкувате резултатите од регресијата во Excel.

Преземете ја работната книга за вежбање

Преземете ја оваа работна книга за вежбање подолу.

Интерпретирај ги резултатите од регресијата.xlsx

Што е регресија?

Регресивната анализа често се користи во анализата на податоците за да се одредат асоцијациите меѓу повеќе променливи. Регресивната анализа ви овозможува да изберете што ќе се случи со зависната променлива ако една од независните променливи се смени. Исто така, ви овозможува математички да откриете кои независни променливи имаат влијание.

Едноставната линеарна регресија се разликува од повеќекратна линеарна регресија во статистиката. Со помош на линеарна функција, едноставна линеарна регресија ја анализира поврзаноста помеѓу променливите и една независна променлива. Повеќекратна линеарна регресија е кога се користат два или повеќе објаснувачки фактори за одредување на променливите. Користењето на нелинеарна регресија наместо зависната променлива е опишано како нелинеарна функција бидејќи податочните односи не се линеарни. Оваа статија ќе се концентрира на повеќе линеарнирегресија за да покажете како можете да ги толкувате резултатите од регресијата во Excel.

Чекори за да направите регресија во Excel

За цели на регресија, ќе ја користиме долунаведената база на податоци за цели на анализа. Овде независната променлива ќе биде колоната Цена и колоната Продадена . Колоната независна ќе биде колоната Demand .

Чекори

  • Треба да одиме во картичката Податоци и да кликнете на Анализа на податоци за да извршиме регресија .

  • Ќе има нов прозорец; изберете ја зависната променлива и опсегот на податоци за независна променлива.
  • Потоа штиклирајте го полето Етикети и полето Доверба .
  • Потоа кликнете на опсегот на излезните ќелии полето за да ја изберете адресата на излезната ќелија
  • Следно, штиклирајте на Residual за да ги пресметате преостанатите.
  • Потоа, штиклирајте ги парцелите Residual и Кортии Line Fit Plots
  • Кликнете OK по ова.

  • Откако ќе кликнете Во ред, примарните излезни параметри на анализата ќе бидат во наведените ќелии.

  • Потоа ќе добиете и некои параметри како што е Значење вредност итн во табелата ANOVA ( Анализа на варијанса ).
  • Тука, df го означува степен на слобода поврзан со изворот на варијанса.
  • SS означува збир на квадрати. Вашиот модел подобро ќе ги одразува податоците ако Преостанатиот SS е помал од Вкупниот SS.
  • MS значи квадрат.
  • F го означува F -тестот за нултата хипотеза.
  • Значењето F ја означува P -вредноста на F .

  • Потоа ќе ги добиете и коефициентите на променливата, значајната вредност итн. во табела.

  • Потоа ќе добиете конечна табела под табелата со коефициенти која ја содржи преостанатата вредност за секој запис. Следно, ќе го добиете графиконот за регресија Побарувачка наспроти Цена , со линија на тренд.

  • По ова, го добивате графиконот за регресија Побарувачка наспроти Продадена со линија на тренд.

  • Има уште една графикон кој ја прикажува распределбата на остатоците од секој запис од променливата Продадено .

  • Постои уште еден графикон што ја прикажува распределбата на остатоците на секој запис од променливата Цена .

Следно, ќе ви покажеме како можете да n интерпретирај ги овие резултати од регресија во Excel.

Прочитај повеќе: Како да се направи логистичка регресија во Excel (со брзи чекори)

Како да се толкува Резултати од регресија во Excel

Следното нешто што треба да го направите откако ќе ја направите регресиската анализа и ќе ги интерпретирате. Резултатите се опишани и елаборирани подолу.

Повеќекратна R-квадратна регресивна анализа на вредност

НаБројот R-квадрат покажува колку тесно се поврзани елементите на датата на податоци и колку добро регресиската линија се совпаѓа со податоците. Ќе ја користиме повеќекратната линеарна регресивна анализа, во која ќе го одредиме влијанието на две или повеќе променливи врз главниот фактор. Ова се однесува на тоа како се менува зависната променлива како што се менува една од независните променливи. Опсегот на овој коефициент е од -1 до 1. Овде,

  • 1 значи блиска позитивна врска
  • 0 значи дека нема врски меѓу променливите. Со други зборови, точките на податоци се случајни.
  • -1 значи инверзна или негативна врска меѓу променливите.

Во излезните резултати прикажани погоре, повеќекратната R-вредност на дадената множества на податоци е o.7578 ( приближно ), што укажува на силни односи помеѓу променливите.

R квадрат

R квадрат вредноста објаснува како одговорот на зависните променливи варира на независната променлива. Во нашиот случај, вредноста е 0,574 (приближно), што може да се толкува како разумно во ред однос помеѓу променливите.

Прилагоден R-Squared

Ова е само алтернативна верзија на вредноста R квадрат . Ова едноставно ги меша предвидливите променливи додека ја предвидува променливата одговор . Се пресметува како

R^2 = 1 - [(1-R^2)*(n-1)/(n-k-1)]

Овде, R^2 : вредноста R^2 што ја добивме одбазата на податоци.

n : бројот на набљудувања.

K : бројот на предвидувачките променливи.

Значењето од оваа вредност произлегува додека се прави регресивна анализа помеѓу две предвидливи променливи. Ако има повеќе од една предвидлива променлива во базата на податоци, тогаш квадратната вредност на R ќе се надува, што е крајно непожелно. Приспособената вредност R квадрат ја приспособува оваа инфлација и дава точна слика за променливите.

Стандардна грешка

Друга метрика за добросостојба тоа укажува на точноста на вашата регресивна анализа; колку е помала вредноста, толку повеќе можете да бидете сигурни во вашата регресивна анализа.

Стандардна грешка е емпириска метрика што го претставува просечното растојание што точките отстапуваат од линијата на трендот. Спротивно на тоа, R2 го претставува делот на варијацијата на зависната променлива. Во овој случај, вредноста на Стандардна грешка е 288,9 ( приближно ), што означува дека нашите точки на податоци, во просек, паѓаат 288,9 од линијата на трендот.

Набљудувања

Наведете го бројот на набљудувања или записи.

Определи значајна променлива

значајна вредност укажува на веродостојноста (статистички издржана) на нашата анализа. Со други зборови, ја означува веројатноста нашата база на податоци да биде погрешна. Оваа вредност треба да биде под 5%. Но, во овој случај, нашата значајна вредност е 0,00117,што во превод значи 0,1%, што е далеку под 5%. Значи нашата анализа е во ред. Во спротивно, можеби ќе треба да избереме различни променливи за нашата анализа.

P-вредност во регресионата анализа

Тесно поврзана со значајна вредност, P- вредност ја означува веројатноста вредноста на коефициентот да биде погрешна. P-вредноста ја означува поврзаноста на нултата хипотеза со променливите.

Ако вашата p-вредност < бројот Значење , има доволно докази за да се отфрли хипотезата за нулта вредност. Ова значи дека постои ненулта корелација помеѓу променливите.

Но, ако p-вредноста > Значењето вредноста, нема да има доволно докази за да се отфрли нулта хипотеза. Тоа означува дека не може да има корелација помеѓу променливите.

Во или случај, P-вредноста на променливата Цена =0,000948 < 0,00117 (значајна вредност),

Значи, тука нема нулта хипотеза и има доволно докази за да се прогласи корелација помеѓу променливите.

Од друга страна, за променливата Продадено , (P-вредност) 0,0038515 < 0,0011723 (Значајна вредност)

Значи, овде може да постои нулта хипотеза и нема доволно докази за да се прогласи ненулта корелација помеѓу променливите.

Во повеќето случаи, ова П -value одредува дали променливата ќе биде во базата на податоци или не. На пример, треба да го отстраниме Продаденото променлива за зачувување на робусноста на сетот.

Регресивна равенка

Како што ја одредуваме линеарната регресивна анализа во Excel, линијата на трендот исто така треба да биде линеарна. Општата форма е:

Y=mX+C.

Тука, Y е зависната променлива.

И X е независна променлива овде, што значи дека ќе го одредиме ефектот од промената на променливата x на променливата Y.

C само ќе биде вредноста на пресекот на Y-оската на линија.

Во овој случај, вредноста на пресекот C е еднаква на 9502.109853

А вредноста на m за двете променливи е -809.265 и 0.424818.

0>Значи, ја имаме конечната равенка за двете посебни променливи.

Првата е:

Y=-809.265771X+9502.12

А равенката за втората променлива е:

Y=0,4248X+9502,12

Коефициенти

Коефициентите што ги добивме се m1=-809,2655 и m2=04248 . И пресретнувач, C= 9502,12 .

  • Прво, вредноста на пресретнувачот покажува дека побарувачката ќе биде 9502 кога цената е нула.
  • И вредностите на m ја означува стапката со која побарувачката се менува по единица промена на цената. Вредноста на коефициентот на цената е -809,265, што покажува дека зголемувањето на цената по единица ќе ја намали побарувачката за приближно 809 единици.
  • За втората променлива, Продадено, вредноста m е 0,424. Ова означува дека промената по единица продадена ставкаќе резултира со 0424-временска единица зголемување на производот.

Остатоци

Преостанатата разликата помеѓу оригиналот и пресметаниот влез од линијата на регресија е разликата. Остатоците покажуваат колку е оддалечена вистинската вредност од линијата. На пример, пресметаниот запис од регресивната анализа за првиот запис е 9497. А првата оригинална вредност е 9500. Значи, преостанатиот е околу 2,109.

Вредност на Т-статистичката вредност

Вредноста на Т-статиката е делење на коефициентот со стандардната вредност. Колку е поголема вредноста, толку покажува подобра веродостојност на коефициентот.

Постои уште едно значење на оваа вредност, кое е потребно за пресметување на P-вредноста.

95% интервал на доверба

Овде довербата на променливата ја поставивме како 95 на почетокот. Сепак, може да се промени.

  • Овде, вредноста на коефициентот на долните 95% се пресметува како 8496,84 значи дека горните 95% се пресметуваат како 10507,37,
  • Ова значи дека додека нашиот главниот коефициент е околу, 9502,1. постои голема шанса вредноста да биде под 8496 за 95% од случаите и 5% шанси да биде над 10507,37

Прочитај повеќе:

Работи што треба да се запаметат

Методот на регресивна анализа единствено ја проценува врската помеѓу променливите што се испитуваат. Не воспоставува причинско-последична врска. На други начини, само аспектотна корелација смета. Кога некое дело предизвикува нешто, тоа станува каузалност. Кога промената на една променлива создава промени, таа може да се смета за причинско-последична врска.

Анализата на регресија во голема мера го попречува надворешното. Сите видови на оддалеченост мора да се отстранат пред да се направи анализата. За да ги анализирате и интерпретирате резултатите од регресиската анализа во Excel, треба да ги земете предвид овие точки.

Заклучок

Да се ​​сумира, на прашањето „како да се интерпретираат резултатите од регресијата во Excel“ е одговорено детално анализирајќи го и подоцна толкувајќи го. Анализата се врши преку алатката Анализа на податоци во табулаторот Податоци .

За овој проблем, достапна е работна книга за преземање каде што можете да вежбате регресивна анализа и толкување тоа.

Слободно поставувајте какви било прашања или повратни информации преку делот за коментари. Секој предлог за подобрување на заедницата Exceldemy ќе биде многу ценет.

Хју Вест е високо искусен тренер и аналитичар на Excel со повеќе од 10 години искуство во индустријата. Има диплома за сметководство и финансии и магистер по бизнис администрација. Хју има страст за предавање и има развиено уникатен пристап на наставата кој е лесен за следење и разбирање. Неговото стручно познавање на Excel им помогна на илјадници студенти и професионалци ширум светот да ги подобрат своите вештини и да се истакнат во нивните кариери. Преку својот блог, Хју го споделува своето знаење со светот, нудејќи бесплатни упатства за Excel и онлајн обука за да им помогне на поединците и бизнисите да го достигнат својот целосен потенцијал.