Како протумачити резултате регресије у Екцел-у (детаљна анализа)

Hugh West

Регресиона анализа је у скоро сваком типу статистичког софтвера као што је СПСС , Р, а да не спомињемо Екцел. Регресија нам може дати ширу слику о односима између варијабли. Линеарна регресија се може урадити прилично брзо у Екцел-у помоћу алата Анализа података . Овај чланак ће показати како можете тумачити резултате регресије у Екцел-у.

Преузмите радну свеску за вежбање

Преузмите ову радну свеску за вежбање испод.

Интерпрет Регрессион Ресултс.клск

Шта је регресија?

Регресиона анализа се често користи у анализи података да би се утврдиле везе између више варијабли. Регресиона анализа вам омогућава да изаберете шта ће се десити са зависном променљивом ако се једна од независних променљивих промени. Такође вам омогућава да математички утврдите које независне варијабле имају утицај.

Проста линеарна регресија се разликује од вишеструке линеарне регресије у статистици. Користећи линеарну функцију, једноставна линеарна регресија анализира повезаност између променљивих и једне независне променљиве. Вишеструка линеарна регресија је када се за одређивање варијабли користе два или више фактора објашњења. Коришћење нелинеарне регресије уместо зависне променљиве је описано као нелинеарна функција пошто односи података нису линеарни. Овај чланак ће се концентрисати на више линеарнихрегресија да бисте демонстрирали како можете да тумачите резултате регресије у Екцел-у.

Кораци за обављање регресије у Екцел-у

За потребе регресије, користићемо доњи скуп података за сврхе анализе. Овде ће независна променљива бити колона Цена и колона Продато . Колона независна биће колона Потреба .

Кораци

  • Морамо да одемо на картицу Подаци и кликнемо на Анализа података да извршимо регресију .

  • Појавиће се нови прозор; изаберите опсег података зависне променљиве и независне променљиве.
  • Затим означите поље Ознаке и поље Поуздање .
  • Затим кликните на опсег излазних ћелија поље да бисте изабрали адресу излазне ћелије
  • Даље, означите Резидуално да бисте израчунали остатке.
  • Након тога, означите Резидуално графиконе и Лине Фит Плотс бокес
  • Кликните на ОК након овога.

  • Након што кликнете ОК, примарни излазни параметри анализе ће бити у наведеним ћелијама.

  • Тада ћете такође добити неке параметре као што је вредност Значајност итд. у табели АНОВА ( Анализа варијансе ).
  • Овде, дф означава степен слободе везан за извор варијансе.
  • СС означава збир квадрата. Ваш модел ће боље одражавати податке ако Преостали СС је мањи од Укупног СС.
  • МС значи квадрат.
  • Ф означава Ф -тест за нулту хипотезу.
  • Значајност Ф означава П -вредност Ф .

  • Тада ћете такође добити коефицијенте променљиве, вредност значаја итд у табели.

  • Тада ћете добити коначну табелу испод табеле коефицијената која садржи преосталу вредност за сваки унос.

  • Затим ћете добити регресијски графикон Потражња вс Цена , са линијом тренда.

  • Након ово, добијате регресијски графикон Потражња наспрам Продато са линијом тренда.

  • Постоји још један графикон који приказује дистрибуцију остатака сваког уноса из варијабле Продато .

  • Постоји још један графикон који приказује дистрибуцију остатака сваког уноса из променљиве Цена .

Следеће ћемо вам показати како можете н тумачите ове резултате регресије у Екцел-у.

Прочитајте више: Како направити логистичку регресију у Екцел-у (са брзим корацима)

Како тумачити Резултати регресије у Екцел-у

Следећа ствар коју треба да урадите након што урадите регресиону анализу и протумачите их. Исходи су описани и разрађени у наставку.

Анализа вредности вишеструке регресије Р-квадрата

Број Р-квадрат показује колико су блиско елементи скупа података повезани и колико добро линија регресије одговара подацима. Користићемо анализу вишеструке линеарне регресије, у којој ћемо одредити утицај две или више варијабли на главни фактор. Ово се односи на то како се зависна променљива мења како се мења једна од независних варијабли. Опсег овог коефицијента је од -1 до 1. Овде,

  • 1 значи блиску позитивну везу
  • 0 значи да нема веза међу варијаблама. Другим речима, тачке података су насумичне.
  • -1 означава инверзну или негативну везу између променљивих.

У излазним резултатима приказаним изнад, вишеструка Р-вредност дате скуп података је о.7578( приближно ), што указује на јаке односе између варијабли.

Р на квадрат

Р на квадрат вредност објашњава како одговор зависних варијабли варира на независну променљиву. У нашем случају, вредност је 0,574 (приближно), што се може протумачити као разумно у реду однос између варијабли.

Прилагођени Р-квадрат

Ово је само алтернативна верзија вредности Р на квадрат . Ово једноставно меша променљиве предиктора док предвиђа променљиву респонсе . Рачуна се као

Р^2 = 1 – [(1-Р^2)*(н-1)/(н-к-1)]

Овде, Р^2 : вредност Р^2 коју смо добили одскуп података.

н : број запажања.

К : број предикторских варијабли.

Значај ове вредности настаје док се ради регресиона анализа између две променљиве предиктор . Ако постоји више од једне променљиве предиктор у скупу података, онда ће вредност Р на квадрат бити надувана, што је веома непожељно. Прилагођена вредност Р на квадрат прилагођава ову инфлацију и даје тачну слику варијабли.

Стандардна грешка

Још једна метрика доброг уклапања то указује на тачност ваше регресионе анализе; што је нижа вредност, то можете бити сигурнији у своју регресиону анализу.

Стандардна грешка је емпиријска метрика која представља просечну удаљеност на којој тачке одступају од линије тренда. Насупрот томе, Р2 представља пропорцију варијације зависне променљиве. У овом случају, вредност Стандард Еррор је 288,9 ( приближно ), што означава да наши подаци у просеку падају за 288,9 од линије тренда.

Запажања

Означите број запажања или уноса.

Одредите значајну променљиву

Вредност Вредност значаја указује на веродостојност (статистички исправну) наше анализе. Другим речима, означава вероватноћу да је наш скуп података погрешан. Ова вредност треба да буде испод 5%. Али у овом случају, наша вредност значаја је  0,00117,што је у преводу 0,1%, што је знатно испод 5%. Дакле, наша анализа је у реду. У супротном, можда ћемо морати да изаберемо различите варијабле за нашу анализу.

П-вредност у регресионој анализи

Уско повезана са значајном вредношћу, П- вредност означава вероватноћу да је вредност коефицијента погрешна. П-вредност означава повезаност нулте хипотезе са променљивим.

Ако ваша п-вредност &лт; број Значајност , постоји довољно доказа да се одбаци хипотеза нулте вредности. То значи да између варијабли постоји корелација различита од нуле.

Али ако је вредност п-вредност &гт; Значајност , неће бити довољно доказа да се одбаци нулта хипотеза. То означава да не може постојати корелација између променљивих.

У или случају, П-вредност променљиве Цена =0,000948 &лт; 0,00117 (вредност значајности),

Дакле, не постоји нулта хипотеза овде, и постоји довољно доказа да се прогласи корелација између варијабли.

С друге стране, за променљиву Продато , (П-вредност) 0,0038515 &лт; 0,0011723 (Вредност значајности)

Дакле, овде би могла да постоји нулта хипотеза, а нема довољно доказа да се прогласи ненулта корелација између варијабли.

У већини случајева, ово П -валуе одређује да ли ће променљива бити у скупу података или не. На пример, требало би да уклонимо Продато променљива да би се сачувала робусност скупа података.

Регресиона једначина

Како одређујемо линеарну регресиону анализу у Екцел-у, линија тренда такође треба да буде линеарна. Општи облик је:

И=мКс+Ц.

Овде је И зависна променљива.

И Кс је независна променљива овде, што значи да ћемо одредити ефекат промене променљиве к на променљиву И.

Ц ће бити само вредност пресека И-осе линија.

У овом случају, вредност Ц  пресека је једнака 9502,109853

А вредност м за две променљиве је -809,265 и 0,424818.

Дакле, имамо коначну једначину за две одвојене варијабле.

Прва је:

И=-809.265771Кс+9502.12

А једначина за другу променљиву је:

И=0,4248Кс+9502,12

Коефицијенти

Коефицијенти које смо добили су м1=-809,2655 и м2=04248 . И пресретач, Ц= 9502.12 .

  • Прво, вредност пресретача указује да ће потражња бити 9502 када је цена нула.
  • И вредности м означава стопу по којој се тражња мења по јединици промене цене. Вредност коефицијента цене је -809,265, што указује да ће повећање цене по јединици смањити потражњу за отприлике 809 јединица.
  • За другу променљиву, Продато, вредност м је 0,424. Ово означава да је промена по јединици продате ставкеће резултирати повећањем производа за 0424 пута у јединици.

Преостали

Разлика Преостали између оригиналне и израчунате унос са линије регресије је разлика. Резидуали показују колико је стварна вредност удаљена од линије. На пример, израчунати унос из регресионе анализе за први унос је 9497. А прва оригинална вредност је 9500. Дакле, остатак је око 2.109.

Т-Статистичка вредност

Т-статичка вредност је дељење коефицијента стандардном вредношћу. Што је већа вредност, то указује на бољу поузданост коефицијента.

Постоји још један значај ове вредности, који је потребан за израчунавање П-вредности.

Интервал поузданости од 95%

Овде је поузданост променљиве коју смо поставили као 95 на почетку. Међутим, може се променити.

  • Овде се вредност коефицијента доњих 95% израчунава као 8496,84 значи да је горњих 95% израчунато као 10507,37,
  • То значи да док наше главни коефицијент је око, 9502.1.постоји велика шанса да вредност може бити испод 8496 за 95% случајева и 5% шансе да буде преко 10507,37

Прочитајте више:

Ствари које треба запамтити

Метода регресионе анализе искључиво процењује однос између варијабли које се испитују. Не утврђује узрочност. На друге начине, само аспекткорелације сматра. Када неки чин проузрокује нешто, то постаје узрочност. Када измена једне варијабле ствара промене, то се може сматрати узрочно-последичном.

Регресиона анализа у великој мери отежава ванредне вредности. Све врсте одступања морају бити уклоњене пре него што се уради анализа. Да бисте анализирали и интерпретирали резултате регресионе анализе у Екцел-у, потребно је да узмете у обзир ове тачке.

Закључак

Да сумирамо, на питање „како тумачити резултате регресије у Екцел-у“ је детаљно објашњен одговор анализирајући га и касније тумачећи. Анализа се врши помоћу алатке Анализа података на картици Подаци .

За овај проблем, радна свеска је доступна за преузимање у којој можете вежбати регресиону анализу и тумачити ит.

Слободно постављајте питања или повратне информације у одељку за коментаре. Свака сугестија за побољшање заједнице Екцелдеми биће веома цењена.

Хју Вест је веома искусан Екцел тренер и аналитичар са више од 10 година искуства у индустрији. Дипломирао је рачуноводство и финансије и магистрирао пословну администрацију. Хју има страст према подучавању и развио је јединствен приступ подучавању који је лако пратити и разумети. Његово стручно знање о Екцел-у помогло је хиљадама студената и професионалаца широм света да унапреде своје вештине и постану успешни у каријери. Кроз свој блог, Хју дели своје знање са светом, нудећи бесплатне Екцел туторијале и онлајн обуку како би помогли појединцима и предузећима да остваре свој пуни потенцијал.