Kiel Interpreti Regresajn Rezultojn en Excel (Detala Analizo)

  • Kundividu Ĉi Tion
Hugh West

Regresanalizo estas en preskaŭ ĉiu speco de statistika programaro kiel SPSS , R, kaj ne mencii Excel. Regreso povas doni al ni la grandan bildon pri rilatoj inter variabloj. Lineara regreso povas esti farita sufiĉe rapide en Excel uzante la ilon Analizo de datumoj . Ĉi tiu artikolo montros kiel vi povas interpreti regresajn rezultojn en Excel.

Elŝutu Praktikan Laborlibron

Elŝutu ĉi tiun praktikan laborlibron sube.

Interpretu Regresajn Rezultojn.xlsx

Kio Estas Regreso?

Regresanalizo estas ofte uzata en datuma analizo por determini la asociojn inter multoblaj variabloj. Regresanalizo permesas vin elekti kio okazas al la dependa variablo se unu el la sendependaj variabloj ŝanĝiĝas. Ĝi ankaŭ permesas al vi eltrovi matematike kiuj sendependaj variabloj havas influon.

Simpla lineara regreso estas aparta de multobla lineara regreso en statistiko. Uzante linearan funkcion, simpla linia regresa analizo la asocio inter la variabloj kaj unu sendependa variablo. Multobla lineara regreso estas kiam du aŭ pli da klarigaj faktoroj estas uzataj por determini la variablojn. Uzi nelinian regreson anstataŭe de la dependa variablo estas priskribita kiel nelinia funkcio ĉar la datenrilatoj ne estas liniaj. Ĉi tiu artikolo koncentriĝos pri multobla liniaroregreso por montri kiel vi povas interpreti regresrezultojn en Excel.

Paŝoj por fari regreson en Excel

Por regresaj celoj, ni uzos la suban datumaron por analizceloj. Ĉi tie la sendependa variablo estos la kolumno Prezo kaj kolumno Vendita . La sendependa kolumno estos la Peto kolumno.

Paŝoj

  • Ni devas iri al la langeto Datumoj kaj alklaki la Datuman analizon por fari regreson .

  • Estos nova fenestro; elektu la dependan variablon kaj sendependan variablo-datuman gamon.
  • Tiam marku la skatolon Etikedoj kaj Fido keston.
  • Tiam alklaku la eligĉelan gamon. skatolo por elekti la eligĉelan adreson
  • Sekve, marku la Restaĵo por kalkuli la restaĵojn.
  • Post tio, marku la Restaĵo intrigojn kaj Kestoj de Line Fit Plots
  • Alklaku OK post tio.

  • Post klako. Bone, la primaraj eligparametroj de la analizo estos ĉe la specifitaj ĉeloj.

  • Tiam vi ankaŭ ricevos kelkajn parametrojn. kiel ekzemple Signifca valoro ktp en la ANOVA ( Analizo de Varianco ) tabelo.
  • Ĉi tie, df indikas la grado de libereco rilata al la fonto de varianco.
  • SS indikas la sumon de kvadratoj. Via modelo reflektos la datumojn pli bone se la Restaĵo SS estas pli malgranda ol la Tuma SS.
  • MS signifas kvadraton.
  • F indikas la F -teston por la nula hipotezo.
  • Signifeco F indikas la P -valoron de F .

  • Tiam vi ankaŭ ricevos la koeficientojn de la variablo, signifovaloron ktp en tabelo.

  • Tiam vi ricevos finan tabelon sub la koeficienta tabelo kiu enhavas la restan valoron por ĉiu eniro.

  • Poste, vi ricevos la regresan diagramon de Posto kontraŭ Prezo , kun tendenco.

  • Post ĉi tio, vi ricevas la Posto vs Vendita regresa diagramo kun tendenclinio.

  • Estas alia diagramo montranta la distribuadon de restaĵoj de ĉiu eniro el la Vendita variablo.

  • Estas alia diagramo montranta la distribuadon de restaĵoj. de ĉiu eniro el la Prezo variablo.

Sekva, ni montros al vi kiel vi povas n interpretu ĉi tiujn regresajn rezultojn en Excel.

Legu Pli: Kiel Fari Loĝistikan Regresion en Excel (kun Rapidaj Paŝoj)

Kiel Interpreti Regresaj rezultoj en Excel

La sekva afero, kiun vi devas fari post fari la regresan analizon kaj interpreti ilin. La rezultoj estas priskribitaj kaj ellaboritaj ĉi-sube.

Multobla R-Kvara Regresa Valora Analizo

La R-kvadrata nombro indikas kiom proksime la elementoj de la datumaro estas rilataj kaj kiom bone la regreslinio kongruas kun la datenoj. Ni uzos la multoblan linearan regresan analizon, en kiu ni determinos la efikon de du aŭ pli da variabloj sur la ĉefa faktoro. Ĉi tio rilatas al kiel la dependa variablo ŝanĝiĝas kiel unu el la sendependaj variabloj ŝanĝiĝas. La gamo de ĉi tiu koeficiento estas de -1 ĝis 1. Ĉi tie,

  • 1 signifas proksiman pozitivan rilaton
  • 0 signifas ke ne ekzistas rilatoj inter variabloj. Alivorte, la datenpunktoj estas hazardaj.
  • -1 signifas inversan aŭ negativan rilaton inter variabloj.

En la eligrezultoj montritaj supre, la multobla R-valoro de la donita. datumserioj estas o.7578( ĉ ), kio indikas fortajn rilatojn inter la variabloj.

R Kvadrata

R kvadrata valoro klarigas kiel la respondo de dependaj variabloj varias al la sendependa variablo. En nia kazo, la valoro estas 0.574 (ĉ.), kiu povas esti interpretita kiel sufiĉe bona rilato inter la variabloj.

Alĝustita R-Kvadrato

Ĉi tio estas nur alterna versio de la R-kvadrata valoro. Ĉi tio simple miksas la prognozajn variablojn dum prognozo de la variablo responda . Ĝi kalkulas kiel

R^2 = 1 – [(1-R^2)*(n-1)/(n-k-1)]

Jen, R^2 : La R^2 valoro de ni ricevisla datumaro.

n : la nombro da observoj.

K : la nombro da prognozaj variabloj.

La signifo de ĉi tiu valoro ekestas dum farado de regresa analizo inter du variabloj antaŭditoriloj . Se estas pli ol unu proditor variablo en la datumaro, tiam la R-kvadrata valoro estos ŝveligita, kio estas tre nedezirinda. La ĝustigita R-kvadrata valoro ĝustigas ĉi tiun inflacion kaj donas precizan bildon de la variabloj.

Norma Eraro

Alia metriko de boneco. tio indikas la precizecon de via regresa analizo; ju pli malalta la valoro, des pli certa vi povas esti en via regresa analizo.

Norma Eraro estas empiria metriko reprezentanta la mezan distancon, kiun la punktoj devias de la tendenco. Kontraste, R2 reprezentas la proporcion de dependa varia variado. En ĉi tiu kazo, la valoro de Norma Eraro estas 288.9 ( ĉirkaŭ ), kio indikas ke niaj datenpunktoj, averaĝe, falas 288.9 de la tendenco.

Observoj

Indiku la nombron da observoj aŭ enskriboj.

Determini Signifan Variablo

La Signifikan valoron indikas la fidindecon (statistike solidan) de nia analizo. Alivorte, ĝi indikas la probablecon de nia datumaro malĝusta. Ĉi tiu valoro devus esti sub 5%. Sed en ĉi tiu kazo, nia signifovaloro estas  0.00117,kiu tradukiĝas al 0,1%, kio estas multe sub la 5%. Do nia analizo estas en ordo. Alie, ni eble devos elekti malsamajn variablojn por nia analizo.

P-valoro en regresa analizo

Proksime ligita al signifa valoro, la P- valoro indikas la probablecon de la koeficientvaloro malĝuste. P-valoro indikas la asocion de la nula hipotezo kun la variabloj.

Se via p-valoro < la Signo nombro, estas sufiĉe da indico por malakcepti la nulvaloran hipotezon. Ĉi tio signifas, ke estas ne-nula korelacio inter la variabloj.

Sed se la p-valoro > Signifca valoro, estos nesufiĉa indico por forĵeti la nula hipotezo. Tio indikas ke povus ekzisti neniu korelacio inter la variabloj.

En aŭ okazo, la P-valoro de variablo Prezo =0,000948 < 0.00117 (signifvaloro),

Do ne ekzistas nula hipotezo ĉi tie, kaj estas sufiĉe da indico por deklari korelacion inter variabloj.

Aliflanke, por la variablo Vendite , la (P-valoro) 0,0038515 < 0.0011723 (Signifika valoro)

Do povus esti nula hipotezo okazanta ĉi tie, kaj ne estas sufiĉe da indico por deklari ne-nulan korelacion inter variabloj.

Plejofte, ĉi tiu P. -valoro determinas ĉu variablo estos en la datumaro aŭ ne. Ekzemple, ni devus forigi la Venditan variablo por konservi la fortikecon de la datumaro.

Regresa ekvacio

Dum ni determinas la linearan regresan analizon en Excel, la tendenca linio ankaŭ devus esti linia. La ĝenerala formo estas:

Y=mX+C.

Ĉi tie, Y estas la dependa variablo.

Kaj X estas la sendependa variablo ĉi tie, signifante ke ni determinos la efikon de la ŝanĝo de variablo x sur variablo Y.

C nur estos la valoro de la Y-aksa intersekco de la linio.

En ĉi tiu kazo, la valoro de la interkapto C  estas egala al 9502,109853

Kaj la valoro de m por la du variabloj estas -809,265 kaj 0,424818.

Do, ni havas la finan ekvacion por la du apartaj variabloj.

La unua estas:

Y=-809.265771X+9502.12

Kaj la ekvacio por la dua variablo estas:

Y=0.4248X+9502.12

Koeficientoj

La koeficientoj kiujn ni ricevis estas m1=-809,2655 kaj m2=04248 . Kaj interkaptisto, C= 9502.12 .

  • Unue, la interkaptvaloro indikas ke la postulo estos 9502 kiam la prezo estas nulo.
  • Kaj la valoroj de m indikas la rapidecon je kiu postulo ŝanĝiĝas per unuo de prezŝanĝo. La valoro de prezkoeficiento estas -809.265, indikante ke po unuopliiĝo en prezo faligos la postulon je proksimume 809 ekzempleroj.
  • Por la dua variablo, Vendita, la m valoro estas 0.424. Ĉi tio indikas, ke la ŝanĝo por unuo vendis objektonrezultos en 0424-tempa unuopliigo de la produkto.

Restaĵoj

La Restaĵo diferenco inter la originalo kaj la kalkulita eniro de la regresa linio estas la diferenco. Restaĵoj indikas kiom malproksima estas la reala valoro de la linio. Ekzemple, la komputita eniro de la regresa analizo por la unua eniro estas 9497. Kaj la unua originala valoro estas 9500. Do la restaĵo estas ĉirkaŭ 2.109.

T-Statistika Valoro

T-statika valoro estas la divido de koeficiento per la norma valoro. Ju pli alta la valoro estas, des pli bona fidindeco de la koeficiento indikas.

Estas alia signifo de ĉi tiu valoro, kiu necesas por kalkuli la P-valoron.

La 95% Konfida Intervalo

Ĉi tie la fidon de la variablo ni starigis kiel 95 komence. Ĝi tamen povas ŝanĝiĝi.

  • Ĉi tie, la koeficientvaloro de la malsupera 95% estas kalkulita kiel 8496.84 signifas, ke la supra 95% estas kalkulita kiel 10507.37,
  • Ĉi tio signifas, ke dum nia ĉefa koeficiento estas proksimume, 9502.1.estas alta ŝanco ke la valoro povus esti sub 8496 por 95% de kazoj kaj 5% ŝanco ke ĝi estu super 10507.37

Legu Pli:

Aferoj por Memori

La regresa analiza metodo nur taksas la rilaton inter variabloj ekzamenitaj. Ĝi ne establas kaŭzon. Alimaniere, nur la aspektode korelacio konsideras. Kiam iu ago kaŭzas ion, ĝi fariĝis kaŭzo. Kiam ŝanĝado de unu variablo kreas ŝanĝojn, ĝi povas esti konsiderata kaŭzo.

Regresanalizo multe malhelpas per eksteraĵoj. Ĉiuj specoj de outliers devas esti forigitaj antaŭ ol analizo estas farita. Por analizi kaj interpreti regresajn analizrezultojn en Excel, vi devas konsideri ĉi tiujn punktojn.

Konkludo

Por resumi, la demando "kiel interpreti regresrezultojn en Excel" estas respondita de detale. analizante kaj poste interpretante ĝin. La analizo estas farita per la ilo Analizo de datumoj en la langeto Datumoj .

Por ĉi tiu problemo, elŝuteblas laborlibro, kie vi povas praktiki regresan analizon kaj interpreti. ĝi.

Bonvolu fari ajnajn demandojn aŭ komentojn per la komenta sekcio. Ajna sugesto por plibonigo de la Exceldemy komunumo estos tre estiminda.

Hugh West estas tre sperta Excel-trejnisto kaj analizisto kun pli ol 10 jaroj da sperto en la industrio. Li tenas bakalaŭron en Kontado kaj Financo kaj magistron en Komercadministracio. Hugh havas entuziasmon por instruado kaj evoluigis unikan instruan aliron kiu estas facile sekvi kaj kompreni. Lia sperta scio pri Excel helpis milojn da studentoj kaj profesiuloj tutmonde plibonigi siajn kapablojn kaj elstari en siaj karieroj. Per sia blogo, Hugh dividas sian scion kun la mondo, proponante senpagajn Excel-lernilojn kaj interretan trejnadon por helpi individuojn kaj entreprenojn atingi sian plenan potencialon.