Multobla Regresa Analizo kun Excel

  • Kundividu Ĉi Tion
Hugh West

Simpla regresa analizo estas ofte uzata por taksi la rilaton inter du variabloj, ekzemple, la rilato inter kultivaĵorendimento kaj pluvokvanto aŭ la rilato inter la gusto de pano kaj forna temperaturo. Tamen, ni devas esplori la rilaton inter dependa variablo kaj du aŭ pli da sendependaj variabloj pli ofte ol ne. Ekzemple, dommakleristo eble volas scii ĉu kaj kiel mezuroj kiel la grandeco de la domo, la nombro da dormoĉambroj, kaj la meza enspezo de la najbareco rilatas al la prezo por kiu domo estas vendita. Ĉi tiu speco de problemo povas esti solvita aplikante multoblan regresan analizon. Kaj ĉi tiu artikolo donos al vi resumon pri kiel uzi fari multoblan regresan analizon per Excel.

Problemo

Supozu, ke ni prenis 5 hazarde elektitajn vendistojn kaj kolektis la informojn kiel montrite en la suba tabelo. Ĉu edukado aŭ instigo efikas sur ĉiujaraj vendoj aŭ ne?

Plej Alta Lerneja Jaro Finita Motivado kiel Mezurita per Higgins Motivation Scale Jara Vendo en Dolaroj
12 32 $350,000
14 35 $399,765
15 45 $429,000
16 50 $435,000
18 65 $433,000

Ekvacio

Ĝenerale, multoblajregresa analizo supozas ke ekzistas linia rilato inter la dependa variablo (y) kaj sendependaj variabloj (x1, x2, x3 … xn). Kaj ĉi tiu speco de lineara rilato povas esti priskribita uzante la jenan formulon:

Y = konstanta + β1*x1 + β2*x2+...+ βn*xn

Jen la klarigoj por konstantoj kaj koeficientoj :

Y La antaŭvidita valoro de Y
Konstanto La Y- interkapto
β1 La ŝanĝo en Y ĉiu 1 pliiga ŝanĝo en x1
β2 La ŝanĝo en Y ĉiu 1 pliigo ŝanĝo en x2
βn La ŝanĝo en Y ĉiu 1 pliiga ŝanĝo en xn

Konstanto kaj β1, β2... βn povas esti kalkulita surbaze de disponeblaj specimenaj datumoj. Post kiam vi ricevas valorojn de konstanto, β1, β2... βn, vi povas uzi ilin por fari la antaŭdirojn.

Kiel nia problemo, estas nur du faktoroj pri kiuj ni havas intereson. Tial, la ekvacio estos:

Jaraj vendoj = konstanta + β1*(Plej Alta Jaro de Lerneja Finiĝo) + β2*(Motivado laŭ mezuro de Higgins Motivation Scale)

Agordu modelon

Jaraj vendoj, plej alta lerneja jaro finita kaj Instigo estis enmetitaj en kolumnon A, kolumnon B kaj kolumnon C kiel montrite en Figuro 1. Estas pli bone ĉiam meti la dependan variablon (Jaraj vendoj ĉi tie) antaŭ la sendependaj variabloj. .

Figuro 1

Elŝutu Analysis ToolPak

Excelofertas al ni Datuman Analizon, kiu povas redoni valorojn de konstantoj kaj koeficientoj. Sed antaŭ ol uzi ĉi tiun funkcion, vi devas elŝuti Analysis ToolPak. Jen kiel vi povas instali ĝin.

Alklaku la langeton Dosiero -> Opcioj kaj poste alklaku Aldonaĵoj en Excel Opcioj dialogujo. Alklaku la butonon Iru ĉe la malsupro de Excel Options dialogkesto por malfermi Aldonaĵojn dialogujo. En la dialogkesto Aldonaĵoj , elektu markobutonon Analysis TookPak kaj poste alklaku Ok .

Nun se vi klakas sur langeto Datumoj , vi vidos Analizo de datumoj aperas en la grupo Analizo (dekstra panelo).

Figuro 2 [alklaku la bildon por akiri plenan vidon]

Multobla Regresa Analizo

Alklaku sur Datanalizo en la grupo Analizo sur la langeto Datumo . Elektu Regresan En la instigita Data Analizo dialogkesto. Vi povas ankaŭ fari aliajn statistikan analizon kiel t-teston, ANOVA, ktp.

Figuro 3.1

A Regresado dialogujo estos petata post kiam vi elektas Regresan . Plenigu la dialogujon kiel montrite en Figuro 3.2.

Enigo Y-Gamo enhavas la dependan variablon kaj datumojn dum la Enigo-X-a gamo enhavas sendependajn variablojn kaj datumojn. Ĉi tie mi devas memorigi al vi, ke sendependaj variabloj estu en apudaj kolumnoj. Kaj la maksimuma nombro da sendependaj variabloj estas 15.

Ekdegamo A1: C1 inkluzivas variajn etikedojn kaj tial Etikedoj markobutono estu elektita. Fakte, mi rekomendas vin inkluzivi etikedojn ĉiufoje kiam vi plenigas Input Y Range kaj Input X Range. Ĉi tiuj etikedoj estas helpemaj kiam vi revizias resumajn raportojn resenditajn de Excel.

Figuro 3.2

Per elektado de la markobutono Restaĵoj, vi povas ebligi Excel listigi restaĵojn por ĉiu observado. Rigardu Figuron 1, estas 5 observoj entute kaj vi ricevos 5 restaĵojn. Restaĵo estas io, kio restas kiam vi subtrahas la antaŭviditan valoron de la observita valoro. Normigita restaĵo estas la restaĵo dividita per ĝia norma devio.

Vi ankaŭ povas elekti la markobutonon Residua Plot kiu povas ebligi Excel redoni restajn intrigojn. La nombro da restaj intrigoj egalas al la nombro da sendependaj variabloj. Resta grafiko estas grafeo kiu montras la restaĵojn sur la Y-akso kaj sendependajn variablojn sur la x-akso. Hazarde disigitaj punktoj ĉirkaŭ la x-akso en resta intrigo implicas ke la linia regreso modelo estas taŭga. Ekzemple, Figuro 3.3 montras tri tipajn ŝablonojn de restaj intrigoj. Nur tiu en la maldekstra panelo indikas, ke ĝi taŭgas por lineara modelo. La aliaj du ŝablonoj sugestas pli bonan taŭgecon por ne-linia modelo.

Figuro 3.3

Excel resendos ĝustigitan strekon se vi elektas la markobutonon Liniaj konvenaj grafikaĵoj. konvenita liniointrigopovas montri la rilaton inter unu dependa variablo kaj unu sendependa variablo. Alivorte, Excel resendos al vi la saman nombron da konvenitaj liniaj intrigoj kun tiu de la sendependa variablo. Ekzemple, vi ricevos 2 konvenajn liniojn por nia problemo.

Rezultoj

Post kiam vi klakas sur la Ok-butono, Excel resendos resuman raporton kiel sube. Ĉeloj reliefigitaj per verda kaj flava estas la plej grava parto, al kiu vi devus atenti.

Figuro 3.4

Ju pli alta R-kvadrato (ĉelo F5), la streĉa rilato ekzistas. inter dependaj variabloj kaj sendependaj variabloj. Kaj koeficientoj (gamo F17: F19) en la tria tabelo redonis al vi la valorojn de konstantoj kaj koeficientoj. La ekvacio estu Jara vendo = 1589.2 + 19928.3*(Plej Alta Jaro de Lernejo Finita) + 11.9*(Motivado laŭ mezuro de Higgins Motivation Scale).

Tamen, por vidi ĉu la rezultoj estas fidindaj, vi ankaŭ bezonas por kontroli p-valorojn emfazitajn flava. Nur se p-valoro en ĉelo J12 estas malpli ol 0.05, la tuta regresekvacio estas fidinda. Sed vi ankaŭ devas kontroli p-valorojn en intervalo I17: I19 por vidi ĉu konstantaj kaj sendependaj variabloj estas utilaj por la antaŭdiro de la dependa variablo. Por nia problemo, estas pli bone por ni forĵeti instigon kiam oni konsideras sendependajn variablojn.

Legu Pli: Kiel Kalkuli P-valoron en Lineara regreso en Excel (3)Vojoj)

Forigi Instigo de sendependaj variabloj

Post forigo de Instigo kiel sendependa variablo, mi aplikis la saman aliron kaj faris simplan regresan analizon. Vi povas vidi, ke ĉiuj valoroj nun estas malpli ol 0,05. La fina ekvacio estu:

Jaraj vendoj = 1167.8 + 19993.3*(Plej Alta Lerneja Jaro Finita)

Figuro 3.5 [Alklaku la bildon por plene vidi]

Noto

Figuro 4

Krom Aldonaĵoj, vi ankaŭ povas uzi LINEST-funkcion por fari multoblan regresan analizon. LINEST-funkcio estas tabelfunkcio kiu povas resendi la rezulton en aŭ unu ĉelo aŭ gamo da ĉeloj. Antaŭ ĉio, elektu gamon A8:B12 kaj poste enigu formulon "=LINEST (A2:A6, B2:B6, TRUE, TRUE)" en la unuan ĉelon de ĉi tiu gamo (A8). Post kiam vi premas CTRL + SHIFT + ENTER, Excel resendos rezultojn kiel sube. Komparante kontraŭ Figuro 3.4, vi povas vidi ke 19993.3 estas la koeficiento de Plej alta lerneja jaro finita dum 1167.8 estas konstanta. Ĉiuokaze, mi rekomendas al vi uzi Aldonaĵojn. Ĝi estas multe pli facila.

Legu pli...

Inversa Analizo en Excel

Kiel uzi ĵokerojn en Excel?

Elŝutu labordosiero

Elŝutu la labordosieron el la suba ligilo.

Multobla-Regresa-Analizo. xlsx

Hugh West estas tre sperta Excel-trejnisto kaj analizisto kun pli ol 10 jaroj da sperto en la industrio. Li tenas bakalaŭron en Kontado kaj Financo kaj magistron en Komercadministracio. Hugh havas entuziasmon por instruado kaj evoluigis unikan instruan aliron kiu estas facile sekvi kaj kompreni. Lia sperta scio pri Excel helpis milojn da studentoj kaj profesiuloj tutmonde plibonigi siajn kapablojn kaj elstari en siaj karieroj. Per sia blogo, Hugh dividas sian scion kun la mondo, proponante senpagajn Excel-lernilojn kaj interretan trejnadon por helpi individuojn kaj entreprenojn atingi sian plenan potencialon.