Cum se calculează eroarea standard a regresiei în Excel (cu pași simpli)

  • Imparte Asta
Hugh West

Folosim analiza de regresie atunci când avem date de la două variabile din două surse diferite și dorim să construim o relație între ele. Analiza de regresie ne oferă un model liniar care ne permite să prezicem posibilele rezultate. Vor exista unele diferențe între valorile prezise și cele reale din motive evidente. Ca urmare, noi se calculează eroarea standard folosind modelul de regresie, care reprezintă eroarea medie dintre valorile prezise și cele reale. În acest tutorial, vă vom arăta cum să calculați eroarea standard a analizei de regresie în Excel .

Descărcați caietul de practică

Descărcați acest caiet de exerciții pentru a vă exercita în timp ce citiți acest articol.

Eroare standard de regresie.xlsx

4 pași simpli pentru a calcula eroarea standard a regresiei în Excel

Să presupunem că aveți un set de date cu un variabila independentă ( X ) și un variabila dependentă ( Y ) După cum vedeți, nu au o relație semnificativă. Dar noi vrem să construim una. Ca urmare, vom folosi Analiza de regresie pentru a crea o relație liniară între cele două. Vom calcula eroarea standard între cele două variabile folosind analiza de regresie. Vom trece în revistă unii dintre parametrii modelului de regresie în a doua jumătate a articolului pentru a vă ajuta să îl interpretați.

Pasul 1: Aplicați comanda de analiză a datelor pentru a crea un model de regresie

  • În primul rând, mergeți la Date și faceți clic pe butonul Analiza datelor comandă.

  • De la Analiza datelor selectați caseta de listă Regresie opțiune.
  • Apoi, faceți clic pe OK .

Pasul 2: Introduceți intervalul de intrare și de ieșire în caseta de regresie

  • Pentru Intervalul Y de intrare , selectați intervalul C4:C13 cu antetul.
  • Faceți clic pe butonul Etichete caseta de selectare.

  • Selectați intervalul B4:B13 pentru Intervalul de intrare X .

  • Pentru a obține rezultatul în locația preferată, selectați orice celulă ( B16 ) pentru Gama de ieșire .
  • În cele din urmă, faceți clic pe OK .

Citește mai mult: Cum să calculați eroarea standard a proporției în Excel (cu pași simpli)

Pasul 3: Aflați eroarea standard

  • Din analiza de regresie, puteți obține valoarea erorii standard ( 3156471 ).

Citește mai mult: Cum să găsiți eroarea standard reziduală în Excel (2 metode ușoare)

Pasul 4: Reprezentați graficul modelului de regresie

  • În primul rând, faceți clic pe butonul Introduceți tab.
  • De la Grafice selectați grupul Dispersie grafic.

  • Faceți clic dreapta pe peste unul dintre puncte.
  • Dintre opțiuni, selectați Adăugați linia de trend opțiune.

  • Prin urmare, dumneavoastră analiza de regresie graficul va fi trasat ca în imaginea de mai jos.

  • Pentru a afișa analiza de regresie ecuație, faceți clic pe Afișarea ecuației pe diagramă de la opțiunea Format Trendline.

  • Ca urmare, ecuația ( y = 1.0844x + 107.21 ) a analizei de regresie va apărea în grafic.

Note:

Puteți calcula diferența dintre valorile prezise și valorile reale din ecuația analizei de regresie.

Pași:

  • Introduceți formula pentru a reprezenta ecuația analizei de regresie.
=1.0844*B5 + 107.21

  • Prin urmare, se va obține prima valoare prezisă ( 129.9824 ), care diferă de valoarea reală ( 133 ).

  • Utilizați Instrumentul AutoFill pentru a completa automat coloana D .

  • Pentru a calcula eroarea, introduceți următoarea formulă pentru a scădea.
=C5-D5

  • În cele din urmă, coloana de autocompletare E pentru a găsi valorile de eroare.

Citește mai mult: Cum se calculează eroarea standard a pantei de regresie în Excel

Interpretarea analizei de regresie în Excel

1. Eroare standard

Putem observa din ecuația analizei de regresie că există întotdeauna o diferență sau o eroare între valorile prezise și cele reale. Prin urmare, trebuie să calculăm abaterea medie a diferențelor.

A eroare standard reprezintă eroarea medie între valoarea prezisă și valoarea reală. Am descoperit că 8.3156471 ca eroare standard în modelul nostru de regresie de exemplu. Aceasta indică faptul că există o diferență între valorile prezise și cele reale, care ar putea fi mai mare decât valoarea eroare standard ( 15.7464 ) sau mai puțin decât eroare standard ( 4.0048 ). eroare medie va fi 8.3156471 , care este eroare standard .

Prin urmare, obiectivul modelului este de a reduce eroarea standard. mai jos eroarea standard, cu atât mai mult precisă modelul.

2. Coeficienți

Coeficientul de regresie evaluează răspunsurile valorilor necunoscute. În ecuația de regresie ( y = 1.0844x + 107.21 ), 1.0844 este coeficient , x este variabila predictivă independentă, 107.21 este constanta, iar y este valoarea de răspuns pentru x .

  • A coeficient pozitiv prezice că, cu cât coeficientul este mai mare, cu atât este mai mare variabila de răspuns. Aceasta indică o proporțional relație.
  • A coeficient negativ prezice că, cu cât coeficientul este mai mare, cu atât valorile de răspuns sunt mai mici. Aceasta indică o disproporționată relație.

3. Valorile P

În analiza de regresie, valori p și coeficienții cooperează pentru a vă informa dacă corelațiile din modelul dvs. sunt relevante din punct de vedere statistic și cum sunt aceste relații. Funcția ipoteza nulă că variabila independentă nu are nicio legătură cu variabila dependentă se testează folosind testul p-valoare Nu există nicio legătură între modificările variabilei independente și variațiile variabilei dependente dacă nu există corelație.

  • Datele din eșantionul dvs. oferă suficient sprijin pentru falsifica ipoteza nulă pentru întreaga populație, în cazul în care p-valoare pentru o variabilă este mai puțin decât pragul dvs. de semnificație. Dovezile dvs. susțin noțiunea de corelație diferită de zero La nivelul populației, modificările variabilei independente sunt legate de modificările variabilei dependente.
  • A p-valoare mai mare decât nivelul de semnificație, de o parte și de alta, sugerează că eșantionul dumneavoastră are dovezi insuficiente pentru a stabili că un corelație diferită de zero există.

Pentru că valori p ( 5.787E-06 , 1.3E-06 ) sunt mai puțin decât valoare semnificativă ( 5.787E-06 ), se va utiliza Variabila independentă (X) și Interceptare sunt semnificativ din punct de vedere statistic , așa cum se vede în exemplul de ieșire a regresiei.

4. Valorile R-Squared

Pentru modelele de regresie liniară, R-squared este un măsurarea completitudinii Acest raport arată procentul de variație în variabila dependentă pe care factorii independenți o explică atunci când sunt luați în considerare împreună. La o scară mai mică 0-100 la sută, R-squared cuantifică rezistență a legăturii dintre modelul dumneavoastră și variabila dependentă.

The R2 este o măsură a modului în care modelul de regresie se potrivește cu datele dvs. Valoarea mai mare la număr , a mai bine fezabilă a modelului.

Concluzie

Sper că acest articol v-a oferit un tutorial despre cum să calculați eroarea standard a regresiei în Excel Toate aceste proceduri ar trebui învățate și aplicate la setul dvs. de date. Aruncați o privire la caietul de exerciții practice și puneți aceste abilități la încercare. Suntem motivați să continuăm să realizăm tutoriale ca acesta datorită sprijinului dvs. valoros.

Vă rugăm să ne contactați dacă aveți întrebări și să ne lăsați comentarii în secțiunea de mai jos.

Noi, cei Exceldemy Team, sunt întotdeauna receptivi la întrebările dumneavoastră.

Rămâneți alături de noi și continuați să învățați.

Hugh West este un trainer și analist Excel cu o experiență de peste 10 ani în industrie. Deține o diplomă de licență în contabilitate și finanțe și un master în administrarea afacerilor. Hugh are o pasiune pentru predare și a dezvoltat o abordare unică de predare care este ușor de urmărit și de înțeles. Cunoștințele sale experte despre Excel au ajutat mii de studenți și profesioniști din întreaga lume să-și îmbunătățească abilitățile și să exceleze în cariera lor. Prin blogul său, Hugh își împărtășește cunoștințele lumii, oferind tutoriale gratuite Excel și instruire online pentru a ajuta persoanele și companiile să-și atingă întregul potențial.