Indholdsfortegnelse
Artiklen vil vise dig nogle grundlæggende metoder til at gøre multipel regressionsanalyse i Excel Det er et meget vigtigt emne inden for statistik, da det hjælper os med at forudsige en afhængig variabel i forhold til en eller flere afhængige variabler.
I datasættet har vi nogle oplysninger om nogle biler: deres navne , priser , maksimale hastigheder på miles i timen , den maksimal effekt deres motor kan producere, og den maksimale rækkevidde den afstand, de kan tilbagelægge uden at fylde tanken op.
Download arbejdsbog til øvelser
Multiple regressionsanalyse.xlsxHvad er multipelregression?
Multiple regression er en statistisk proces, hvormed vi kan analysere forholdet mellem en afhængige variabel og flere uafhængige variabler . Formålet med regression er at forudsige arten af afhængige variabler med hensyn til tilsvarende uafhængige variabler .
2 trin til at lave multipel regressionsanalyse i Excel
Trin- 1: Aktiver fanen Dataanalyse
Fanen Data indeholder ikke Analyse af data For at aktivere dette skal du følge nedenstående procedure.
- Først skal du gå til Fil >> Indstillinger
- Vælg derefter Tilføjelser >> Excel-tilføjelser >> Gå til
- Tjek Analyse ToolPak i den Tilføjelser til rådighed: og klik på OK .
Herefter vil den Ribbon til dataanalyse vil blive vist i fanen Data .
Trin- 2: Oprettelse af den multiple regressionsanalyse i Excel
Her vil jeg vise dig, hvordan du analyserer multipel regression .
- Fra den Data faneblad>> vælg Analyse af data
- A dialogboks vil vise den valgte Regression og klik på OK .
A Regression dialogboksen vises.
- Vi vil forudsige bilen pris i henhold til deres maksimal hastighed , maksimal effekt og rækkevidde .
- Vælg den rækkevidde på afhængige variabler ( Input Y-område ). I mit tilfælde er det C4:C14 .
- Derefter skal du vælge den rækkevidde på uafhængige variabler ( Indgang X Område ). I mit tilfælde er det D4:F14 .
- Tjek Etiketter og vælg Nyt regneark Ply: i den Indstillinger for output . Hvis du vil have din regressionsanalyse i det aktuelle ark, skal du angive en cellehenvisning til det sted, hvor du ønsker at starte analyse i den Udgangsområde
Du kan vælge Restprodukter hvis du ønsker at foretage yderligere analyse .
- Herefter vil du se regressionsanalyse i en nyt ark . format analyse alt efter din bekvemmelighed.
Du kan således gøre følgende multipel regressionsanalyse i Excel.
Lignende læsninger
- Hvordan man laver simpel lineær regression i Excel (4 enkle metoder)
- Sådan fortolker du regressionsresultater i Excel (detaljeret analyse)
En kort diskussion om multipel regressionsanalyse i Excel
regressionsanalyse efterlader flere værdier for visse parametre. Lad os se, hvad de betyder.
Regressionsstatistik
I den Regressionsstatistik del, ser vi værdierne for nogle parametre.
- Flere R: Dette henviser til den Korrelationskoefficient der bestemmer, hvor stærk den lineære sammenhæng mellem variablerne er. Værdiintervallet for denne koefficient er (-1, 1). Styrken af forholdet er proportional med den absolutte værdi af Flere R .
- R-kvadrat: Det er en anden Koefficient for at afgøre, hvor godt den regressionslinje Den viser også, hvor mange punkter der ligger på regressionslinjen. I dette eksempel er værdien af R 2 er 86 , hvilket er godt. Det indebærer, at 86% af dataene vil passe til den multipel regressionslinje .
- Justeret R-kvadrat: Dette er den justeret R kvadreret værdi for den uafhængige variabler i modellen. Den er velegnet til multipel regressionsanalyse og således for vores data. Her er værdien af Justeret R-kvadrat er 79 .
- Standardfejl: Dette afgør, hvor perfekt din regression ligningen vil være. Da vi foretager en tilfældig regressionsanalyse , værdien af Standardfejl her er temmelig høj.
- Bemærkninger: Antallet af observationer i datasættet er 10 .
Analyse af varians ( ANOVA )
I den ANOVA analyseafsnit, ser vi også nogle andre parametre .
- df: Den ' frihedsgrader ' er defineret ved df . værdien af df her er 3 fordi vi har 3 typer af uafhængige variabler .
- SS: SS henviser til summen af kvadrater. Hvis Residual sum af den Firkantet er meget mindre end den Samlet beløb på Firkantet , vil dine data passe ind i regressionslinje mere bekvemt. Her er det Resterende SS er meget mindre end SS i alt , så vi kan formode, at vores data kan passe ind i den regressionslinje på en bedre måde
- MS: MS er kvadratmidlet. Værdien af Regression og Resterende MS er 78 og 5372210.11 henholdsvis.
- F og Betydning F: Disse værdier bestemmer pålideligheden af regressionsanalyse . Hvis den Betydning F er mindre end 05 , den flere regressionsanalyse er egnet til brug. Ellers skal du måske ændre din uafhængig variabel I vores datasæt er værdien af Betydning F er 0.01 hvilket er godt til analyse.
Output af regressionsanalyse
Her vil jeg diskutere resultatet af Regressionsanalyse .
- Koefficienter m.v.
I dette afsnit får vi værdien af koefficienter for den uafhængige variabler- Max. hastighed , Spidsbelastning og Område Vi kan også finde følgende oplysninger for hver enkelt koefficient : dens Standardfejl , t Stat , P-værdi og andre parametre.
2. Resterende output
Resterende værdier hjælpe os til at forstå, hvor meget den forventet pris afviger fra sin faktiske værdi, og den standard værdi af residualer der ville være acceptabel.
Den måde, hvorpå forudsigelsen af regressionsanalyse er angivet nedenfor.
Lad os sige, at vi ønsker at forudsige den pris af den første bil i henhold til dens uafhængige variabler . uafhængige variabler er de Max. hastighed , Spidsbelastning og Område hvis værdier er 110 miles i timen , 600 hestekræfter og 130 miles De tilsvarende regressionskoefficienter er 245.43 , 38.19 og 94.38 . y-interceptværdi er -50885.73 Den forventede pris vil således være 245.43*110+38.19*600+94.38*130-50885.73≈11295 .
Ifølge datasættet i denne artikel kan man, hvis man ønsker at forudsige en bils pris som har en maksimal hastighed på x mph , maksimal effekt på y hk og rækkevidde på z miles , vil den forventede pris være 245.43*x+38.19*y+94.38*z .
Læs mere: Sådan fortolker du resultaterne af multipelregression i Excel
Brug af grafer til at forstå multipel lineær regression i Excel
Hvis du ønsker at visualisere den regressionslinje af dine data, så lad os gennemgå nedenstående procedure.
Trin:
- For det første, fra den Data faneblad>> Gå til Analyse af data
- A Analyse af data dialogboksen vises, og vælg derefter Regression .
- Til sidst skal du klikke på OK .
En anden dialogboks på Regression vil blive vist.
- Vælg Resterende og Line Fit-plots .
- Klik på OK .
Herefter vil du se grafen for regressionslinjen passer til i henhold til Max. hastighed , Spidsbelastning og Område i en nyt ark sammen med en analyse.
Herunder repræsenterer det den line fit i henhold til Max. hastighed .
Og det følgende billede viser den line fit i henhold til Spidsbelastning .
Nedenstående billede viser den line fit i henhold til Område .
Du kan downloade arbejdsbogen og se den parceller for at få en bedre forståelse.
Læs mere: Hvordan man laver lineær regression i Excel (4 enkle måder)
Øvelsesafsnit
Her giver jeg dig datasættet fra denne artikel, så du kan analysere multipel lineær regression på egen hånd.
Konklusion
Det er tilstrækkeligt at sige, at denne artikel vil hjælpe dig med at forstå, hvordan du kan gøre multipel regressionsanalyse i Excel, og det er en kort beskrivelse af parametrene. Hvis du har ideer eller feedback til denne artikel, så del dem i kommentarfeltet. Det vil hjælpe mig med at berige mine kommende artikler.