Inhoudsopgave
Dit artikel toont u enkele basismethodes voor het doen van meervoudige regressieanalyse in Excel Dit is een zeer belangrijk onderwerp in de statistiek. Het helpt ons een afhankelijke variabele te voorspellen met betrekking tot een of meer afhankelijke variabelen.
In de dataset hebben we informatie over een aantal auto's: hun namen , prijzen , maximale snelheden in mijl per uur de piekvermogen hun motor kan produceren, en de maximale reeks van de afstand die ze kunnen afleggen zonder hun tank bij te vullen.
Download Praktijk Werkboek
Meervoudige regressieanalyse.xlsxWat is meervoudige regressie?
Meervoudige regressie is een statistisch proces waarmee we het verband tussen een afhankelijke variabele en verschillende onafhankelijke variabelen Het doel van regressie is het voorspellen van de aard van afhankelijke variabelen met betrekking tot de overeenkomstige onafhankelijke variabelen .
2 stappen om meervoudige regressieanalyse in Excel uit te voeren
Stap 1: Schakel het tabblad Gegevensanalyse in.
De Tabblad gegevens bevat niet de Gegevensanalyse Om dit te activeren, doorloop de onderstaande procedure.
- Ga eerst naar Bestand >> Opties
- Selecteer vervolgens Toevoegingen >> Excel-add-ins >> Ga naar
- Controleer Analyse ToolPak in de Add-ins beschikbaar: sectie en klik op OK .
Daarna wordt de Lint voor gegevensanalyse zal verschijnen in de Tabblad gegevens .
Stap 2: De meervoudige regressieanalyse in Excel maken
Hier laat ik je zien hoe je kunt analyseren meervoudige regressie .
- Van de Gegevens tab>> selecteer Gegevensanalyse
- A dialoogvenster zal de geselecteerde Regressie en klik op OK .
A Regressie dialoogvenster verschijnt.
- We zullen de auto voorspellen prijs volgens hun maximale snelheid , piekvermogen en reeks .
- Selecteer de reeks van afhankelijke variabelen ( Ingangsbereik Y ). In mijn geval is het C4:C14 .
- Selecteer daarna de reeks van onafhankelijke variabelen ( Ingang X Bereik ). In mijn geval is het D4:F14 .
- Controleer Labels en selecteer Nieuw werkblad Ply: in de Uitvoeropties Als u wilt dat uw regressieanalyse in het huidige blad, zet een celverwijzing waar u de analyse in de Uitvoerbereik
U mag kiezen Residuen als u verder wilt doen analyse .
- Daarna ziet u de regressieanalyse in een nieuw blad . Formaat van de analyse volgens uw gemak.
Zo kunt u meervoudige regressieanalyse in Excel.
Vergelijkbare lezingen
- Eenvoudige lineaire regressie in Excel (4 eenvoudige methoden)
- Regressieresultaten interpreteren in Excel (gedetailleerde analyse)
Een korte discussie over meervoudige regressieanalyse in Excel
De regressieanalyse laat verschillende waarden van bepaalde parameters over. Laten we eens kijken wat ze betekenen.
Regressiestatistieken
In de Regressiestatistieken gedeelte, zien we waarden van enkele parameters.
- Meerdere R: Dit verwijst naar de Correlatiecoëfficiënt die bepaalt hoe sterk het lineaire verband tussen de variabelen is. Het bereik van de waarden voor dit coëfficiënt is (-1, 1). De sterkte van het verband is evenredig met de absolute waarde van Meerdere R .
- R Square: Het is een andere Coëfficiënt om te bepalen hoe goed de regressielijn Het laat ook zien hoeveel punten er op de regressielijn vallen. In dit voorbeeld is de waarde van R 2 is 86 wat goed is. Het impliceert dat 86% van de gegevens past bij de meervoudige regressielijn .
- Adjusted R Square: Dit is de aangepaste R kwadraat waarde voor de onafhankelijke variabelen in het model. Het is geschikt voor meervoudige regressieanalyse en dus voor onze gegevens. Hier is de waarde van Aangepast R-vierkant is 79 .
- Standaardfout: Dit bepaalt hoe perfect uw regressie vergelijking zal zijn. Aangezien we een willekeurige regressieanalyse de waarde van Standaardfout hier is vrij hoog.
- Observaties: Het aantal waarnemingen in de dataset is 10 .
Analyse van de variantie ( ANOVA )
In de ANOVA analyse sectie, zien we ook enkele andere parameters .
- df: De ' vrijheidsgraden wordt gedefinieerd door df De waarde van df hier is 3 omdat we 3 soorten onafhankelijke variabelen .
- SS: SS verwijst naar de som van de kwadraten. Als de Resterende som van de Vierkant is veel kleiner dan de Totaalbedrag van Vierkant passen uw gegevens in de regressielijn handiger. Hier is de Resterende SS is veel kleiner dan Totaal SS dus we kunnen veronderstellen dat onze gegevens passen in de regressielijn op een betere manier
- MS: MS is het gemiddelde kwadraat. De waarde van Regressie en Resterend MS is 78 en 5372210.11 respectievelijk.
- F en Betekenis F: Deze waarden bepalen de betrouwbaarheid van de regressieanalyse Als de Betekenis F is minder dan 05 de meerdere regressieanalyse te gebruiken. Anders moet u misschien uw onafhankelijke variabele In onze dataset is de waarde van Betekenis F is 0.01 wat goed is voor de analyse.
Output regressieanalyse
Hier bespreek ik de uitvoer van Regressieanalyse .
- Coëfficiënten en andere
In dit deel krijgen we de waarde van coëfficiënten voor de onafhankelijke variabelen - max. snelheid , Piekvermogen en Bereik We kunnen ook de volgende informatie voor elk vinden coëfficiënt : zijn Standaardfout , t Stat , P-waarde en andere parameters.
2. Resterende output
De Restwaarden helpen ons te begrijpen hoeveel de verwachte prijs afwijkt van zijn werkelijke waarde en de standaard waarde van residuen dat aanvaardbaar zou zijn.
De manier waarop de voorspelling door regressieanalyse werken wordt hieronder gegeven.
Stel, we willen de prijs van de eerste auto volgens zijn onafhankelijke variabelen . de onafhankelijke variabelen zijn de Max. snelheid , Piekvermogen en Bereik waarvan de waarden 110 mijl per uur , 600 pk en 130 mijl respectievelijk. De overeenkomstige regressiecoëfficiënten zijn 245.43 , 38.19 en 94.38 . de y intercept waarde is -50885.73 Dus de voorspelde prijs zal 245.43*110+38.19*600+94.38*130-50885.73≈11295 .
Volgens de dataset van dit artikel, als je een auto's prijs die een maximale snelheid van x mph , piekvermogen van y pk en reeks van z mijl zal de voorspelde prijs 245.43*x+38.19*y+94.38*z .
Lees meer: Resultaten van meervoudige regressie interpreteren in Excel
Grafiek gebruiken om meervoudige lineaire regressie in Excel te begrijpen
Als u de regressielijn van uw gegevens, laten we de onderstaande procedure doorlopen.
Stappen:
- Ten eerste, van de Gegevens tab>> Ga naar Gegevensanalyse
- A Gegevensanalyse dialoogvenster verschijnt en selecteer vervolgens Regressie .
- Klik tenslotte op OK .
Een andere dialoogvenster van Regressie zal verschijnen.
- Selecteer Resterend en Line Fit Plots .
- Klik op OK .
Daarna ziet u de grafiek van de regressielijn past bij volgens Max. snelheid , Piekvermogen en Bereik in een nieuw blad samen met de analyse.
Hier beneden vertegenwoordigt het de lijnpassing volgens Max. snelheid .
En de volgende afbeelding toont de lijnpassing volgens Piekvermogen .
De onderstaande afbeelding geeft de lijnpassing volgens Bereik .
Download het werkboek en bekijk de percelen voor een beter begrip.
Lees meer: Lineaire regressie in Excel (4 eenvoudige manieren)
Praktijk Sectie
Hier geef ik u de dataset van dit artikel, zodat u kunt analyseren meervoudige lineaire regressie in je eentje.
Conclusie
Het volstaat te zeggen dat dit artikel u zal helpen begrijpen hoe u meervoudige regressieanalyse in Excel en het is een korte beschrijving van de parameters. Heeft u ideeën of feedback over dit artikel, deel ze dan in het commentaarvak. Dit zal mij helpen mijn komende artikelen te verrijken.