Indholdsfortegnelse
I statistik er histogram og klokkekurve meget populære. Histogrammet er primært en tilnærmelsesvis repræsentation af den numeriske datafordeling. Når vi har kombinationen af histogram og klokkekurve, giver det en vidvinkel til at fokusere på nogle flere ting. Denne artikel vil primært fokusere på, hvordan man opretter et histogram med en klokkekurve i Excel. Jeg håber, at du finder denne artikel meget interessant foryderligere brug og samle masser af viden om dette emne.
Download arbejdsbog til øvelser
Download arbejdsbogen til øvelser.
Histogram med klokkekurve.xlsxHvad er Bell Curve?
Klokkekurven kan defineres som en kurve, der ligner en klokkeform. Denne kurve definerer den normale fordeling af datasættet. Klokkekurvens højeste punkt angiver den mest sandsynlige tilstand for datasættet, hvilket betyder datasættets middelværdier. Klokkekurven fordeler værdierne jævnt.
I hver betingelse har de gennemsnitlige betingelser det bedste tal, så klokkekurven giver det højeste tal i midten. Klokkekurvens funktion viser, at 68,2 % af fordelingen ligger inden for en standardafvigelse fra middelværdien, mens 95,5 % af fordelingen ligger inden for to standardafvigelser fra middelværdien, og 99,7 % af fordelingen ligger inden for tre standardafvigelser fra middelværdien.I bund og grund vil klokkekurven repræsentere datasættet på en måde, hvor den viser, hvordan middelværdien ligger over resten af værdierne.
2 egnede eksempler på at oprette et histogram med klokkekurve i Excel
Da vi ønsker at repræsentere et histogram med en klokkekurve i Excel, vil vi vise to forskellige eksempler på at oprette et histogram med en klokkekurve i Excel. Disse to eksempler vil give dig et godt overblik over dette emne. Vores to eksempler er baseret på karakterer for studerende og færdiggørelsesdage for projekter. Begge metoder er anvendelige til histogrammer og klokkekurver.
1. Histogram med klokkekurve for elevkarakterer
Vores første metode er baseret på elevernes karakterer. Vi tager et datasæt, der omfatter nogle elever og deres karakterer.
Først laver vi et histogram med dette datasæt og inkluderer derefter en klokkekurve ved at beregne normalfordelingen. For at gøre dette skal vi følge trinnet meget nøje, ellers kan du ikke lave et histogram med en klokkekurve i Excel.
Trin
- Først skal du aktivere Værktøj til dataanalyse .
- For at gøre dette skal du gå til Fil fanen i båndet.
- Vælg derefter den Mere kommando.
- I den Mere kommando, vælg Indstillinger .
- En Excel-muligheder dialogboksen vises.
- Klik derefter på Tilføjelser .
- Derefter skal du klikke på Gå til .
- Fra den Tilføjelser tilgængelige sektion, vælg Analyseværktøjspakke .
- Endelig skal du klikke på OK .
- Hvis du vil bruge Værktøj til dataanalyse , skal du have en Bin rækkevidde.
- Vi fastsætter et bin-område ved at studere datasættets laveste og højeste værdier.
- Vi tager intervaller på 5 .
- Gå nu til Data fanen i båndet.
- Vælg derefter Analyse af data fra den Analyse gruppe.
- A Analyse af data dialogboksen vises.
- Fra den Analyseværktøjer skal du vælge Histogram .
- Endelig skal du klikke på OK .
- I den Histogram dialogboksen, skal du vælge den Indgangsområde .
- Her tager vi kolonnen Marks som den Indgangsområde fra celle C5 til celle C20 .
- Vælg derefter den Bin Range som vi oprettede ovenfor.
- Derefter skal du indstille Indstillinger for output i det aktuelle regneark.
- Endelig skal du klikke på OK .
- Det vil give os følgende output, hvor det viser den bin, vi tidligere har tildelt, og fordelingens frekvens for vores datasæt. Her har bin 65 1 frekvens, hvilket betyder, at der er fundet én karakter for en bestemt elev fra 60 til 65.
- For at få et bedre diagram skal vi tilføje en ny kolonne og kalde den midtpunktet for bin'en i stedet for slutpunktet for bin'en.
- I den nye kolonne skrives følgende formel ned.
=I5-2.5
- Derefter skal du trykke på Indtast for at anvende formlen.
- Derefter skal du trække den Håndtag til påfyldning ikonet længere nede i kolonnen.
- Vælg derefter området med celler J5 til K11 .
- Gå til Indsæt t-fanen i farvebåndet.
- Fra den Diagrammer gruppe, vælg Spredningsdiagram Se skærmbilledet.
- Vælg den ønskede farve i spredningsdiagrammet i Spredning med glatte linjer og markører .
- Det vil give os følgende diagram med vores datasæt.
- For at gøre kurven større og føre den til midten skal vi justere x-aksen.
- Dobbeltklik derefter på x-aksen for at åbne Format-akse dialogboksen.
- Vælg derefter ikonet for bjælken.
- Herfra skal du ændre Minimum og Maksimum Denne rækkevidde er grundlæggende fastlagt ved at studere datasættet.
- Som resultat får vi en større og midterste formkurve. Se skærmbilledet.
- Når du derefter vælger diagrammet, vises en Design af diagrammer vil blive vist.
- Vælg den Design af diagrammer .
- Derefter, fra den Layout af diagrammer , vælg Tilføj diagramelement .
- I den Tilføj diagramelement vælge, vælg Fejlstænger .
- Fra den Fejlstænger , vælg Flere muligheder for fejlbjælker .
- A Formatfejl Dialogboksen Bars vises.
- Derefter, i den Lodret fejlbjælke afsnit, vælg retning Minus .
- Herefter skal du indstille Slut stil som Ingen låg .
- I den Fejl Beløb skal du indstille Procentdel til 100 %.
- Den vil repræsentere kurven på følgende måde, se skærmbilledet.
- Som du kan se linjen i hver bin, skal vi ændre linjen til en søjle.
- For at gøre dette skal du igen gå til Format Fejlstænger .
- Derefter ændres den Her tager vi bredden som 40 .
- Den vil forme kurven på følgende måde. Se skærmbilledet.
- Nu skal vi fjerne kurven, fordi vi skal tegne klokkekurven her.
- Klik på kurven for at slette den for at slette den.
- A Format Dataserie dialogboksen vises.
- I den Linje skal du vælge Ingen linje .
- Derefter skal du gå til Mærke sektion.
- I den Mærke indstillinger, skal du vælge Ingen.
- Herefter er alle linjer og markører væk, men der er også nogle endepunkter derinde.
- Du kan fjerne dem ved at klikke på dem.
- Højreklik derefter på for at åbne Kontekstmenu .
- Derfra skal du vælge Slet for at fjerne alle endepunkterne.
- Resultatet er, at vi får det ønskede histogram fra vores datasæt.
- Herefter vender vi vores fokus mod klokkekurven.
- Før vi tegner klokkekurven, skal vi beregne den Gennemsnitlig , Standardafvigelse , og endnu vigtigere den Normalfordeling .
- I første omgang skal vi finde den Gennemsnitlig værdien af de studerendes karakterer ved hjælp af funktionen AVERAGE .
- Vælg, celle F14 .
- Skriv derefter følgende formel i formularfeltet.
=GENNEMSNIT(C5:C20)
- Tryk på Gå ind på for at anvende formlen.
- Dernæst skal vi beregne standardafvigelsen ved hjælp af funktionen STDEV.P
- For at gøre dette skal du først vælge celle F15 .
- Skriv følgende formel i formularfeltet.
=STDEV.P(C5:C20)
- Tryk på Indtast for at anvende formlen.
- Derefter skal vi beregne normalfordelingen for at fastlægge klokkekurven.
- Vi tager nogle værdier fra 60 til 85. Denne værdi er taget ved at studere histogrammet korrekt.
- Derefter ønsker vi at finde normalfordelingen for de tilsvarende værdier.
- For at bestemme normalfordelingen ved hjælp af funktionen NORM.DIST .
- Vælg derefter celle C26 .
- Skriv derefter følgende formel ned i formularboksen. Her skal vi skalere normalfordelingen i forhold til histogramgrafen. Det er derfor, vi bruger 97.
=NORM.DIST(B26,$F$14,$F$15,FALSE)*97
- Tryk på Gå ind på for at anvende formlen.
- Træk derefter den Håndtag til påfyldning ikonet længere nede i kolonnen.
- Nu kan vi tilføje klokkekurven til histogramkurven.
- For at gøre dette skal du vælge det histogramdiagram, der blev lavet tidligere. Det vil åbne den Design af diagrammer mulighed.
- Derefter, fra den Data gruppe, klik på Vælg data .
- A Vælg datakilde dialogboksen vises.
- Vælg derefter Tilføj for at indsætte nye serier.
- Vælg X- og Y-værdierne i cellerne i dialogboksen Rediger serie.
- I Y-serien indstiller vi normalfordelingen, mens vi i X-serien indstiller værdierne.
- Endelig skal du klikke på OK .
- Det vil tilføje som Serie 2 i dialogboksen Vælg datakilde.
- Klik derefter på OK .
- Derefter skal du gå til Design af diagrammer og Vælg Ændre diagramtype fra den Type gruppe.
- Vælg derefter den Spredning Se skærmbilledet.
- Derefter skal du klikke på OK .
- Det vil give klokkekurven sammen med histogrammet. Men her er kurvelinjen i stiplet format.
- Vi er nødt til at gøre det til en fast linje.
- Dobbeltklik nu på den stiplede kurve, og den Format Dataserie dialogboksen vises.
- I den Linje skal du vælge Gennemgående linje .
- Derefter skal du ændre Farve .
- Her har vi vores endelige resultat af et histogram med en klokkekurve for elevernes karakterer.
2. Histogram med klokkekurve for projektafslutning
Vores næste eksempel er baseret på færdiggørelse af et projekt. Vi tager et datasæt, der indeholder navn, projekt-ID og dage til færdiggørelse af opgaven.
For at oprette et histogram med en klokkekurve i Excel skal vi finde middelværdien, standardafvigelsen og normalfordelingen. Du skal følge processerne nøje for at gøre dette.
Trin
- For at oprette et histogram skal du i første omgang bruge Værktøj til dataanalyse .
- Hvis du vil bruge Værktøj til dataanalyse , skal du have en Område for beholdere .
- Vi fastsætter et bin-område ved at undersøge datasættets laveste og højeste værdier.
- Vi tager et interval 5 .
- Gå nu til Data fanen i båndet.
- Vælg derefter Analyse af data fra den Analyse gruppe.
- A Analyse af data dialogboksen vises.
- Fra den Analyseværktøjer skal du vælge Histogram .
- Endelig skal du klikke på OK .
- I den Histogram dialogboksen, skal du vælge den Indgangsområde .
- Her tager vi Marks-kolonnen som inputområdet fra celle D5 til celle D24 .
- Vælg derefter den Bin Range som vi oprettede ovenfor.
- Derefter skal du indstille Indstillinger for output i det aktuelle regneark.
- Endelig skal du klikke på OK .
- Det vil give os følgende output, hvor det viser den bin, vi tidligere har tildelt, og fordelingens frekvens for vores datasæt. Her har bin 15 en frekvens på 1, hvilket betyder, at der fra 10 til 15 er fundet én karakter for en bestemt elev.
- For at få et bedre diagram skal vi nu tilføje en ny kolonne og kalde den midtpunktet for bin'en i stedet for slutpunktet for bin'en.
- I den nye kolonne skrives følgende formel ned.
=I5-2.5
- Derefter skal du trykke på Gå ind på for at anvende formlen.
- Derefter skal du trække den Håndtag til påfyldning ikonet længere nede i kolonnen.
- Vælg derefter området med celler J5 til K12 .
- Gå til Indsæt t-fanen i farvebåndet.
- Fra den Diagrammer gruppe, vælg Spredningsdiagram Se skærmbilledet.
- Vælg den ønskede farve i spredningsdiagrammet i Spredning med glatte linjer og markører .
- Det vil give os følgende diagram med vores datasæt.
- Når du derefter vælger diagrammet, vises en Design af diagrammer vil blive vist.
- Vælg den Design af diagrammer .
- Derefter, fra den Layout af diagrammer , vælg Tilføj diagramelement .
- I den Tilføj diagramelement vælge, vælg Fejlstænger .
- Fra den Fejlstænger , vælg Flere muligheder for fejlbjælker .
- A Formatfejl Dialogboksen Bars vises.
- Derefter, i den Lodret fejlbjælke afsnit, vælg retning Minus .
- Herefter skal du indstille Slut stil som Ingen låg .
- I den Fejl Beløb skal du indstille Procentdel til 100 %.
- Den vil repræsentere kurven på følgende måde, se skærmbilledet.
- Som du kan se linjen i hver bin, skal vi ændre linjen til en søjle.
- For at gøre dette skal du igen gå til Format Fejlstænger .
- Derefter ændres den Her tager vi bredden som 30 .
- Den vil forme kurven på følgende måde. Se skærmbilledet.
- Nu skal vi fjerne kurven, fordi vi skal tegne klokkekurven her.
- Klik på kurven for at slette den for at slette den.
- A Format Dataserie dialogboksen vises.
- I den Linje skal du vælge Ingen linje .
- Derefter skal du gå til Mærke mulighed.
- I den Mærke indstillinger, skal du vælge Ingen.
- Herefter er alle linjer og markører væk, men der er også nogle endepunkter derinde.
- Du kan fjerne dem ved at klikke på dem.
- Højreklik derefter på for at åbne Kontekstmenu .
- Derfra skal du vælge Slet for at fjerne alle endepunkterne.
- Resultatet er, at vi får det ønskede histogram fra vores datasæt.
- Herefter vender vi vores fokus mod klokkekurven.
- Før vi tegner klokkekurven, skal vi beregne den Gennemsnitlig , Standardafvigelse , og endnu vigtigere den Normalfordeling .
- I første omgang skal vi finde den Gennemsnitlig værdien af de studerendes karakterer ved hjælp af funktionen AVERAGE .
- Vælg, celle G16 .
- Skriv derefter følgende formel i formularfeltet.
=GENNEMSNIT(D5:D24)
- Tryk på Indtast for at anvende formlen.
- Dernæst skal vi beregne standardafvigelsen ved hjælp af funktionen STDEV.P
- For at gøre dette skal du først vælge celle G17 .
- Skriv følgende formel i formularfeltet.
=STDEV.P(D5:D24)
- Tryk på Indtast for at anvende formlen.
- Derefter skal vi beregne normalfordelingen for at fastlægge klokkekurven.
- Vi tager nogle værdier fra 11 til 40. Denne værdi er taget ved at studere histogrammet korrekt.
- Derefter ønsker vi at finde normalfordelingen for de tilsvarende værdier.
- For at bestemme normalfordelingen ved hjælp af funktionen NORM.DIST .
- Vælg derefter celle C28 .
- Skriv derefter følgende formel ned i formularboksen. Her skal vi skalere normalfordelingen i forhold til histogramgrafen. Derfor bruger vi 122.
=NORM.DIST(B28,$G$16,$G$17,FALSE)*122
- Tryk på Indtast for at anvende formlen.
- Træk derefter den Håndtag til påfyldning ikonet længere nede i kolonnen.
- Nu kan vi tilføje klokkekurven til histogramkurven.
- For at gøre dette skal du vælge det histogramdiagram, der blev lavet tidligere. Det vil åbne den Design af diagrammer
- Derefter, fra den Data gruppe, klik på Vælg data .
- A Vælg datakilde dialogboksen vises.
- Vælg derefter Tilføj for at indsætte nye serier.
- Vælg X- og Y-værdiinterval af celler i dialogboksen Rediger serie.
- I Y-serien indstiller vi normalfordelingen, mens vi i X-serien indstiller værdierne.
- Endelig skal du klikke på OK .
- Det vil tilføje som Serie 2 i dialogboksen Vælg datakilde.
- Klik derefter på OK .
- Derefter skal du gå til Design af diagrammer og Vælg Ændre diagramtype fra den Type gruppe.
- Vælg derefter den Spredning se skærmbilledet
- Derefter skal du klikke på OK .
- Det vil give klokkekurven sammen med histogrammet. Men her er kurvelinjen i stiplet format.
- Vi er nødt til at lave den som en fast linje.
- Dobbeltklik nu på den stiplede kurve, og den Format Dataserie dialogboksen vises.
- I den Linje skal du vælge Gennemgående linje .
- Derefter skal du ændre Farve .
- Her har vi vores endelige resultat af et histogram med en klokkekurve for elevernes karakterer.