Tartalomjegyzék
A kiugró értékek azonosítására szükség lehet ahhoz, hogy statisztikai számításokat végezhessünk egy adathalmaz adatain. A Microsoft Excel segítségével számos módon fedezhet fel kiugró értékeket hatalmas adathalmazokból. Ebben a bejegyzésben öt különböző módon mutatjuk be, hogyan lehet a kiugró értékeket kiszámítani a Microsoft Excelben.
Gyakorlati munkafüzet letöltése
Az ingyenes Excel munkafüzetet letöltheti innen, és saját maga is gyakorolhatja.
Kiugró értékek keresése.xlsx5 praktikus megközelítés a kiugró értékek kiszámításához Excelben
Outliers olyan adatértékek, amelyek jelentősen eltérnek az adathalmaz többi adatértékétől. Más szóval, a kiugró értékek rendkívüli értékek. Ezek vagy kivételesen magas vagy túlzottan alacsony egy adathalmaz más értékeivel összehasonlítva. A kiugró értékek megtalálása létfontosságú a statisztikai számítások során, mivel hatással van az adatelemzésünk megállapításaira.
Például van egy adatkészlete, amely tizenkét ember napi jövedelmét mutatja. Most a Microsoft Excel segítségével ki kell számolnia a kiugró értékeket. Itt öt egyszerű megközelítést mutatok ehhez.
1. Használja a Rendezés és a Bélyegzőt; Szűrés a kiugró értékek kiszámításához az Excelben
A kiugró értékeket egy kis adathalmazból is kiszámíthatod, ha a Rendezés és szűrés parancsot az Excelben. Ha a rendezési és szűrési funkció segítségével szeretné kiszámítani a kiugró értékeket, akkor az alábbi lépések szerint teheti meg.
1. lépés:
- Először is, válassza ki az excel adatállományában azt az oszlopfejlécet, amelyet rendezni szeretne. Például az adott adatállományban a fájlban az oszlopfejléc neve Napi jövedelem (Cell C40 van kiválasztva).
2. lépés:
- Ezután nyomja meg a Home lapot a szalagról, és lépjen a Szerkesztés csoport.
3. lépés:
- Ezt követően a Szerkesztési csoport kattintson a Rendezés és szűrés parancsot, és kattintson a Custom Rendezés .
4. lépés:
- Ezután egy új párbeszédpanel jelenik meg Rendezés A felugró párbeszédpanelen válassza ki a Napi Jövedelem a Rendezés legördülő és A legkisebbtől a legnagyobbig a Sorrend legördülő menüben. Ezután kattintson a OK .
5. lépés:
- Végül a Napi jövedelem oszlopot a megadott módon rendezné, a legalacsonyabb értékeket a tetején, a legnagyobb értékeket pedig az alján. Az eljárás lefuttatása után keressen szabálytalanságokat az adatsorban, hogy megállapítsa a kiugró értékeket.
Például az oszlop első két értéke lényegesen alacsonyabb, az oszlop utolsó két értéke pedig lényegesen magasabb, mint az adathalmaz többi értéke, amint az a fenti eredményben is látható.
Bővebben: Hogyan lehet megtalálni a kiugró értékeket az Excel regressziós elemzésében (3 egyszerű módja)
2. Alkalmazza a QUARTILE funkciót a kiugró értékek kiszámításához az Excelben
A QUARTILE funkció megközelítés egy tudományosabb módja a kiugró értékek kiszámításának az Excelben. Ezzel a függvénnyel négy egyenlő részre oszthatja adathalmazait. A következő értékeket adja vissza a a QUARTILE funkció :
- A minimum érték.
- A 1. kvartilis (Q1- egy adott adathalmaz legalacsonyabb 25%-a).
- A 2. kvartilis (Q2 - az adathalmaz legalacsonyabb 25%-a).
- A 3. kvartilis (Q3 - az adatállomány második legmagasabb 25%-a).
- A maximum érték.
A szintaxis a a QUARTILE funkció az Excelben:
=QUARTILE(tömb,quart)
A szintaxis a következő argumentumokat tartalmazza:
- a rray : az adott adatkészlet azon cellatartománya, amelyre vonatkozóan a kvartilis értékét ki fogja számítani.
- kvart: Ez határozza meg, hogy melyik értéket kell visszaadni.
A kiugró értékek kiszámításához a fenti adatkészlet esetében a következők használatával a QUARTILE funkció, kövesse az alábbi lépéseket.
1. lépés:
- Először is, írja be a következő képletet a következők meghatározásához 1. kvartilis ( Q1 ) az alábbiakban adjuk meg.
=QUARTILE($C$5:$C$16,1)
2. lépés:
- Itt is a képlet kiszámításához a 3. kvartilis ( Q3 ) az alábbiakban adjuk meg.
=QUARTILE($C$5:$C$16,3)
3. lépés:
- Harmadszor, meg kell határoznia a IQR, amely a Inter-kvartilis tartomány (ez jelenti 50% az adott adatok egy olyan adatsorból, amely az első és a harmadik kvartilisbe esik) kivonásával. Q1 (cellában G4 ) a Q3 (cellában G5 ). Írja be a következő képletet a kivonás kiszámításához.
=G5-G4
4. lépés:
- Miután megtaláltuk IQR, ezután meg kell határoznia a felső és alsó Mert a felső és alsó határérték tartalmazná az adathalmazon belüli adatok többségét. Írja fel a következő képletet a felső határérték kiszámításához.
=G5+(1,5*G6)
5. lépés:
- Ezután az alsó határ kiszámításához írja fel a következő képletet.
=G4-(1,5*G6)
6. lépés:
- Végül, miután befejezte az előző lépést, meghatározhatja az egyes adatértékek kiugró értékeit. Az excel munkalapon írja be a következő képletet a következővel a VAGY funkció cellában D5 .
=OR(C5$G$7)
- Ez a képlet segít azonosítani azokat az adatokat, amelyek nem tartoznak a fent említett tartományhatárba. A feldolgozás után a képlet egy TRUE nyilatkozat ha az adott adat kiugró és HAMIS ha nem. Kattintson duplán a címre. a AutoFill eszköz a cellában C5 másoláshoz a képletet a többi cellára a C oszlop Így az adathalmaz összes kiugró értéke mellett egy Igaz értéket figyelhet meg.
3. Az AVERAGE és STDEV.P függvények kombinálása a kiugró értékek kiszámításához az átlagból és a szórásból
A szórás (vagy σ ) egy olyan mérőszám, amellyel meghatározható, hogy az adatok mennyire oszlanak el a teljes adathalmaz átlagértékéhez képest. Az adatok az átlag körül csoportosulnak, ha a szórás alacsony, míg az adatok jobban szétszóródnak, ha a szórás magas. A kiugró értékek kiszámításához a Átlag és Standard eltérés a következő lépéseket követheti.
1. lépés:
- Először is, használja ugyanazt az adatkészletet, amely a cikk elején látható, majd számítsa ki az átlagot és a szórást. Az átlag kiszámításához írja be a következő képletet a következővel együtt az AVERAGE funkció cellában G5 .
=ÁTLAG(C5:C16)
2. lépés:
- A szórás kiszámításához a következő képletet kell beilleszteni a következővel az STDEV.P függvény cellában G6 .
=STDEV.P(C5:C16)
3. lépés:
- Ezután kiszámítja a folyamat további előrehaladásának felső határát. A cellában G7 , az alsó határértéket a következő képlet segítségével számítsa ki.
=G5-(1,25*G6)
4. lépés:
- És a cellában G8 a felső határértéket a következő képlet alapján kell kiszámítani
=G5+(1,5*G6)
5. lépés:
- Ezután, hogy kiszámítsa, hogy vannak-e kiugró értékek vagy sem, írja be a következő képletet a cellába D5 .
=OR(C5$G$8)
- Így a képlet egy TRUE értéket, ha a kívánt cellában lévő konkrét adat kiugró és HAMIS.
- Kattintson duplán a címre. a AutoFill eszköz a cellában D5 hogy a képletet átmásolja a többi cellába a D oszlop Így megtudhatja az összes fennmaradó kiugró értéket az adathalmazban.
Bővebben: Hogyan lehet megtalálni a kiugró értékeket az Excel szabványos eltéréssel (gyors lépésekkel)
4. Z-pontszám beillesztése a kiugró értékek kiszámításához Excelben
A Z-pontszám az egyik leggyakrabban használt mérőszám a kiugró értékek azonosítására. Ez a módszer azt mutatja meg, hogy egy adott adat mennyire tér el egy adathalmaz átlagától annak szórása tekintetében. A kiugró értékek kiszámításához a Z-pontszám Excelben az alábbiakban leírt lépéseket láthatja.
1. lépés:
- Először is, vegye a kívánt adathalmazt.
2. lépés:
- Másodszor, a cellában H5, írja be a következő képletet a átlagos az adott adatokra.
=ÁTLAG(C5:C16)
3. lépés:
- Harmadszor, számítsa ki a szórás az adott adatkészlet cellájában H6 a következő képlet segítségével.
=STDEV.P(C5:C16)
4. lépés:
- Ezután meg kell határoznia a Z -score Ehhez az alábbi képletet használja.
=(C5-$H$5)/$H$6
5. lépés:
- Miután kiszámította az összes Z-értékek, látni fogja, hogy a Z-értékek a következők között van -1.44 és 13 Tehát a következő értékeket vesszük figyelembe Z-pontszám kisebb, mint -1,2 vagy nagyobb, mint +1.8 a kiugró határértékek esetében.
- Ezután írja be a következő képletet a cellába E 5 .
=OR((D51.8))
- Végül a képlet egy TRUE értéket, ha az adott adat kiugró, és visszaadja a HAMIS
- Kattintson duplán a címre. a cellán E5 a AutoFill eszköz kitöltési fogantyúja a képlet másolásához a többi cellába a E oszlop Így megtalálhatja az összes fennmaradó kiugró értéket az adathalmazban.
Bővebben: Hogyan lehet megtalálni a kiugró értékeket az Excel Z Score használatával (gyors lépésekkel)
5. A LARGE és SMALL függvények egyesítése a kiugró értékek kereséséhez az Excelben
A LARGE funkció és a SMALL funkció az Excelben ellentétes műveletekkel rendelkezik. Arra fogjuk használni, hogy megtaláljuk a legnagyobb és a legkisebb adatot, illetve értéket egy adathalmazban. Ez a függvény kihúzza az összes adatot egy adathalmazon belül, megtalálva a legkisebb és a legnagyobb számot. Képesek megtalálni a második legkisebb vagy legnagyobb, a harmadik legnagyobb vagy legkisebb és így tovább.
1. lépés:
- Először is, használja a következő képletet a cellában E5 a címen a LARGE funkció .
=LARGE($C$5:$C$16,1)
- Így a 12 értékek, láthatjuk az 1. legnagyobb értéket, ami 780 .
2. lépés:
- Ezután a cellában G5 , írja le a következő képletet a legkisebb érték megtalálásához.
=SMALL($C$5:$C$16,1)
- Végül, a 12 értékek, láthatja a 1. legkisebb érték 110 .
- Ha az összes szükséges értéket megtalálta, akkor könnyedén rámutathat az adathalmazban található kiugró értékekre.
Következtetés
Ez a cikk vége. Remélem, hasznosnak találja ezt a cikket. Miután elolvasta ezt a cikket, képes lesz kiszámítani a kiugró értékeket az Excelben bármelyik módszerrel. Kérjük, ossza meg velünk további kérdéseit vagy ajánlásait az alábbi megjegyzések részben.