Tartalomjegyzék
A kiugró értékek megtalálása és eltávolítása nagyon gyakori feladat az adatok elemzése során a statisztikában, az adatbányászatban, a gépi tanulásban stb. Sokféleképpen lehet kiugró értékeket találni az adatállományban, de az eltávolításuk folyamata nem olyan egyszerű. Ebben a cikkben megmutatjuk, hogyan kell a kiugró értékek eltávolítása Excelben .
Munkafüzet letöltése
Az ingyenes gyakorló Excel munkafüzetet innen töltheti le.
Kiugró értékek eltávolítása.xlsxMik a kiugró értékek az Excelben?
Egy outlier az az érték, amely messze elmarad az adathalmaz átlagától vagy mediánjától. Más szóval, a kiugró értékek olyan értékek, amelyek jelentősen magasabbak vagy alacsonyabbak, mint az adathalmaz többi értéke.
Gondoljon egy krikettmeccsre, ahol minden ütőjátékos 50 pont körüli eredményt ért el, de csak egy ütőjátékos ért el száz pontot (100), egy másik ütőjátékos pedig 0-nál kiesett. Ez a 100 és 0 pont a mérkőzés kiugró értéke.
A kiugró értékek problémásak, mivel elferdíthetik az adatelemzés eredményét, és félrevezető eredményeket hozhatnak. Ezért jobb, ha megtaláljuk a kiugró értékeket, és eltávolítjuk őket, hogy sima adatállományt kapjunk.
3 módja a kiugró értékek eltávolításának Excelben
Ebben a részben megtanulhatja, hogyan kell a kiugró értékek törlése A kiugró értékek eltávolítása trükkös folyamat, ezért olvassa el figyelmesen az egész cikket.
1. Az Excel-funkció felhasználása az átlag kiszámításához kiugró értékek nélkül
Excel TRIMMEAN funkció egy adott adathalmaz átlagának kiszámítására használható, a kiugró értékek kizárásával. A kizárandó adatpontokat százalékos formában kell megadni. A százalékos értéket tizedes vagy százalékos formátumban lehet megadni.
A kiugró értékek nélküli átlag kiszámításához a következő szintaxis szükséges,
=TRIMMEAN(tömb, százalék)Tessék,
- array = A vágandó adatok tartománya és az átlagos eredmény kiszámítása
- százalék = A kizárandó adatpontok száma
Lássuk, hogyan lehet ezt a függvényt alkalmazni az eredmények kiszámításához eltávolított kiugró értékekkel.
Tekintsük a fenti képet. B5-B14-es cella Itt a legtöbb szám 20 és 27 között van, de két érték - 0 és 100 - messze elmaradnak ezektől az értékektől. Tehát ezek a kiugró értékek a mi adatállományunkban.
A mi adathalmazunk esetében az átlag (átlag) kiszámításának képlete a kiugró értékek nélkül az Excel segítségével TRIMMEAN funkciója,
=TRIMMEAN(B5:B14,0.2)
Tessék,
- B5:B14 = A vágandó adatok tartománya és az átlagos eredmény kiszámítása
- 0.2 (vagy 20%) = A kizárandó adatpontok száma
Ha az adathalmazban bármely szám 20%-kal eltér az adathalmaz többi részétől, akkor azt a számot kiugrónak nevezzük.
Ha megírja a képletet az adatkészletének megfelelően, és megnyomja a Írja be a címet. , akkor megkapja a számított átlag kiugró értékek nélkül a mi esetünkben, E6-os sejt a számított átlagot tartalmazza, amely 23.50 .
Hogy ellenőrizzük, hogy a válasz helyes-e vagy sem, futtatjuk a AVERAGE funkció a oldalon. E5 cella amely az átlagot adja vissza ( 28.80 ) az összes értéket a tartományban B5:B14 . És a E7-es sejt , futtatunk egy másik ÁLTALÁNOS függvény kézi bevitelével az összes cellát, kivéve azokat, amelyek a kiugró értékeket tartalmazzák, és a visszatérési eredmény a 23.50 eredményként.
Tehát azt mondhatjuk, hogy a TRIMMEAN függvény sikeresen eltávolíthatja a kiugró értékeket egy adott adathalmazból, miközben az Excelben kiszámítja az átlagot.
Bővebben: Hogyan lehet törölni a képletet az Excelben (7+ módszerek)
2. Kiugró értékek eltávolítása az Excel adathalmazból és vonaldiagramból
Figyeljük meg a következő képet. Van néhány adatunk, amelyek alapján készítettünk egy vonaldiagramot. A vonaldiagramból könnyen láthatjuk, hogy a a 4. és 8. adatpontok a mi kiugró értékeinket mutatják. .
Most megnézzük, hogyan simíthatjuk ki a vonaldiagramot a kiugró értékek eltávolításával az adathalmazból.
Egy másik cellában (esetünkben ez H6-os cella ), írjuk fel a következő képletet,
=IF(AND(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
Tessék,
- C6 = Az adatkészlet első adatát tartalmazó cella
- C5 = Az első adatcella feletti cella
- C7 = Az első adatcella alatti cella
- $E$6 = Adatpontok közötti különbség.
Az adatainkat vizsgálva úgy tűnik, hogy amikor egy adatpontot különbözik 10 egység a másoktól való eltérés, a következőként van kijelölve outlier . Így aztán 10 a oldalon. E6-os sejt és tegye azt egy Abszolút cellahivatkozás hogy ez a cella az egész adathalmaz átvizsgálása és kiszámítása során rögzített legyen.
Miután megnyomta a Írja be a címet. , láthatja, hogy az első adat még mindig megjelenik az eredménycellában. H6 Itt csak annyit kellett tennünk, hogy megalkotjuk a képletet, hogy a képletet a Töltse ki a fogantyút a képletnek a többi cellára való alkalmazásához.
Most húzza lefelé a sort a Töltse ki a fogantyút és látni fogja, hogy a cellák, amelyek a kiugró értékeket tartalmazták, most tele vannak #N/A .
És nézze meg a vonalas diagramot, ez most egy lapos grafikon, amelyben nincsenek kiugró értékek.
Képlet bontás
=IF(
Mivel olyan értékeket fogunk összehasonlítani, amelyek alapján az eredményt kivonjuk, ezért a képletet a IF feltétel.
=IF(AND(
Össze fogjuk hasonlítani az aktuális adatpontot és a fenti és az alatti cellát. És ha mindkét összehasonlítás igaz, csak akkor fogjuk megjeleníteni az adatpontot eredményként. Tehát, mivel "Mindkét" összehasonlítással kell foglalkoznunk, ezért használnunk kell a(z) AND funkció .
=IF(AND(ABS(
Amikor kivonjuk az adatpontokat, néhány adat negatív értékeket dobhat. És nem akarunk negatív értékekkel foglalkozni, mivel a negatív értékek mindig ellentmondanak az "adatok eltávolítása, ha a különbség 10" feltételnek. Így annak érdekében, hogy mindig pozitív eredményt kapjunk, az összehasonlításokat be kell csomagolnunk egy Abszolút érték függvény .
=IF(AND(AND(ABS(C6-C5)>$E$6
Itt kezdtük el az első összehasonlítást. Egyszerűen kivonjuk az aktuális értéket a fenti értékkel, és megnézzük, hogy az eredmény nagyobb-e, mint a különbség szintje, amit a E6-os sejt és a sejtet egy Abszolút referencia a cella értékének zárolva tartásához.
=IF(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6)
Ezután következik az összehasonlítás második része, amelyet vesszővel választunk el. Az aktuális adatpontot a következő adatponttal hasonlítja össze.
=IF(AND(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA()
Most vesszőt teszünk, és meghatározzuk, hogy a NA funkció ott, ha mind a ÉS függvények igazak.
=IF(AND(AND(ABS(C6-C5)>$E$6,ABS(C6-C7)>$E$6),NA(),C6)
És ha a ÉS függvény nem igaz, akkor az aktuális adatpontot akarjuk visszaadni, mint a IF Hamis érték. Tehát beírunk egy vesszőt, és átadjuk a cellahivatkozási számot. C6 ott bent.
Bővebben: Hogyan lehet eltávolítani az adatok érvényesítését az Excelben (5 mód)
Hasonló olvasmányok
- Hogyan lehet eltávolítani egy fejlécet az Excelben (4 módszer)
- Szúróvonalak eltávolítása Excelben (5 gyors módja)
- Hogyan lehet eltávolítani a rácsot az Excelből (6 egyszerű módszer)
- Határok eltávolítása Excelben (4 gyors módja)
- Hogyan távolítsa el a kompatibilitási módot az Excelben (2 egyszerű módja)
3. A kiugró értékek manuális eltávolítása Excelben
Egy másik egyszerű módja a kiugró értékek kiküszöbölésének az Excelben az, hogy egyszerűen rendezze az adatkészlet értékeit, és kézzel törölje belőle a felső és alsó értékeket.
Az adatok rendezése,
- Válassza ki a címet. az adatállományt.
- Menjen a Rendezés és szűrés a Szerkesztés csoportot, és válasszon Rendezés Legkisebbtől a legnagyobbig vagy Rendezés Legnagyobbtól a legkisebbig .
- A mi esetünkben a következőket választottuk Rendezés Legkisebbtől a legnagyobbig A program növekvő sorrendbe rendezte az adathalmazunkban lévő számokat, a legkisebbeket a tetejére, a legnagyobbakat pedig az aljára helyezve.
Most csak törölje kézzel ezeket az adatokat, hogy az adathalmaz szélsőséges értékeit szabaddá tegye.
Ezt az eljárást nem javasoljuk, ha nagy adathalmazzal dolgozol. Ha az adathalmazod kicsi és könnyebben áttekinthető, csak akkor alkalmazd ezt az eljárást, egyébként ne alkalmazd ezt az eljárást.
Bővebben: Hogyan lehet eltávolítani a rendezést az Excelben (3 egyszerű módszer)
Következtetés
Ez a cikk megmutatta, hogyan kell a kiugró értékek eltávolítása Excelben. Remélem, hogy ez a cikk nagyon hasznos volt az Ön számára. Nyugodtan kérdezzen, ha bármilyen kérdése van a témával kapcsolatban.