સામગ્રીઓનું કોષ્ટક
ડેટા સેટમાંથી ડેટા પર આંકડાકીય ગણતરી કરવા માટે આઉટલીયર્સને ઓળખવાની જરૂર પડી શકે છે. તમે અસંખ્ય રીતે Microsoft Excel નો ઉપયોગ કરીને વિશાળ ડેટાસેટ્સમાંથી આઉટલાયર્સ શોધી શકો છો. આ પોસ્ટમાં, અમે તમને બતાવીશું કે માઇક્રોસોફ્ટ એક્સેલમાં પાંચ અલગ-અલગ રીતોનો ઉપયોગ કરીને કેવી રીતે આઉટલાયર્સની ગણતરી કરવી.
પ્રેક્ટિસ વર્કબુક ડાઉનલોડ કરો
તમે અહીંથી ફ્રી એક્સેલ વર્કબુક ડાઉનલોડ કરી શકો છો અને તમારી જાતે પ્રેક્ટિસ કરી શકો છો. .
Find Outliers.xlsx
એક્સેલમાં આઉટલાયર્સની ગણતરી કરવા માટે 5 હેન્ડી એપ્રોચ્સ
આઉટલિયર્સ ડેટા મૂલ્યો છે જે ડેટાસેટમાંના બાકીના ડેટા મૂલ્યોથી નોંધપાત્ર રીતે અલગ છે. આઉટલિયર્સ, બીજા શબ્દોમાં કહીએ તો, અસાધારણ મૂલ્યો છે. ડેટા સેટમાં અન્ય મૂલ્યોની સરખામણીમાં તેઓ ક્યાં તો અપવાદરૂપે ઉચ્ચ અથવા અતિશય નીચા છે. આંકડાકીય ગણતરીઓમાં આઉટલાયર્સ શોધવું મહત્વપૂર્ણ છે કારણ કે તે અમારા ડેટા વિશ્લેષણના તારણો પર અસર કરે છે.
ઉદાહરણ તરીકે, તમારી પાસે બાર લોકોની દૈનિક આવક દર્શાવતો ડેટા સેટ છે. હવે, તમારે માઈક્રોસોફ્ટ એક્સેલનો ઉપયોગ કરીને આઉટલાયર્સની ગણતરી કરવાની જરૂર છે. અહીં, હું તમને આમ કરવા માટેના પાંચ સરળ અભિગમો બતાવીશ.
1. Sort & એક્સેલમાં આઉટલાયર્સની ગણતરી કરવા માટે ફિલ્ટર કરો
તમે સૉર્ટ કરો & એક્સેલમાં આદેશને ફિલ્ટર કરો. જો તમે સૉર્ટ અને ફિલ્ટર ફંક્શનનો ઉપયોગ કરીને આઉટલાયર્સની ગણતરી કરવા માંગો છો, તો તમે તેને અનુસરીને કરી શકો છોનીચેનાં પગલાં.
પગલું 1:
- સૌપ્રથમ, તમારા એક્સેલના ડેટાસેટમાં કૉલમ હેડર પસંદ કરો જેને તમે સૉર્ટ કરવા માંગો છો. ઉદાહરણ તરીકે, આપેલ ડેટા સેટમાં, દૈનિક આવક નામની ફાઇલ કૉલમ હેડરમાં (સેલ C40 પસંદ કરેલ છે).
સ્ટેપ 2:
- પછી, હોમ <7 દબાવો> રિબન પર ટેબ કરો અને એડિટિંગ જૂથ પર જાઓ.
પગલું 3:
- તે પછી, સંપાદન જૂથ માં સૉર્ટ કરો & આદેશને ફિલ્ટર કરો અને કસ્ટમ સૉર્ટ પર ક્લિક કરો.
સ્ટેપ 4:
- પછી, સોર્ટ નામનું નવું સંવાદ બોક્સ ખુલશે. પોપ-અપ ડાયલોગ બોક્સમાં, સૉર્ટ બાય માં દૈનિક આવક પસંદ કરો> ડ્રોપ-ડાઉન અને ઑર્ડર ડ્રોપ-ડાઉનમાં સૌથી નાનાથી મોટા . તે પછી, ઓકે પર ક્લિક કરો.
પગલું 5:
<13
ઉદાહરણ તરીકે, કૉલમમાં પ્રથમ બે મૂલ્યો નોંધપાત્ર રીતે ઓછા છે અને કૉલમમાં છેલ્લા બે મૂલ્યો ડેટા સેટમાંના બાકીના મૂલ્યો કરતાં નોંધપાત્ર રીતે વધારે છે, જેમ કેઉપરોક્ત પરિણામ.
વધુ વાંચો: એક્સેલમાં રીગ્રેસન એનાલિસિસમાં આઉટલાયર કેવી રીતે શોધવું (3 સરળ રીતો)
2. આના પર QUARTILE ફંક્શન લાગુ કરો એક્સેલમાં આઉટલાયર્સની ગણતરી કરો
ક્વાર્ટીલ ફંક્શન એપ્રોચ એ એક્સેલમાં આઉટલાયર્સની ગણતરી કરવાની વધુ વૈજ્ઞાનિક રીત છે. તમે તમારા ડેટા સેટને ચાર સમાન ભાગોમાં વિભાજીત કરવા માટે આ ફંક્શનનો ઉપયોગ કરી શકો છો. નીચેના મૂલ્યો QUARTILE ફંક્શન દ્વારા પરત કરવામાં આવશે:
- ન્યૂનતમ મૂલ્ય.
- આ પ્રથમ ચતુર્થાંશ (Q1- આપેલ ડેટાસેટનો સૌથી ઓછો 25%).
- ધ બીજો ચતુર્થાંશ (Q2-આગલો ડેટાસેટનો સૌથી ઓછો 25%).
- ત્રીજો ચતુર્થાંશ (Q3- ડેટાસેટનો બીજો સૌથી વધુ 25%).
- આ <6 મહત્તમ મૂલ્ય.
એક્સેલમાં QUARTILE ફંક્શન નું સિન્ટેક્સ છે:
=QUARTILE( array,quart)
વાક્યરચના નીચેની દલીલો ધરાવે છે:
- a રે : આપેલ કોષ શ્રેણી ડેટા સેટ જેના માટે તમે ચતુર્થાંશ મૂલ્યની ગણતરી કરશો.
- ક્વાર્ટ: આ સ્પષ્ટ કરે છે કે કઈ કિંમત પરત કરવી જોઈએ.
<22
ઉપરના ડેટાસેટ માટે QUARTILE ફંક્શન નો ઉપયોગ કરીને આઉટલાયર્સની ગણતરી કરવા માટે, નીચેના પગલાંઓ અનુસરો.
પગલું 1:
- સૌપ્રથમ, 1મું ચતુર્થાંશ ( Q1 ) નક્કી કરવા માટે નીચે આપેલ સૂત્ર ટાઈપ કરો.
=QUARTILE($C$5:$C$16,1)
પગલું 2:
- અહીંફરીથી, ત્રીજા ચતુર્થાંશ ( Q3 )ની ગણતરી કરવા માટેનું સૂત્ર નીચે આપેલ છે.
=QUARTILE($C$5:$C$16,3)
પગલું 3:
- ત્રીજું, તમારે IQR, જે નક્કી કરવું પડશે આંતર-ચતુર્થાંશ શ્રેણી (તે પ્રથમ અને ત્રીજા ચતુર્થાંશમાં આવતા ડેટા સેટની શ્રેણીમાંથી આપેલ ડેટાના 50% નું પ્રતિનિધિત્વ કરે છે) Q1 બાદ કરીને (સેલમાં G4 ) Q3 માંથી (કોષ G5 ). બાદબાકીની ગણતરી કરવા માટે નીચેનું સૂત્ર ટાઈપ કરો.
=G5-G4
પગલું 4:
- IQR શોધ્યા પછી, આગળ તમારે ઉપલા ને નિર્ધારિત કરવું પડશે અને નીચલી કારણ કે ઉપલા અને નીચલી મર્યાદામાં મોટાભાગનો ડેટા હશે ડેટા સેટ. ઉપલી મર્યાદાની ગણતરી કરવા માટે નીચેનું સૂત્ર લખો.
=G5+(1.5*G6)
પગલું 5:
- પછી, નીચી મર્યાદાની ગણતરી કરવા માટે, નીચેનું સૂત્ર લખો.
=G4-(1.5*G6)
પગલું 6:
- આખરે, પાછલું પગલું પૂર્ણ કર્યા પછી, તમે દરેક ડેટા માટે આઉટલાયર નક્કી કરી શકો છો મૂલ્ય એક્સેલ વર્કશીટમાં, સેલ D5 માં OR ફંક્શન સાથે નીચેનું સૂત્ર ટાઇપ કરો.
=OR(C5$G$7)
- આ ફોર્મ્યુલા એ ડેટાને ઓળખવામાં મદદ કરશે જે ઉપરોક્ત શ્રેણી મર્યાદામાં આવતા નથી. પ્રક્રિયા કર્યા પછીજો ચોક્કસ ડેટા આઉટલીયર હોય તો ફોર્મ્યુલા TRUE સ્ટેટમેન્ટ અને જો તે ન હોય તો FALSE બતાવશે. બાકીના કોષોમાં ફોર્મ્યુલાની નકલ કરવા માટે કોષમાં ઓટોફિલ ટૂલ C5 પર ડબલ-ક્લિક કરો. કૉલમ C માં. આમ, તમે તમારા ડેટાસેટમાં તમામ આઉટલાયર્સની બાજુમાં સાચું મૂલ્ય અવલોકન કરી શકો છો.
3. સરેરાશ અને માનક વિચલન
A થી આઉટલાયર્સની ગણતરી કરવા માટે AVERAGE અને STDEV.P ફંક્શન્સને જોડો. માનક વિચલન (અથવા σ ) એ સમગ્ર ડેટા સેટના સરેરાશ મૂલ્યના સંદર્ભમાં ડેટા કેવી રીતે વિતરિત કરવામાં આવે છે તે નિર્ધારિત કરવા માટેનું મેટ્રિક છે. જ્યારે પ્રમાણભૂત વિચલન ઓછું હોય ત્યારે ડેટાને સરેરાશની આસપાસ જૂથબદ્ધ કરવામાં આવે છે, જ્યારે પ્રમાણભૂત વિચલન વધારે હોય ત્યારે ડેટા વધુ ફેલાય છે. મીન અને સ્ટાન્ડર્ડ ડેવિએશન નો ઉપયોગ કરીને આઉટલાયર્સની ગણતરી કરવા માટે તમે નીચેના સ્ટેપ્સ ફોલો કરી શકો છો.
પગલું 1:
- પ્રથમ, આ લેખની શરૂઆતમાં બતાવેલ સમાન ડેટાસેટનો ઉપયોગ કરો અને પછી સરેરાશ અને પ્રમાણભૂત વિચલનની ગણતરી કરો. સરેરાશની ગણતરી કરવા માટે, સેલ G5 માં AVERAGE ફંક્શન સાથે નીચેનું સૂત્ર ટાઇપ કરો.
=AVERAGE(C5:C16)
પગલું 2:
- માનક વિચલનની ગણતરી કરવા માટે, નીચે આપેલ સૂત્રને STDEV સાથે દાખલ કરો .P ફંક્શન સેલમાં G6 .
=STDEV.P(C5:C16)
પગલું 3:
- આગળ, તમે ગણતરી કરશોપ્રક્રિયામાં વધુ પ્રગતિ માટે ઉપલી મર્યાદા. સેલ G7 માં, નીચેના સૂત્રનો ઉપયોગ કરીને નીચલી મર્યાદાની ગણતરી કરો.
=G5-(1.25*G6)
પગલું 4:
- અને સેલમાં G8 નીચેના સૂત્રમાંથી ઉપલી મર્યાદાની ગણતરી કરો
=G5+(1.5*G6)
પગલું 5:
- તે પછી , કોઈપણ આઉટલાઈર અસ્તિત્વમાં છે કે નહીં તેની ગણતરી કરવા માટે, સેલ D5 માં નીચેનું સૂત્ર ટાઈપ કરો.
=OR(C5$G$8)
- આમ, ફોર્મ્યુલા TRUE મૂલ્ય આપશે જો ઇચ્છિત કોષમાં ચોક્કસ ડેટા આઉટલીયર હોય અને ખોટું.
- સેલમાં ઓટોફિલ ટૂલ D5 પર ડબલ-ક્લિક કરો કૉલમ D માં બાકીના કોષોમાં સૂત્રની નકલ કરવા માટે. આમ, તમે તમારા ડેટાસેટમાં બાકીના તમામ આઉટલાયર્સ શોધી શકો છો.
વધુ વાંચો: એક્સેલમાં સ્ટાન્ડર્ડ ડેવિએશન (ઝડપી પગલાઓ સાથે) સાથે આઉટલાયર્સ કેવી રીતે શોધશો
4. એક્સેલમાં આઉટલાયર્સની ગણતરી કરવા માટે Z-સ્કોર દાખલ કરો
Z-સ્કોર માટે સૌથી વધુ ઉપયોગમાં લેવાતા મેટ્રિક્સમાંનું એક છે બાહ્ય લોકોની ઓળખ. આ પદ્ધતિ દર્શાવે છે કે કોઈ ચોક્કસ ડેટા તેના પ્રમાણભૂત વિચલનના સંદર્ભમાં ડેટાસેટના સરેરાશથી કેટલો દૂર છે. એક્સેલમાં Z-સ્કોર નો ઉપયોગ કરીને આઉટલાયર્સની ગણતરી કરવા માટે તમે નીચે વર્ણવેલ પગલાં જોઈ શકો છો.
પગલું 1:
- સૌપ્રથમ, ઇચ્છિત ડેટા સેટ લો.
પગલાં2:
- બીજું, સેલ H5, માં મીન ની ગણતરી માટે નીચેનું સૂત્ર ટાઈપ કરો 7>આપેલા ડેટા માટે.
=AVERAGE(C5:C16)
પગલું 3:
- ત્રીજું, નીચેના સૂત્રનો ઉપયોગ કરીને સેલ H6 માં આપેલ ડેટાસેટના માનક વિચલન ની ગણતરી કરો.
=STDEV.P(C5:C16)
પગલું 4:
- તે પછી , તમારે દરેક ડેટા મૂલ્ય માટે Z -સ્કોર નક્કી કરવું પડશે. આ કરવા માટે તમે નીચે આપેલ ફોર્મ્યુલાનો ઉપયોગ કરો છો.
=(C5-$H$5)/$H$6
પગલું 5:
- તમામ Z-મૂલ્યોની ગણતરી કર્યા પછી, તમે જોશો કે Z-મૂલ્યો ની શ્રેણી> -1.44 અને 13 વચ્ચે છે. તેથી, અમે બહારની મર્યાદા માટે Z-સ્કોર -1.2 કરતાં ઓછા અથવા +1.8 કરતાં વધુ મૂલ્યોને ધ્યાનમાં લઈએ છીએ.
- પછી, નીચેના સૂત્રને સેલમાં ટાઈપ કરો E 5 .
=OR((D51.8))
<39
- આખરે, ફોર્મ્યુલા TRUE મૂલ્ય આપશે જો ચોક્કસ ડેટા આઉટલીયર હશે અને તે FALSE <9 પરત કરશે ઓટોફિલનો ઉપયોગ કરવા માટે
- સેલ E5 પર ડબલ-ક્લિક કરો કૉલમ E માં બાકીના કોષોમાં ફોર્મ્યુલાની નકલ કરવા માટે ટૂલ ફિલ હેન્ડલ. આમ, તમે તમારા ડેટાસેટમાં બાકીના તમામ આઉટલાયર્સ શોધી શકો છો.
વધુ વાંચો: એક્સેલમાં ઝેડ સ્કોરનો ઉપયોગ કરીને આઉટલાયર્સ કેવી રીતે શોધશો (ક્વિક સાથેસ્ટેપ્સ)
5. એક્સેલમાં આઉટલાયર્સ શોધવા માટે મોટા અને નાના ફંક્શનને મર્જ કરો
LARGE ફંક્શન અને SMALL ફંક્શન Excel માં વિરોધી કામગીરી છે. અમે તેનો ઉપયોગ ડેટા સેટમાં અનુક્રમે સૌથી મોટો અને સૌથી નાનો ડેટા અથવા મૂલ્યો શોધવા માટે કરીશું. આ ફંક્શન ડેટા સેટની અંદરના તમામ ડેટાને ખેંચશે, સૌથી નાની અને સૌથી મોટી સંખ્યાઓ શોધશે. તેઓ બીજું સૌથી નાનું કે સૌથી મોટું, ત્રીજું સૌથી મોટું કે સૌથી નાનું વગેરે શોધવામાં સક્ષમ છે.
પગલું 1:
- સૌપ્રથમ, LARGE ફંક્શન સાથે સેલ E5 માં નીચેના સૂત્રનો ઉપયોગ કરો.
=LARGE($C$5:$C$16,1)
-
- આ રીતે, 12 મૂલ્યોમાંથી, તમે 1લી સૌથી મોટી કિંમત જોઈ શકો છો જે <6 છે 780 .
પગલું 2:
<13 =SMALL($C$5:$C$16,1)
- છેલ્લે, 12 મૂલ્યોમાંથી, તમે 1 લી જોઈ શકો છો સૌથી નાની કિંમત 110 .
- એકવાર તમે બધા જરૂરી મૂલ્યો શોધી લો, પછી તમે ડેટાસેટમાં કોઈપણ આઉટલાયરને સરળતાથી નિર્દેશ કરી શકો છો.
નિષ્કર્ષ
તે આ લેખનો અંત છે. મને આશા છે કે તમને આ લેખ ઉપયોગી લાગશે. આ લેખ વાંચ્યા પછી, તમે કોઈપણ પદ્ધતિઓનો ઉપયોગ કરીને એક્સેલમાં આઉટલાયર્સની ગણતરી કરી શકશો. કૃપા કરીને કોઈપણ વધુ પ્રશ્નો અથવા ભલામણો સાથે શેર કરોઅમને નીચેના ટિપ્પણીઓ વિભાગમાં.