Abaterea standard vs media
În statisticile descriptive și inferențiale, sunt folosiți mai mulți indici pentru a descrie un set de date corespunzător tendinței sale centrale, dispersiei și asimetriei. În inferența statistică, aceștia sunt cunoscuți în mod obișnuit ca estimatori, deoarece estimează valorile parametrilor populației.
Tendința centrală se referă la și localizează centrul distribuției valorilor. Media, modul și mediana sunt indicii cei mai frecvent utilizați în descrierea tendinței centrale a unui set de date. Dispersia este cantitatea de răspândire a datelor din centrul distribuției. Intervalul și abaterea standard sunt cele mai frecvent utilizate măsuri de dispersie. Coeficienții de asimetrie ai lui Pearson sunt utilizați pentru a descrie asimetria unei distribuții de date. Aici, asimetria se referă la faptul că setul de date este sau nu simetric față de centru și, dacă nu, cât de înclinat este.
Ce inseamna?
Media este cel mai frecvent utilizat indice de tendință centrală. Având în vedere un set de date, media se calculează luând suma tuturor valorilor datelor și apoi împărțind-o la numărul de date. De exemplu, greutățile a 10 persoane (în kilograme) sunt măsurate la 70, 62, 65, 72, 80, 70, 63, 72, 77 și 79. Atunci greutatea medie a celor zece persoane (în kilograme) poate fi calculate astfel. Suma greutăților este 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Media = (sumă) / (numărul de date) = 710/10 = 71 (în kilograme).
Ca și în acest exemplu particular, valoarea medie a unui set de date poate să nu fie un punct de date al setului, dar va fi unică pentru un set de date dat. Media va avea aceleași unități ca datele originale. Prin urmare, poate fi marcat pe aceeași axă ca și datele și poate fi utilizat în comparații. De asemenea, nu există restricții de semn pentru media unui set de date. Poate fi negativ, zero sau pozitiv, deoarece suma setului de date poate fi negativă, zero sau pozitivă.
Ce este abaterea standard?
Abaterea standard este cel mai frecvent utilizat indice de dispersie. Pentru a calcula abaterea standard, mai întâi sunt calculate abaterile valorilor datelor de la medie. Media pătrată rădăcină a abaterilor se numește abaterea standard.
În exemplul anterior, abaterile respective de la medie sunt (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 și (79-71) = 8. Suma de pătratele deviației sunt (-1) 2+ (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366 Abaterea standard este √ (366/10) = 6,05 (în kilograme). Din aceasta, se poate concluziona că majoritatea datelor se află în intervalul 71 ± 6,05, cu condiția ca setul de date să nu fie foarte înclinat și este într-adevăr așa în acest exemplu particular.
Deoarece deviația standard are aceleași unități ca și datele originale, ne oferă o măsură a cât de mult sunt deviate datele de la centru; cu cât deviația standard este mai mare cu cât dispersia este mai mare. De asemenea, abaterea standard va fi o valoare non-negativă, indiferent de natura datelor din setul de date.
Care este diferența dintre deviația standard și medie? • Abaterea standard este o măsură a dispersiei din centru, în timp ce media măsoară locația centrului unui set de date. • Abaterea standard este întotdeauna o valoare non-negativă, dar media poate lua orice valoare reală. |