Abaterea standard vs. medie
În statisticile descriptive și inferențiale, mai mulți indici sunt utilizați pentru a descrie un set de date corespunzător tendinței sale centrale, dispersiei și asimetriei. În inferența statistică, aceștia sunt cunoscuți în mod obișnuit ca estimatori, deoarece estimează valorile parametrilor populației.
Tendința centrală se referă la și localizează centrul distribuției valorilor. Media, modul și mediana sunt cei mai des utilizați indici pentru a descrie tendința centrală a unui set de date. Dispersia este cantitatea de răspândire a datelor din centrul distribuției. Intervalul și abaterea standard sunt cele mai frecvent utilizate măsuri de dispersie. Coeficienții de asimetrie ai lui Pearson sunt utilizați în descrierea asimilității unei distribuții de date. Aici, asimetria se referă la dacă setul de date este simetric față de centru sau nu și, dacă nu, la cât de deformat este.
Ce înseamnă?
Media este cel mai frecvent utilizat indice de tendință centrală. Având în vedere un set de date, media este calculată luând suma tuturor valorilor datelor și apoi împărțind-o la numărul de date. De exemplu, greutățile a 10 persoane (în kilograme) sunt măsurate a fi 70, 62, 65, 72, 80, 70, 63, 72, 77 și 79. Atunci greutatea medie a celor zece persoane (în kilograme) poate fi calculat după cum urmează. Suma greutăților este 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Media=(suma) / (numărul de date)=710 / 10=71 (în kilograme).
Ca în acest exemplu particular, valoarea medie a unui set de date poate să nu fie un punct de date al setului, dar va fi unică pentru un anumit set de date. Mean va avea aceleași unități ca și datele originale. Prin urmare, poate fi marcat pe aceeași axă cu datele și poate fi folosit în comparații. De asemenea, nu există nicio restricție de semn pentru media unui set de date. Poate fi negativ, zero sau pozitiv, deoarece suma setului de date poate fi negativ, zero sau pozitiv.
Ce este abaterea standard?
Abaterea standard este indicele de dispersie cel mai frecvent utilizat. Pentru a calcula abaterea standard, mai întâi se calculează abaterile valorilor datelor de la medie. Media pătrată a abaterilor se numește abatere standard.
În exemplul anterior, abaterile respective de la medie sunt (70 – 71)=-1, (62-71)=-9, (65-71)=-6, (72-71)=1, (80-71)=9, (70-71)=-1, (63-71)=-8, (72-71)=1, (77-71)=6 și (79-71)=8. Suma pătratelor abaterii este (-1)2+ (-9)2+ (-6)2+ 1 2+92+ (-1)2+ (-8)2 + 12+ 62 + 82=366. Abaterea standard este √(366/10)=6,05 (în kilograme). Din aceasta, se poate concluziona că majoritatea datelor se află în intervalul 71±6.05, cu condiția ca setul de date să nu fie foarte denaturat și chiar așa este în acest exemplu particular.
Deoarece abaterea standard are aceleași unități ca și datele originale, ne oferă o măsură a cât de mult sunt deviate datele de la centru; mai mare este deviația standard mai mare este dispersia. De asemenea, abaterea standard va fi o valoare nenegativă, indiferent de natura datelor din setul de date.
Care este diferența dintre abaterea standard și medie?
• Abaterea standard este o măsură a dispersiei de la centru, în timp ce media măsoară locația centrului unui set de date.
• Abaterea standard este întotdeauna o valoare nenegativă, dar media poate lua orice valoare reală.