Diferența dintre tendința centrală și dispersie

Diferența dintre tendința centrală și dispersie
Diferența dintre tendința centrală și dispersie

Video: Diferența dintre tendința centrală și dispersie

Video: Diferența dintre tendința centrală și dispersie
Video: GCSE Biology - What Is The Difference Between Light And Electron Microscopes? #6 2024, Noiembrie
Anonim

Tendință centrală vs dispersie

În statistica descriptivă și inferențială, mai mulți indici sunt utilizați pentru a descrie un set de date corespunzător tendinței sale centrale, dispersiei și asimetriei: cele mai importante trei proprietăți care determină forma relativă a distribuției unui set de date.

Care este tendința centrală?

Tendința centrală se referă la și localizează centrul distribuției valorilor. Media, modul și mediana sunt cei mai des utilizați indici pentru a descrie tendința centrală a unui set de date. Dacă un set de date este simetric, atunci atât mediana cât și media setului de date coincid una cu ceal altă.

Dând un set de date, media se calculează luând suma tuturor valorilor datelor și apoi împărțind-o la numărul de date. De exemplu, greutățile a 10 persoane (în kilograme) sunt măsurate a fi 70, 62, 65, 72, 80, 70, 63, 72, 77 și 79. Atunci greutatea medie a celor zece persoane (în kilograme) poate fi calculat după cum urmează. Suma greutăților este 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79=710. Media=(suma) / (numărul de date)=710 / 10=71 (în kilograme). Se înțelege că valorile aberante (puncte de date care se abat de la tendința normală) tind să afecteze media. Astfel, în prezența valorilor aberante, numai media nu va oferi o imagine corectă despre centrul setului de date.

Mediana este punctul de date găsit exact la mijlocul setului de date. O modalitate de a calcula mediana este să ordonați punctele de date în ordine crescătoare și apoi să localizați punctul de date în mijloc. De exemplu, dacă odată comandat, setul de date anterior arată astfel: 62, 63, 65, 70, 70, 72, 72, 77, 79, 80. Prin urmare, (70+72)/2=71 este la mijloc. Din aceasta, se vede că mediana nu trebuie să fie în setul de date. Mediana nu este afectată de prezența valorilor aberante. Prin urmare, mediana va servi ca o măsură mai bună a tendinței centrale în prezența valorilor aberante.

Modul este cea mai frecventă valoare din setul de date. În exemplul anterior, valoarea 70 și 72 apar ambele de două ori și, prin urmare, ambele sunt moduri. Aceasta arată că, în unele distribuții, există mai mult de o valoare modală. Dacă există un singur mod, se spune că setul de date este unimodal, în acest caz, setul de date este bimodal.

Ce este dispersia?

Dispersia este cantitatea de răspândire a datelor despre centrul distribuției. Intervalul și abaterea standard sunt cele mai utilizate măsuri de dispersie.

Intervalul este pur și simplu cea mai mare valoare minus cea mai mică valoare. În exemplul anterior, cea mai mare valoare este 80, iar cea mai mică valoare este 62, deci intervalul este 80-62=18. Dar intervalul nu oferă o imagine suficientă despre dispersie.

Pentru a calcula abaterea standard, mai întâi se calculează abaterile valorilor datelor de la medie. Media pătrată a abaterilor se numește abatere standard. În exemplul anterior, abaterile respective de la medie sunt (70 – 71)=-1, (62 – 71)=-9, (65 – 71)=-6, (72 – 71)=1, (80 – 71)=9, (70 – 71)=-1, (63 – 71)=-8, (72 – 71)=1, (77 – 71)=6 și (79 – 71)=8. Suma dintre pătratele abaterii este (-1)2 + (-9)2 + (-6)2+ 12 + 92 + (-1)2 + (-8) 2 + 12 + 62 + 82=366. Abaterea standard este √(366/10)=6,05 (în kilograme). Cu excepția cazului în care setul de date este foarte denaturat, din aceasta se poate concluziona că majoritatea datelor se află în intervalul 71±6,05 și, într-adevăr, este așa în acest exemplu particular.

Care este diferența dintre tendința centrală și dispersie?

• Tendința centrală se referă la și localizează centrul distribuției valorilor

• Dispersia este cantitatea de răspândire a datelor despre centrul unui set de date.

Recomandat: