Media vs Mediana vs Mod
Media, mediana și modul sunt măsurile principale ale tendinței centrale utilizate în statisticile descriptive. Ele sunt complet diferite unele de altele, iar cazurile în care sunt folosite pentru a rezuma datele sunt, de asemenea, diferite.
Mean
Media aritmetică este suma valorilor datelor împărțită la numărul de valori ale datelor, adică
[latex]\bar{x}=\frac{1}{n}\sum_{i=1}^{n}x_{i}=\frac{x_{1}+x_{2} +x_{3}+…+x_{n}}{n}[/latex]
Dacă datele provin dintr-un spațiu eșantion, se numesc o medie eșantion ([latex]\bar{x} [/latex]), care este o statistică descriptivă a eșantionului. Deși este cea mai frecvent utilizată măsură descriptivă pentru un eșantion, nu este o statistică robustă. Este foarte sensibil la valori aberante și oscilații.
De exemplu, luați în considerare venitul mediu al cetățenilor unui anumit oraș. Deoarece toate valorile datelor sunt însumate și apoi împărțite, veniturile unei persoane extrem de bogate afectează în mod semnificativ media. Prin urmare, valorile medii nu reprezintă întotdeauna o bună reprezentare a datelor.
De asemenea, în cazul unui semnal alternativ, curentul care trece printr-un element variază periodic de la direcția pozitivă la direcția negativă și invers. Dacă luăm curentul mediu care trece printr-un element într-o singură perioadă, acesta va da un 0, ceea ce înseamnă că niciun curent nu a trecut prin element, ceea ce evident nu este adevărat. Prin urmare, nici în acest caz, media aritmetică nu este o măsură bună.
Media aritmetică este un indicator bun atunci când datele sunt distribuite uniform. Pentru o distribuție normală, media este egală cu modul și mediana. Are, de asemenea, cele mai mici reziduuri atunci când se consideră eroarea pătratică medie; prin urmare, cea mai bună măsură descriptivă atunci când este necesar să se reprezinte un set de date printr-un singur număr.
Median
Valorile punctului de date din mijloc după aranjarea tuturor valorilor de date în ordine crescătoare sunt definite ca mediana setului de date. Mediana este a 2-a quartila, a 5-a decilă și a 50-a percentila.
• Dacă numărul de observații (puncte de date) este impar, atunci mediana este observația exact în mijlocul listei ordonate.
• Dacă numărul de observații (puncte de date) este par, atunci mediana este media celor două observații din mijloc din lista ordonată.
Median împarte observația în două grupuri; adică un grup (50%) de valori mai mari și un grup (50%) de valori mai mici decât mediana. Medianele sunt utilizate în mod special în distribuțiile deformate și reprezintă datele destul de bine decât media aritmetică.
Mod
Mode este cel mai frecvent număr dintr-un set de observații. Modul unui set de date este calculat prin găsirea frecvenței fiecărui element din setul.
• Dacă nicio valoare nu apare de mai multe ori, atunci setul de date nu are niciun mod.
• În caz contrar, orice valoare care apare cu cea mai mare frecvență este un mod al setului de date.
Într-un set poate exista mai mult de 1 mod; prin urmare, modul nu este o statistică unică a unui set de date. Într-o distribuție uniformă, există un singur mod. Modul unei distribuții de probabilitate discretă este punctul în care funcția de masă a probabilității atinge punctul cel mai în alt. Redând din interpretările de mai sus, putem spune că maximele globale sunt moduri.
Luați în considerare aplicarea tuturor celor trei măsuri la următorul set de date.
DATE: {1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15, 15}
Media=(1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15) / 25=8,12
Median=9 (al 13-lea element)
Mod=9 (frecvența de 9=5)
Care este diferența dintre medie, mediană și mod?
• Media aritmetică este suma valorilor (observațiilor) împărțită la numărul de observații. Nu este o statistică robustă și depinde în mare măsură de natura distribuției normale în cadrul distribuției luate în considerare. Un singur valori aberante poate determina o schimbare semnificativă a mediei, oferind valori relativ înșelătoare. Conceptul poate fi extins la medie geometrică, medie armonică, medie ponderată și așa mai departe.
• Mediana este valorile mijlocii ale setului de observații și este relativ mai puțin afectată de valori aberante. Poate oferi o estimare bună ca statistică rezumată în cazuri extrem de distorsionate.
• Modul reprezintă cele mai comune valori de observație din setul de date. Dacă distribuția este denaturată pozitiv, modul se află la stânga la mediană și, dacă este denaturată negativ, modul se află chiar la mediană.
• Dacă este denaturată pozitiv, media este corectă la mediană; dacă media deformată negativ este la stânga mediei.
• În distribuția normală, toate cele trei, media, modul și mediana sunt egale.