Eșantionarea stratificată vs eșantionarea în cluster
În statistică, în special atunci când se efectuează sondaje, este important să se obțină un eșantion imparțial, astfel încât rezultatul și previziunile făcute cu privire la populație sunt mai precise. Dar, în eșantionarea aleatorie simplă, există posibilitatea de a selecta membrii eșantionului care este părtinitor; cu alte cuvinte, nu reprezintă în mod corect populația. Prin urmare, eșantionarea stratificată și eșantionarea în cluster sunt utilizate pentru a depăși problemele de părtinire și eficiență ale eșantionării aleatorii simple.
Eșantionare stratificată
Eșantionarea aleatorie stratificată este o metodă de eșantionare în care populația este mai întâi împărțită în straturi (Un strat este un subset omogen al populației). Apoi se prelevează un eșantion aleator simplu din fiecare strat. Rezultatele din fiecare strat combinat constituie eșantionul. Următoarele sunt exemple de straturi posibile în populații
• Pentru o populație a unui stat, straturile masculine și feminine
• Pentru persoanele care lucrează într-un oraș, straturile rezidente și nerezidente
• Pentru studenții dintr-o facultate, alb, negru, hispanic și asiatic
• Pentru audiența unei dezbateri privind teologia, straturile protestante, catolice, evreiești, musulmane
În acest proces, mai degrabă decât prelevarea de eșantioane la întâmplare direct din populație, populația este separată în grupuri folosind o caracteristică inerentă a elementelor (grupuri omogene). Apoi sunt luate probe aleatorii din grup. Cantitatea de mostre aleatorii prelevate din fiecare grup depinde de numărul de elemente din grup.
Acest lucru permite eșantionarea să fie efectuată fără ca eșantionul unui grup să fie mai mare decât numărul de eșantioane necesare din acel grup anume. Dacă numărul de elemente dintr-un anumit grup este mai mare decât cantitatea necesară, o declinare a distribuției poate duce la interpretări eronate.
Eșantionarea stratificată permite utilizarea diferitelor metode statistice pentru fiecare strat, ceea ce ajută la îmbunătățirea eficienței și acurateței estimării.
Cluster Sampling
Eșantionarea aleatorie în cluster este o metodă de eșantionare în care populația este mai întâi împărțită în clustere (Un cluster este un subset eterogen al populației). Apoi se ia un eșantion aleatoriu simplu de clustere. Toți membrii clusterelor selectate împreună constituie eșantionul. Această metodă este adesea folosită atunci când grupările naturale sunt evidente și disponibile.
Pentru exemple, luați în considerare un sondaj pentru evaluarea implicării elevilor de liceu în activități extracurriculare. Mai degrabă decât selectarea aleatorie a studenților din populația de studenți, selectarea unei clase ca eșantioane pentru sondaj este eșantionarea în grup. Apoi fiecare membru al clasei este intervievat. În acest caz, clasele sunt grupuri ale populației studențești.
În eșantionarea în cluster, clusterele sunt selectate aleatoriu, nu indivizii. Se presupune că fiecare cluster în sine este o reprezentare imparțială a populației, ceea ce implică faptul că fiecare dintre clustere este eterogen.
Care este diferența dintre eșantionarea stratificată și eșantionarea în cluster?
• În eșantionarea stratificată, populația este împărțită în grupuri omogene numite strate, folosind un atribut al eșantioanelor. Apoi sunt selectați membrii din fiecare strat, iar numărul de eșantioane prelevate din acele straturi este proporțional cu prezența straturilor în cadrul populației.
• În eșantionarea în cluster, populația este grupată în clustere, în principal în funcție de locație, iar apoi un cluster este selectat la întâmplare.
• În eșantionarea în grup, un grup este selectat la întâmplare, în timp ce în eșantionarea stratificată membrii sunt selectați la întâmplare.
• În eșantionarea stratificată, fiecare grup utilizat (strat) include membri omogene, în timp ce, în eșantionarea în cluster, un grup este eterogen.
• Eșantionarea stratificată este mai lentă, în timp ce eșantionarea în grup este relativ mai rapidă.
• Eșantioanele stratificate au mai puține erori datorită prezenței fiecărui grup în cadrul populației și adaptării metodelor pentru a obține o estimare mai bună.
• Eșantionarea în cluster are inerent un procent mai mare de eroare.