Statistici descriptive vs inferențiale
Statistica este disciplina de colectare, analiză și prezentare a datelor. Teoria statisticii este împărțită în două ramuri pe baza informațiilor pe care le produc prin analiza datelor.
Ce este statistica descriptivă?
Statistica descriptivă este ramura statisticii care descriu principalele proprietăți ale unui set de date cantitativ. Pentru a reprezenta proprietățile unui set de date cât mai precis posibil, datele sunt rezumate folosind instrumente grafice sau numerice.
Rezumarea grafică se face prin tabelarea, gruparea și reprezentarea grafică a valorilor variabilelor de interes. Distribuția de frecvență și histogramele de distribuție relativă a frecvenței sunt astfel de reprezentări. Acestea prezintă distribuția valorilor în întreaga populație.
Rezumatul numeric implică calcularea unor măsuri descriptive, cum ar fi media, modul și media. Măsurile descriptive sunt în continuare clasificate în două clase; sunt măsuri de tendință centrală și măsuri de dispersie/variație. Măsurile tendinței centrale sunt media/media, mediana și modul. Fiecare are propriul său nivel de aplicabilitate și utilitate. Acolo unde unul poate eșua, celăl alt poate reprezenta mai bine setul de date.
După cum sugerează și numele, măsurile de dispersie implică măsurarea distribuției datelor. Intervalul, abaterea standard, varianța, intervalele de percentile și quartile și coeficientul de variație sunt măsuri de dispersie. Acestea oferă informații despre răspândirea datelor.
Un exemplu simplu de utilizare a statisticilor descriptive este calcularea mediei punctuale a unui elev. GPA, în esență, este media ponderată a rezultatelor studenților și este o reflectare a performanței academice generale a respectivului student.
Ce este statisticile inferențiale?
Statistici inferențiale este ramura statisticii, care derivă concluzii despre populația în cauză din setul de date obținut dintr-un eșantion supus variațiilor aleatorii, observaționale și de eșantionare. În general, rezultatele sunt obținute dintr-un eșantion aleatoriu al populației, iar concluziile derivate din eșantion sunt apoi generalizate pentru a reprezenta întreaga populație.
Eșantionul este un subset al populației, iar măsurile statisticilor descriptive pentru datele obținute din eșantion sunt pur și simplu cunoscute ca statistici. Măsurile statisticii descriptive obținute în urma analizei eșantionului sunt cunoscute ca parametri atunci când sunt aplicate populației și reprezintă întreaga populație.
Statisticile inferenţiale se concentrează pe modul de generalizare a statisticilor obţinute dintr-un eşantion cât mai precis posibil pentru a reprezenta populaţia. Un factor de îngrijorare este natura eșantionului. Dacă eșantionul este părtinitor, atunci rezultatele sunt și ele părtinitoare, iar parametrii bazați pe aceștia nu reprezintă corect întreaga populație. Prin urmare, eșantionarea este un studiu important al statisticilor inferențiale. Ipotezele statistice, teoria deciziei statistice și teoria estimării, testarea ipotezelor, proiectarea experimentelor, analiza varianței și analiza regresiei sunt subiecte proeminente de studiu în teoria statisticii inferențiale.
Un bun exemplu de statistici inferențiale în acțiune este predicția rezultatelor unei alegeri înainte de vot prin sondaj.
Care este diferența dintre statisticile descriptive și inferențiale?
• Statisticile descriptive se concentrează pe rezumarea datelor colectate dintr-un eșantion. Tehnica produce măsuri de tendință centrală și dispersie care reprezintă modul în care sunt concentrate și dispersate valorile variabilelor.
• Statistica inferenţială generalizează statisticile obţinute dintr-un eşantion la populaţia generală căreia îi aparţine eşantionul. Măsurile populației sunt denumite parametri.
• Statisticile descriptive fac doar o rezumare a proprietăților eșantionului din care au fost obținute datele, dar în statisticile inferențiale, măsura din eșantion este utilizată pentru a deduce proprietățile populației.
• În statistica inferenţială, parametrii au fost obţinuţi dintr-un eşantion, dar nu din întreaga populaţie; prin urmare, există întotdeauna o anumită incertitudine în comparație cu valorile reale.