Varianță vs covarianță
Varianța și covarianța sunt două măsuri utilizate în statistici. Varianta este o măsură a împrăștierii datelor, iar covarianța indică gradul de modificare a două variabile aleatoare împreună. Varianta este mai degrabă un concept intuitiv, dar covarianța este definită matematic la început, nu chiar atât de intuitiv.
Mai multe despre variație
Varianța este o măsură a dispersiei datelor din valoarea medie a distribuției. Spune cât de departe se află punctele de date de media distribuției. Este unul dintre descriptorii primari ai distribuției de probabilitate și unul dintre momentele distribuției. De asemenea, varianța este un parametru al populației, iar varianța unui eșantion din populație acționează ca un estimator pentru varianța populației. Dintr-o perspectivă, este definit ca pătratul abaterii standard.
În limbaj simplu, poate fi descris ca media pătratelor distanței dintre fiecare punct de date și media distribuției. Următoarea formulă este utilizată pentru a calcula variația.
Var(X)=E[(X-µ)2] pentru o populație și
Var(X)=E[(X-‾x)2] pentru o mostră
Se poate simplifica în continuare pentru a da Var(X)=E[X2]-(E[X])2.
Variance are unele proprietăți de semnătură și este adesea folosit în statistici pentru a simplifica utilizarea. Varianta este nenegativă deoarece este pătratul distanțelor. Cu toate acestea, intervalul de variație nu este limitat și depinde de distribuția particulară. Varianta unei variabile aleatoare constante este zero, iar varianța nu se modifică în raport cu un parametru de locație.
Mai multe despre covarianță
În teoria statistică, covarianța este o măsură a cât de mult se schimbă două variabile aleatoare împreună. Cu alte cuvinte, covarianța este o măsură a puterii corelației dintre două variabile aleatoare. De asemenea, poate fi considerată o generalizare a conceptului de varianță a două variabile aleatoare.
Covarianța a două variabile aleatoare X și Y, care sunt distribuite împreună cu impulsul secund finit, este cunoscută ca σXY=E[(X-E[X])(Y-E[Y])]. Din aceasta, varianța poate fi văzută ca un caz special de covarianță, unde două variabile sunt aceleași. Cov(X, X)=Var(X)
Prin normalizarea covarianței, se poate obține coeficientul de corelație liniară sau coeficientul de corelație Pearson, care este definit ca ρ=E[(X-E[X])(Y-E[Y])]/(σ X σY)=(Cov(X, Y))/(σX σY )
Grafic, covarianța dintre o pereche de puncte de date poate fi văzută ca aria dreptunghiului cu punctele de date la vârfurile opuse. Poate fi interpretat ca o măsură a mărimii separării dintre cele două puncte de date. Luând în considerare dreptunghiurile pentru întreaga populație, suprapunerea dreptunghiurilor corespunzătoare tuturor punctelor de date poate fi considerată ca forță a separării; varianţa celor două variabile. Covarianța este în două dimensiuni, din cauza a două variabile, dar simplificarea acesteia la o variabilă dă varianța unei singure ca separare într-o dimensiune.
Care este diferența dintre varianță și covarianță?
• Varianța este măsura răspândirii/dispersiei într-o populație, în timp ce covarianța este considerată ca o măsură a variației a două variabile aleatoare sau puterea corelației.
• Varianta poate fi considerată un caz special de covarianță.
• Varianța și covarianța depind de mărimea valorilor datelor și nu pot fi comparate; prin urmare, ele sunt normalizate. Covarianța este normalizată în coeficientul de corelație (împărțirea la produsul abaterilor standard ale celor două variabile aleatoare) și varianța este normalizată în abaterea standard (prin luarea rădăcinii pătrate)