Разлика между дисперсията на извадката и дисперсията на популацията

обяснение

В статистиката терминът извадка се отнася до подбор на част от обобщени статистически данни с цел получаване на подходяща информация за цялото. Съвкупната или цялата статистическа информация за определен характер на всички членове, обхванати от разследването, се нарича „население“ или „вселена“. (Das, N.G., 2010). Избраната част от популацията, която се използва за получаване на характеристиките на населението или Вселената, се нарича „извадка“. Популацията се взема от отделни единици или членове, а някои от единиците са включени в извадката. Общият брой на единиците от популацията се нарича размер на популацията, а този на извадката се нарича размер на извадката. Населението и извадката могат да бъдат крайни или безкрайни и по подобен начин могат да бъдат съществуващи или хипотетични.

вариация: Вариантът е числова стойност, която показва колко широко отделните фигури в набор от данни се разпределят по отношение на средната стойност. Ето колко далеч е всяко число от средното и по този начин едно от друго. Отклонение от нулева стойност означава, че всички данни са идентични. Колкото повече варира, толкова повече са стойностите, разпределени около средното, следователно една от друга. Колкото по-малка е дисперсията, толкова по-малко са стойностите, разпределени около средната стойност, следователно една от друга, и дисперсията не може да бъде отрицателна.

Разлика между дисперсията на популацията и дисперсията на пробата

Основната разлика между дисперсията на популацията и пробата на пробата се отнася до изчисляването на дисперсията. Вариантът се изчислява на пет стъпки. Първо се изчислява средната стойност, след това изчисляваме отклоненията от средната стойност, и трето отклоненията са квадратни, на четвърто място отклоненията в квадратите се сумират и накрая тази сума се разделя на брой елементи, за които се изчислява отклонението. Така отклонение = Σ (xi-x -) / n. Където xi = i. Брой, x- = средно и n = брой артикули ...

Сега, когато дисперсията трябва да бъде изчислена от данните за населението, n е равно на броя на елементите. Следователно, ако отклонението в кръвното налягане на всичките 1000 души трябва да бъде изчислено от данните за кръвното налягане на всичките 1000 души, тогава n = 1000. Въпреки това, когато дисперсията е изчислена от примерни данни 1, трябва да се извади от n, преди да се раздели на сума от квадратните отклонения. Така в горния пример, ако в примерните данни има 100 елемента, знаменателят ще бъде 100 - 1 = 99.

Поради това стойността на дисперсията, изчислена от примерни данни, е по-висока от стойността, която би могла да бъде открита, като се използват данни от популацията. Логиката на това е да компенсираме липсата ни на информация за данните за населението. Невъзможно е да открием отклонение на височините при хората, за нашата абсолютна липса на информация за височините на всички живи човешки същества, да не говорим за бъдещето. Дори да вземем един умерен пример, като например данните за населението за височините на всички живи мъже в САЩ, това е физически възможно, но разходите и времето, свързани с това, биха победили целта на неговото изчисляване. Това е причината да се вземат извадкови данни за повечето статистически цели и това е придружено от липса на информация за по-голямата част от данните. За да се компенсира това, стойността на дисперсията и стандартното отклонение, което е квадрат на корен на дисперсия, са по-високи в случай на извадкови данни, отколкото отклонение от данните за популацията.

Това действа като автоматичен щит за анализаторите и лицата, вземащи решения. Логиката се прилага за решения за капиталово бюджетиране, лични и бизнес финанси, строителство, управление на трафика и много приложими области. Това помага на акционера да бъде на сигурна страна, докато взема решение или за други изводи.

Резюме: Дисперсията на популацията се отнася до стойността на дисперсия, която се изчислява от данните за популацията, а дисперсията на извадката е дисперсията, изчислена от извадкови данни. Поради тази стойност на знаменателя във формулата за отклонение в случай на извадкови данни е „n-1“, а за данните от популацията е „n“. В резултат както дисперсията, така и стандартното отклонение, получени от извадкови данни, са повече от тези, установени от данните за популацията.