Разлика между T-TEST и ANOVA

T-TEST срещу ANOVA

Събирането и изчисляването на статистически данни за придобиване на средната стойност често е дълъг и досаден процес. T-тестът и еднопосочният анализ на дисперсията (ANOVA) са двата най-често срещани тестове, използвани за тази цел.

T-тестът е тест на статистическа хипотеза, при който тестовата статистика следва t разпределението на Стьюдент, ако нулевата хипотеза се поддържа. Този тест се прилага, когато тестовата статистика следва нормално разпределение и стойността на термина на мащабиране в тестовата статистика е известна. Ако терминът на мащабиране е неизвестен, той се замества с оценка на базата на наличните данни. Тестовата статистика ще следва t-разпределение на Student.

Уилям Сили Госет представи t-статистика през 1908 г. Госет е химик за пивоварната „Гинес“ в Дъблин, Ирландия. Пивоварната в Гинес има политика да набира най-добрите висшисти от Оксфорд и Кеймбридж, избирайки от онези, които биха могли да предоставят приложения на биохимия и статистика за установените промишлени процеси в компанията. Уилям Сили Госет беше един такъв възпитаник. В процеса Уилям Сили Госет разработи t-теста, който първоначално беше предвиден като начин за мониторинг на качеството на стаута (тъмната бира, която пивоварната произвежда) по рентабилен начин. Госет публикува теста под името „Студент“ в Biometrika, около 1908 г. Причината за името на писалката е настояването на Гинес, тъй като компанията иска да запази политиката си за използване на статистиката като част от техните „търговски тайни“..

Статистиката на Т-теста обикновено следва формата T = Z / s, където Z и s са функции на данните. Z променливата е проектирана да бъде чувствителна към алтернативната хипотеза; ефективно, величината на Z променливата е по-голяма, когато алтернативната хипотеза е вярна. Междувременно 's' е мащабиращ параметър, който позволява да се определи разпределението на T. Предположенията, залегнали в основата на t-теста, са, че а) Z следва стандартно нормално разпределение при нулевата хипотеза; б) ps2 следва distribution ‡ 2 разпределение с p степени на свобода при нулевата хипотеза (където р е положителна константа); и в) стойността Z и s стойността са независими. При специфичен тип t-тест тези условия са последици от изследваната популация, както и от начина, по който данните се вземат на извадка.

От друга страна, анализът на дисперсията (ANOVA) е съвкупност от статистически модели. Докато принципите на ANOVA са били използвани от изследователи и статистици от дълго време, едва през 1918 г. сър Роналд Фишър прави предложение за формализиране на анализа на дисперсията в статия, озаглавена „Корелацията между роднини относно предположението на Менделското наследство“. , Оттогава ANOVA се разширява в обхвата и приложението си. ANOVA всъщност е погрешно, тъй като не се извлича от разликите в дисперсиите, а от разликите между групите. Тя включва свързаните процедури, при които наблюдаваната отклонение в определена променлива е разделена на компоненти, приписващи се на различни източници на вариация.

По същество ANOVA предоставя статистически тест за определяне дали всички средства на няколко групи са равни и в резултат на това обобщава t-тест на повече от две групи. ANOVA може да бъде по-полезен от t-тест с две проби, тъй като има по-малък шанс да допусне грешка от тип I. Например, провеждането на множество t-тестове с две проби би имало по-голям шанс да допусне грешка от ANOVA на същите променливи, участващи за получаване на средната стойност. Моделът е същият, а тестовата статистика е F съотношение. Казано по-просто, t-тестовете са само специален случай на ANOVA: извършването на ANOVA ще има същия резултат от множество t-тестове. Има три класа модели на ANOVA: а) модели с фиксирани ефекти, които предполагат, че данните идват от нормални популации, различаващи се само по своите средства; b) Модели на случайни ефекти, които приемат данните описва йерархия на различни популации, чиито разлики са ограничени от йерархията; и в) модели със смесени ефекти, които са ситуации, при които има както фиксирани, така и случайни ефекти.

Резюме:

  1.  T-тестът се използва при определяне дали две средни стойности или средства са еднакви или различни. ANOVA се предпочита, когато се сравняват три или повече средни стойности или средства.
  2.  Т-тестът има повече шансове да допусне грешка, толкова повече средства се използват, поради което ANOVA се използва при сравняване на две или повече средства.