Z-проверка — вид на статистичка проверка за кој распределбата на проверената статистика под нултата хипотеза може да се поистовети со нормалната распределба. Тоа е така,бидејќи според централната гранична теорема,многу проверени статистики се приближно нормално распределени за големите примероци.За секое ниво на значајност,Z-проверката има определена критична вредност ( на пример 1.96 за 5% ниво на значајност).Z-проверката најчесто се применува доколку големината на примерокот е голема,а популационата варијанса позната. Доколку големината на примерокот е помала од 30,а варијансата не е позната, тогаш употребата на Студентовата t-распределба би била посоодветна.

Употреба на проверка

уреди

Терминот Z-проверката често се употребува за споредување на средната вредност на збир на мерења во однос на дадена константа. Ако набљудуваните податоци X1, ..., Xn се (i) коваријансни, (ii) имаат заедничка средна вредност μ, и имаат заедничка варијанса σ2, тогаш набљудуваниот примерок во просек има средна вредност μ и варијанса σ2 / n.

Кога се користи Z-проверка за максимални можни проценки важно е да се има предвид дека нормалните приближувања може да бидат лоши ако големината на примерокот не е доволно голема. Иако нема едноставно, универзално правило кое наведува која големина на примерокот е најсоодветна за да се користи Z-проверка, симулацијата може да даде добра идеја за тоа дали Z-проверката е соодветна за дадентата ситуација.

Z-проверките се употребуваат кога може да се тврди дека статистиката на проверката следи нормална распределба во рамките на нултата хипотеза. Многу непараметарска проверка статистики како U-статистика се нормални за доволно голем примерок и оттаму често се вршат Z-проверките.

Услови

уреди

За да може Z-проверката да биде применлива,мора да бидат исполнети неколку услови.Одредени параметри мора да се знаат или да се проценат со висока точност ( пример параметар-стандардно отстапување во проверен примерок).Z-проверката се фокусира на еден параметар и ги третира сите непознати параметри како фиксни вредности .Меѓутоа доколку примерокот не е доволно голем за да разумно ги оправда овие проценки,тогаш нити Z-проверката не би се сметала за релевантна.

Статистичката проверка треба да биде нормално распределен.Генерално,за да централната гранична теорема биде издржана,проверката мора нормално да варира.Постојат голем број статистички анализи дали е оправдана употребата на проверката,доколку распределбата е приближно нормална.Доколку отстапувањето е големо,тогаш Z-проверката не треба да се употребува.

Пример

уреди

Да претпоставиме дека во одреден географски регион , средната вредност и стандардното отстапување на резултатите на проверката по математика се 100 бода и 12 бода ретроспективно. Наш интерес се резултатите на 55 ученици во одредено училиште кои добиле среден резултат од 96 бода.Се поставува прашање,дали овој среден резултат може да се смета за значително понизок од регионалниот ?

За да одговориме,најпрво ќе започнеме со пресметување на стандардната грешка на средината:

 

Следно,го пресметуваме z резултатот. Z резултатот ни ги покажува стандардните отстапувања на поединечниот резултат над или под средната вредност. Кога се користи Z-проверката,сепак, ние не го споредуваме поединечниот резултат со средната големина на популацијата. Наместо тоа ние ја споредуваме средната големина на примерокот со средната големина на популацијата.

 

Во овој пример ние ја третираме средната вердност на популацијата и варијансата која што ни е позната, кои ќе бидат соодветни доколку сите ученици во регионот беа проверени, или ако беше искористен голем прост случаен примерок за да се процени средната големина на популацијата и варијансата со минимален ризик на грешка.

Училишниот среден резултат е 96, којшто е -2,47 стандардни грешки од средната големина на популацијата (100). Погледнете го z резултатот во табелата на стандардната нормална распределба и ќе ја најдете веројатноста за набљудуваната стандардна нормална вредност под -2,47 изнесува приближно 0,5-0,4932=0,0068

Ова е еднострана p-вредност на нултата хипотеза дека 55 студенти се споредливи со прост случаен примерок од популацијата од сите решавачи на проверката. На двостраната проверка p-вредноста е приближно на 0,014.

Друг начин е дека со веројатност од 1-0,014=0,986 простиот случаен примерок од 55 студенти ќе има среден резултат на проверка во рамките на 4 единици на средната големина на популацијата. Ние исто така можеме да кажеме дека со 98,6% доверба ја одбиваме нултата хипотеза дека 55 решавачи на проверката се споредливи со простиот случаен примерокот од популацијата на решавачи на проверка.

Z-проверката ни кажува дека 55 студенти имаат невообичаено ниска средна вредност на резултатите од проверката во споредба со повеќе прости случајни примероци со слична големина на популацијата на решавачите на проверката. Недостатокот на оваа анализа е тоа дека не смета дали ефектот од 4 бода е значаен. Ако наместо за училиштето, ние пресметавме за подрегионот кој содржи 900 ученици чиј среден резултат бил 99, ќе се добиа речиси истиот z резултат и p-вредност. Ова покажува дека ако големината на примерокот е доволно голема, многу мали разлики во нултата вредност може да бидат статистички значајни. За понатамошна дискусија на ова прашање погледнете за проверка на статистички хипотези.

Литература

уреди
  • Ристески Славе, Тевдовски Драган (2010): „Статистика за бизнис и економија“, четврто издание, Скопје: Економски факултет – Скопје.
  • Sherri L. Jackson Jacksonville University: Research Methods and Statistics: A Critical Thinking Approach, 4th Edition.
  • Sprinthall, Richard C. Basic Statistical Analysis: Seventh Edition, copyright 2003, Pearson Education Group.

Надворешни врски

уреди