средняя ц величине цц. В этом случае гипотеза будет сформулирована следующим образом:
Я0: ц =ц„, (5.15)
Н\- И*Но.
Если же мы хотим знать, превышает или нет параметр генеральной совокупности данное значение, то гипотеза примет вид:
Я0: ц = мо, (5.16)
Щ- ц > но.
В случае, когда необходимо узнать, является ли генеральная средняя меньше по величине цо, гипотеза будет выглядеть так:
Я0: u =мо, (5-17)
Н\- V- < Мо.
Для того чтобы проверить нашу гипотезу, необходимо выполнить статистическую проверку. Статистическая проверка (statistical test) состоит в использовании стандартизованного статистического критерия (standardized test statistic), вычисляемого по данным выборки для принятия решения о том, отвергнуть или нет гипотезу, проверяемую относительно величины параметра генеральной совокупности.
Стандартизованный статистический критерии
В гл. 2 мы узнали, что для того чтобы сравнить одну нормально распределенную переменную с другой, необходимо их привести к нормированной форме со средней, равной нулю, и средним квадратическим отклонением, равным единице. Распределение вероятностей такой нормированной переменной известно как нормированная функция кривой нормального распределения. При проверке гипотез мы должны привести статистический критерий к стандартизованной форме, чтобы сделать полноценное сравнение со стандартизованным нормальным распределением или /-распределением в случае проверки гипотезы для средних, или х2-распределением для дисперсии.
В случае критерия проверки гипотезы для средних вспомним, что если Анормально распределена (т.е. Х~ N(\i,,a2)), то X
приближенно распределена как X ~ N(\i, s/n). Так как форма нормального распределения зависит от величины средней арифметической и среднего квадратического отклонения, следует привести переменную к стандартизованной форме перед сравнением. В случае проверки гипотезы о величине средней приведение к стандартизованной форме осуществляется следующим образом:
2-. (5.18)
Эта величина называется стандартизованным критерием проверки (standardized test statistic). Если X равно ро, т.е. гипотеза Я0 верна, критерий проверки имеет стандартизованное нормальное распределение (если объем выборки большой) или стандартизованное /-распределение с и-1 степенями свободы (для малой выборки). Оба эти распределения имеют значения средней, равные нулю, и стандартную ошибку (так как они относятся к выборочным распределениям), равную 1. Приведя критерий проверки к стандартизованной форме, можно сравнить его значение напрямую со значениями, относящимися к соответствующим стандартизованным распределениям вероятностей.
Если критерий проверки, полученный в результате стандартизации, расположен в критической области распределения, это доказывает, что средняя X не равна цо> те- наше предположение неверно и Щ ложна. Смысл сказанного заключается в том, что если критерий проверки находится в критической области, это событие маловероятно согласно нашим допущениям. Однако, как выше доказано, если такое событие произошло, мы должны подвергнуть сомнению принятые допущения.
Проверка гипотезы может быть односторонней (one-tailed test) или двусторонней (two-tailed test). Односторонний критерий используется в тех случаях, когда необходимо знать, является ли параметр генеральной совокупности строго больше (правосторонний критерий) или строго меньше (левосторонний критерий) предполагаемого значения. Гипотезы (5.16) и (5.17) будут проверяться с помощью односторонних критериев. Двусторонний критерий приложим к тем случаям, когда нас интересует, отличаются ли реальные значения параметра от предполагаемого значения. Например, гипотезы, представленные выражением (5.15), проверяют с помощью двустороннего критерия.
Критическую область (critical region) составляют те значения выборочных статистических показателей, которые ведут к отказу от нулевой гипотезы. На рис. 5.4 критическая область представлена граничными площадями под кривой.
-1,96 ц +1,96
Рис. 5.4
Уровень значимости (significance level) гипотезы - это вероятность того, что критерий проверки находится в критической области при условии верности гипотезы Hq - обычно равен 5 или 1%. Если проверка при 5%-ном уровне значимости приведет к отказу от гипотезы Щ, то говорят, что величина критерия значима. Если Щ отвергается при 1%-ном уровне, используется термин "высокий уровень значимости".
Концепция критической области и уровня значимости может быть проиллюстрирована с помощью рис. 5.4, на котором изображен доверительный интервал для средней. Критические области составляют площади под кривой, находящиеся левее -1,96 и правее +1,96. Доверительный интервал - это площадь под кривой, находящаяся между этими двумя точками. Если X превосходит в положительном или отрицательном направлении 1,96 стандартной ошибки от цо, значит X настолько велика (или мала) по сравнению с предполагаемой цо, что существует очень малая вероятность (отражаемая площадью в граничных областях), что средняя арифметическая выборки репрезентирует
Правило принятия решения (decision rule) для проверки статистической гипотезы - это модель расчета значений выборочных