Гпава 5
Объем выборки
Мы уже видели, что на величину доверительного интервала влияет объем выборки, поэтому часто бывает полезно определить объем выборки, который бы обеспечил оценку параметра генеральной совокупности с .необходимой степенью доверия. Формула для расчета п в этом случае выглядит так:
где п - необходимый объем выборки;
Z - критическое значение из таблицы распределения, соответствующее необходимой степени доверия;
е - половина доверительного интервала, равная разности между р. и границей данного интервала;
s - оценка требуемой величины среднего квадратического отклонения генеральной совокупности.
Доверительный интервал для дисперсии
Выше мы отмечали, что выборочное распределение дисперсии следует, после соответствующего преобразования, х2~РаспРе~ делению. Для определения доверительных интервалов для дисперсии нам важно знать не столько само выборочное распределение дисперсии, сколько выборочное распределение этой величины, приведенное к стандартной форме следующим образом:
Для того чтобы найти 95%-ный доверительный интервал для точечной оценки дисперсии, мы должны определить значение X2, задающее по 2,5% в каждой из граничных площадей под кривой распределения (рис. 5.3). Таким образом, мы должны знать величину х2 ДЛЯ 97,5% значений, лежащих справа, и другую величину х2 - Для 2,5% значений, лежащих справа. Если обозначить степень доверия через 1-а, тогда нам необходимы величины х2 0/2 и х«/2 • Если мы работаем с 95%-ным уровнем доверительной вероятности, тогда значение а будет 0,05, a
(5.П)
Статистические выводы
2,5% площади под кривой на концах распределения
95%-ный доверительный интервал
2,5% площади под кривой на концах распределения
0,075
10,025
Рис. 5.3
Доверительный интервал определяется так:
2 (я "О*2 <, о2 <S Ц--
Х/1-1;!-а/2 Хл-1;а/2
и уровень вероятности будет выглядеть следующим образом:
(5.13)
2 (« - О*2
So2 --
Хл-1;1-<х/2
Хл-1;о/2
.(5.14)
Для иллюстрации расчетов предположим, что согласно выборке объемом в 30 ежемесячных наблюдений дисперсия индекса FTSE 100 составляет 0,0225. Для 29 («-1 = 29) степеней свободы критические значения х2 РаспРеДеления ПРИ 2,5% в каждой из двух критических областей равны 45,72 и 16,05, тогда
( 29 -0,0225 , 29-0,0225) Ч 45,72 *G " 16,05 )-
Доверительный интервал для среднего квадратического отклонения находится извлечением квадратного корня из границ доверительного интервала для дисперсии, т.е.
Р (0,1195 < о 5 0,2016) = 0,95.
ПРОВЕРКА ГИПОТЕЗ
Существует два подхода к проверке гипотез: классический, наиболее ранний, и подход на определении уровня вероятности (Р-value), который становится все более популярным с появлением более развитых и продвинутых пакетов прикладных программ. Сначала мы познакомимся с классическим подходом, после чего перейдем к P-value методу. Но прежде объясним некоторые термины.
Мы уже узнали, что при известных выборочном распределении различных описательных статистических показателей, объеме выборки и непосредственном значении самих показателей можно построить доверительные интервалы для точечных оценок. Но часто мы располагаем некоторыми предварительными (о priori) догадками или предположениями относительно величины параметров генеральной совокупности.
Располагая этими знаниями a priori, мы можем проверить гипотезу, что наша догадка действительно верна. Статистическая гипотеза - это рассматриваемое предположение о величине параметра распределения генеральной совокупности. Процесс проверки гипотез базируется на формулировании двух гипотез - нулевой и альтернативной, т.е. формулируются две конкурирующие гипотезы и проверяется, какая из них является верной.
Нулевая гипотеза (null hypothesis), обозначаемая обычно #о, - это допущение, которое считается верным до тех пор, пока не будет доказано обратное исходя из результатов статистической проверки. Альтернативная гипотеза (alternative hypothesis), обычно обозначаемая через Н\, - это гипотеза, которая принимается, если в результате статистической проверки отвергается нулевая гипотеза.
Точная формулировка гипотезы зависит от того, что конкретно мы хотим установить. Например, представим, что просто необходимо знать, равен или нет параметр генеральной совокупности какому-либо значению, скажем, равна ли генеральная