назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [ 74 ] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176]


74

ной средней - одни выше, другие ниже ее. Исходя из предположения о том, что выборки осуществляются случайным образом, выборочные статистические показатели расцениваются как случайные величины. Продолжительный процесс осуществления повторных выборок позволит получить распределение вероятностей выборочного статистического показателя. Это распределение вероятностей называется выборочным распределением выборочного статистического показателя. Наши знания относительно выборочного распределения каждого из статистических показателей позволяют сделать выводы относительно величины параметров генеральной совокупности исходя из выборочных показателей.

Мы сосредоточимся на нормальном распределении и /-рас-пределениии Стьюдента для средних величин, х2~РаспРеДе" лении для дисперсий и /"-распределении для коэффициента детерминации. Так как последнее относится к оценке степени пригодности линий регрессии, что будет рассмотрено в следующей главе, мы отложим рассмотрение /-распределения до следующей главы.

Выборочное распределение выборочных показателей

Выборочное распределение выборочной средней арифметической

В гл. 4 мы узнали, что согласно центральной предельной теореме средние аддитивных процессов (арифметические средние) будут нормально распределены независимо от распределения исходных величин при условии, что выборки достаточно велики (объем выборки больше 30). Если первоначальная совокупность нормально распределена, а объем выборки меньше 30, распределение выборочных средних будет следовать -распределению Стьюдента.

Математическое ожидание средней всех выборочных средних является генеральной средней. Среднее квадратическое отклонение выборочных средних известно как стандартная ошибка (standard error) и рассчитывается как отношение среднего квадратического отклонения генеральной совокупности к квадратному корню из объема выборки. Обычно эта величина известна как стандартная ошибка средней и определяется по формуле:



SE = -, (5.1)

где a - среднее квадратическое отклонение в генеральной совокупности,

я - объем выборки, по которой рассчитывается средняя.

Таким образом, стандартная ошибка находится через среднее квадратическое отклонение генеральной совокупности, отнесенное к квадратному корню из объема выборки. Однако, так как среднее квадратическое отклонение генеральной совокупности является неизвестным, в качестве его оценки принимается выборочное среднее квадратическое отклонение s. Тогда стандартная ошибка будет определяться так:

(5.2)

Таким образом, исходя из центральной предельной теоремы мы можем сказать, что средняя достаточно большой выборки приближенно нормально распределена со средним значением, равным генеральной средней, и средним квадратическим отклонением, равным стандартной ошибке средней, т.е.:

где знак "~" означает "приближенно распределено".

Объяснение, почему в качестве делителя используется Vn, дано в приложении 5.1.

Для выборок малого объема, взятых из совокупности с нормальным распределением признака, неопределенность оценки a с помощью s (которая возрастает при уменьшении объема выборки) допускается при условии применения -распределения.

Выборочное распределение выборочной аисперсии

Выборочное распределение выборочной дисперсии - это одна из форм гамма-распределения, известная как "хи-квадрат" распределение, обозначаемое через у}. Это распределение принимает разную форму для разного числа степеней свободы. Выборочную дисперсию необходимо привести к стандартизованной



форме с помощью способа, аналогичного тому, с помощью которого нормальное распределение приводилось к стандартизованной форме в гл. 4. Приведение к стандартизованной форме в нашем случае принимает вид:

Х2 , = (я-1)*2/о-2. (5.3)

Индекс (л-1) обозначает число степеней свободы, которое в случае х2-распределения равно количеству наблюдений минус 1. Для малых выборок форма распределения вероятности смещена вправо, но с увеличением объема выборки распределение становится более симметричным.

Таким образом, если средняя нашей переменной нормально распределена, тогда:

(я-О/о2 (5.4)

будет иметь х2- распределение с (л-1) степенями свободы. Несмотря на то, что нам неизвестно <т , полученный результат может быть использован при проверке гипотез относительно величины <т или при определении доверительных интервалов.

ОЦЕНИВАНИЕ

И ДОВЕРИТЕЛЬНЫЕ

ИНТЕРВАЛЫ

Располагая выборочными статистическими показателями и знаниями выборочных распределений этих показателей, мы готовы > оценить параметры генеральной совокупности анализируемых данных. При использовании выборочных показателей в оценивании параметров генеральной совокупности выборочные показатели называются оценками (estimators). Желательно, чтобы эти оценки соответствовали характеристике BLUE, что означает Best (наилучшая) Linear (линейная) Unbiased (несмещенная) Estimator . (оценка): Однако может быть необходимым добиться некоторой степени смещенности с целью получения меньшей дисперсии.

Наилучшая (best) означает свойство оценки как имеющей наименьшую дисперсию из всех возможных несмещенных оценок.

Линейная (linear) означает свойство линейной функциональной зависимости оценки от выборочных наблюдений. Например:

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [ 74 ] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176]