14 Еще О 100.00%i
Рис. 12.8. Гистограмма для примера 12.5.1
Пример 12.5.2
Проверим данные из примера 12.5.1 на принадлежность предполагаемому экспоненциальному распределению.
Первой задачей является уточнение параметров плотности вероятности и функции распределения, которые определяют теоретическое распределение. Из примера 12.5.1 следует, что Т = 3,934 минуты, поэтому Я. = 1/3,934 = 0,2542 для предполагаемого экспоненциального распределения (см. раздел 12.4.3). Соответствующая плотность вероятности и функция распределения имеют следующий вид.
/(г) = 0,2542е°-2542, />0,
F{T)=\f(t)dt = \-e2saT, Т>0.
Используем теперь функцию распределения F(T) для вычисления ее значений в точках Т= 0,5, 1,5, 11,5 и сравнения их с эмпирическими значениями F„ i = 1, 2,12, которые вычислены в примере 12.5.1. Например,
F(0,5) = l-e-(0-2542>",-5)*0>12.
На рис. 12.9 представлены результаты сравнения. Просмотрев два графика, можем сделать вывод, что экспоненциальное распределение действительно приемлемо для аппроксимации распределения имеющихся данных.
Следующий шаг состоит в применении критерия согласия. Имеется два таких критерия: 1) критерий Колмогорова-Смирнова и 2) критерий /2 (критерий хи-квадрат). Здесь мы ограничимся обсуждением критерия /2.
Критерий х2 основан на измерении отклонений между эмпирическими и теоретическими частотами, соответствующими различным интервалам построенной гистограммы. В частности, теоретическая частота и,-, соответствующая наблюдаемой частоте о, интервала /, вычисляется по формуле
и,=n)/(t)dt = r,(F(Il)-F(l)) = 60{e-е~°™>).
Глава 12. Основы теории вероятностей Эмпирическая функция распределения
Функция экспоненциального распределения
О 0,5 1,5 2,5 3,5 4,5 5,5 6,5 7,5 8,5 9,5 10,5 11,5
t(минуты)
Рис. 12.9. Сравнение эмпирической и теоретической функций распределения
При заданных о, и ni для каждого интервала i мера отклонения между эмпирическими и теоретическими частотами определяется следующей формулой.
Когда количество интервалов N величина % асимптотически стремится к плотности вероятности -распределения с N - k - 1 степенями свободы, где k - число параметров, оцененных на основе исходной информации и использованных для определения теоретического распределения.
Нулевая гипотеза, утверждающая, что наблюденная выборка получена из теоретического распределения f(t), принимается, если %2 <xiv-*-i.i-a> гДе jd-*-u-a - значение х* при N - k-1 степенях свободы, а- уровень значимости критерия. Вычисления в соответствии с критерием показаны в следующей таблице.
Интервал Наблюдаемая частота, о, Теоретическая частота, л, у"
(0,1) | | 13,47 | 0,435 |
(1.2) | | 10,44 | 0,570 |
(2, 3) | | 8,10 | | 0,100 |
(3, 4) | | 6,28 | | 0,083 |
(4,5) | | 4,87 | | |
(5,6) | | 3,88 | | |
(6,7) | | 2,93 | | |
(7,8) | | 2,27 | | |
(8,9) | | 25 1,76 | •21,71 | 0,499 |
(9,10) | | 1,37 | | |
(10,11) | | 1,06 | | |
(11.12) | | 0,82 | | |
(12, ос) | | 2,75 | | |
Всего | п = 60 п = 60 | Величина равна 1,705 |
Существует практическое правило: ожидаемое значение теоретической частоты для любого интервала должно быть не менее 5. Это правило всегда можно выполнить путем объединения последовательных интервалов. В приведенной таблице правило требует формирования единого интервала (4, °°). Количество интервалов становится равным iV=5. Поскольку на основе исходных данных оценивается только один параметр (а именно Л), степень свободы величины х должна равняться 5-1-1 = 3. Если выберем уровень значимости а= 0,05, таблица значений величины (табл. 3 приложения В) дает критическое значение Хз005 = 7,815. Так как значение величины х" (= 1,705) меньше критического, мы принимаем гипотезу, что выборка получена из экспоненциального распределения.
Вычисления предыдущей таблицы можно легко выполнить в Excel на основе данных, полученных при построении гистограммы (рис. 12.8). На рис. 12.10 показано, как решается эта задача. Здесь данные в столбцах А, В и С получены при построении гистограммы (формат данных в столбце С изменен на обычный десятичный формат). Формулы, по которым проводятся вычисления в столбцах D:G, совпадают с формулами критерия j(2.
| | | | | | |
| | | | | | |
| Карман | Частота (oi) .Интегральный % | | | |
| 0.9999; | | 0.1831 | 13.448 | 0.44562 |
| 1 9999 | | 0.317! | 10.435 | 0.568206 |
| 2.9999 | | 0.467 | 8.096 | 0.100941 |
"В" | 3 9999 | | 0 583 | о 281 | 0.082306i |
| 4.9999 | .................6...... | 0.683 | 4.873 | 0.260646* |
| 5.9999J | | 0.767 | 3.781 | 0.393007 |
| 6 9999 | | 0.833 | 2.933 | 0.388165 |
| 7.9999 | | С.867 | 2.276 | 0.033469; |
| 8 9999 | | С 917 | 1 766 | С 852263 |
| 9.9999; | | 0 967 | 1.37 | 1939343 |
| 10 9999 | | 0 983 | 1.063 | 0.003734 |
Yi" | | | 1.000; | 3.678 | 1.949887 |
| Сумма | | | | 7.027587 |
| | | | | |
Рис. 12.10. Вычисления критического значения критерия согласия