назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [ 27 ] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96]


27

говоря, чем больше испытаний, тем меньшим будет отклонение эмпирический вероятности «успеха» от ее математического ожидания.

Для модели «идеальная монета» с возрастанием числа испытаний г абсолютное отклонение числа «успехов» возрастает, а отклонение вероятности «успеха» от ее математического ожидания убывает.

Для оценок вероятности отклонения непосредственно самой вероятности «успеха» можно также пользоваться теоремой Чебышева.

Ползенная таким образом оценка называется доверительным интервалом.

Статистическая проверка биномиальных гипотез. Статистические данные о вероятности «успеха», полученные в экспериментах по биномиальной модели испытаний, могут подтверждать или опровергать оценку, теоретически принятую в качестве рабочей гипотезы.

Это выясняется на основании того, в какой мере отклонения экспериментальных данных укладываются в теоретически определенный доверительный интервал.

Экспериментальные результаты позволяют дать статистическую оценку справедливости теоретически принимаемых гипотез о случайности или закономерности отклонений от математического ожидания.

Рассмотрим пример.

Предположим, что некий разработчик рекламирует свой программный продукт, утверждая, что изобретенная торговая система генерирует «сигнал», который дает результаты, осторожно оцениваемые как р > 0,5. Если в качестве «нулевой гипотезы» считать условие р = 0,5, то это «несколько лучше».

Иначе говоря, предполагается, что получаемый с помощью предлагаемой системы результат не является «чисто» случайным совпадением, а закономерно отражает заложенные разработчиком в чем-то верные соображения и представления о поведении рынка.

Но потенциальный клиент занимает осторожную позицию и начинает с «нулевой гипотезы», согласно которой результаты все же будут случайным совпадением. А отклонения от р = 0,5 лежат в пределах статистической ошибки.

Для статистической проверки «нулевой гипотезы» специалистами было решено провести 25 экспериментальных торговых операций, которые должны показать, выйдет ли эффективность «сигнала» за пределы ожидаемых случайных совпадений.

Делаем расчет дисперсии вероятности для «нулевой гипотезы» (р = 0,5):

= (Р X q) / г = (0,5 X 0,5) / 25 = 0,01.

Тогда стандартное отклонение от значения р = 0,5 - это s = 0,1.



Ф. Мостеллер, Р. Рурке, Дж. Томас. С. 367.

Согласно грубой оценке по теореме Чебышева (для р = 0,5), имеем следующие доверительные интервалы:

• с вероятностью 75% все отклонения будут в пределах:

0,3 < р < 0,7 (т.е. 0,5 - 2 X 0,01 и 0,5 + 2 х 0,01);

• с уверенностью на 90% для пределов:

0,2 < р < 0,8 (т.е. 0,5 - 3 X 0,01 и 0,5 + 3 х 0,01).

Это означает, что вполне уверенно (не менее чем на 90%) можно будет говорить о подтверждении заявления трейдера об эффективности его системы генерирования «сигнала», если значение:

р(ехр) > 0,8.

Иначе говоря, число «успехов» должно оказаться выше 20 из 25 генерированных «сигналов». Соответственно варианты значений р(ехр), которые хуже, не могут рассматриваться как удовлетворительные по данному критерию.

Впрочем, все зависит от того, какие доверительные интервалы рассматриваются как приемлемые по своей доказательности. Если ограничиться 75%-ным критерием, то «барьером», который потребуется преодолеть, станет 17 из 25.

Теорема Байеса и вероятность совпадения. Обратим внимание на то, сколь значительным может быть даже чисто случайное отклонение. Даже, если в ходе проверки успешно сработают все 25 сигналов, это тоже может быть случайностью, хотя и маловероятной. Необходимую ясность здесь способны внести только дополнительные эксперименты.

Но до того, как они начнутся, оценка вероятности «успеха» вызывает к себе лишь некоторую степень доверия, которая в свою очередь основана на интуиции, здравом смысле или каких-то иных гипотетических соображениях наблюдателя.

Чтобы отличать такое сугубо личное отношение от статистически обоснованных оценок, иногда говорят о «персональных» вероятностных суждениях*. Тем самым подчеркивается факт выражения личной (персональной) степени доверия наблюдателя к исходной (априорной) оценке вероятности.

Конечно, последующие дополнительные эксперименты могут укреплять или ослаблять эти «персональные» оценки.

Уже представленную ранее теорему Байеса об условной вероятности и принято использовать для внесения изменений, соответствующих результатам экспериментов.



Теорема Байеса является одним из оснований, которое используется для внесения изменений в исходные гипотетические представления в результате дополнительной экспериментальной проверки.

Рассмотрим развитие ситуации в нашем прежнем примере: после некоторой доработки разработчик уточнил свое утверждение. Теперь он уверен, что его система способна давать результат на уровне 7 «успехов» из каждых 10 генерированных «сигналов».

Таким образом, скептик должен предварительно как-то определить свое личное отношение к двум гипотезам: «нулевой» и «0,7». В такой ситуации удобно использовать оценки в виде шансов в пользу той или иной гипотезы (как это обычно делается в букмекерских конторах).

Скептик «посоветовался с собой» и решил, что «нулевой гипотезе» (р = 0,5) он доверяет на 98%, а «гипотезе р = 0,7» - лишь на 2%. Это и есть «персональные» вероятности: Р(перс; р = 0,5) = 0,98 и Р(перс; р = 0,7) = 0,02.

Здесь важно подчеркнуть, что гипотезы, которые относятся к вариантам р = 0,5 и р = 0,7, должны составлять пространство элементарных событий. Это значит, что если степень доверия к одному из них выражается как Р(перс), то степень доверия к другому событию обязана стать 1 - Р(перс).

В данном слзае имеем «крайне скептическое» соотношение - 49:1 в пользу «нулевой гипотезы».

Далее, скептик проконтролировал 25 экспериментов по генерированию «сигнала» и зафиксировал 17 «успехов», что соответствует р(ехр) = 0,68.

Подвели итог.

Разработчик посчитал, что он «почти доказал» свое утверждение. Но скептик сомневается: ведь результат-то оказался на границе лишь 75%-ного доверительного интервала.

Тем не менее, скептик не может игнорировать полученные в ходе эксперимента данные и готов внести в исходные шансы (49:1) коррективы, но только на основе научной аргументации.

В этом качестве и служит теорема Байеса: необходимо рассчитать степень доверия к двум гипотезам (р = 0,5 и р = 0,7) при условии, что произошло событие р(ехр) = 0,68.

Тогда скорректированные шансы в пользу «нулевой гипотезы»:

Р(перс. для р = 0,5) X Р(к = 50%; г = 25; р = q = 0,5) Р(перс. для р = 0,7) X Р(к = 68%; г = 25; р = 0,68; q = 0,32)

Можно посчитать самостоятельно или найти по таблицам*, что: Р(к = 50%; г = 25; р = q = 0,5) = 0,032

Ф. Мостеллер, Р. Рурке, Дж. Томас. Вероятность. Таблица III, Часть А.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [ 27 ] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96]