назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [ 21 ] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194]


21

Обратите внимание на то, что среднее значение зависимой переменной для наблюдений, попавших в ячейку 10, равно +3.22 %. Это означает, что для 535 дней, из которых сформирована ячейка 10, будущее изменение S&P 500 через 60 дней в среднем равнялось +3.22 %.

Среднее значение зависимой переменной для конкретной ячейки может снужить основанием для прогноза, обусловленного информацией, отличающейся от усреднения по большой выборке данных (т.е. по всем 5354 случаям). Потенциально такой прогноз лучше наивного предсказания. Чтобы понять, действительно ли он лучше, необходимо измерить сокращение степеней свободы.

Чтобы прояснить, как обусловленный прогноз выводится из текущего значения индикатора, предположим, что на данный день значение СОРП равнялось +0.24. Данное значение попадает в ячейку 10. Поэтому можно предположить, что через 60 дней S&P 500 вырастет на 3.22 %, так как это среднее будущее изменение для дней, попадающих в ячейку 10. Однако необходимо ответить на вопрос: действительно ли такой прогноз лучше, чем просто среднее значение по большой выборке? Что лучше: обусловленный или наивный прогноз? Этот вопрос является ключевым для определения предсказательной способности индикатора.

Что означает сокращение степеней свободы?

Обратите внимание - мы сказали, что обусловленный прогноз потенциально лучше наивного. Если окажется, что индикатор, на котором построен обусловленный прогноз, имеет предсказательную информацию, то обусловленный прогноз действительно даст лучшие результаты. Индикатор с предсказательной информацией, по определению, является таким индикатором, обусловленный прогноз на основании которого более точен, чем среднее значение зависимой переменной по большой выборке. Численное выражение того, насколько обусловленное предсказание точнее наивного, называется сокращением степеней свободы-

Читателю может показаться странным, что наивный прогноз может быть точнее обусловленного, однако часто бывает именно так. Если индикатор очевидно абсурдный - такой, как ДТС (дневная температура в Стамбуле), то нетрудно понять, что наивный прогноз окажется точнее. Но это не так легко понять, если индикатор выглядит разумно, как СОРП. В таких случаях объективная оценка, даваемая сокращением степеней свободы, имеет огромное значение.

Итак, сокращение степеней свободы измеряет, насколько точнее предсказания, основанные на средних значениях зависимой переменной в ячейках-«десятках» по сравнению с усреднением зависимой переменной по всем



данным. Если усредненное по всем данным значение зависимой переменной лучше предсказывает будуш;ее, чем усреднения по отдельным ячейкам, то значение сокраш;ения степеней свободы равно нулю или отрицательное. Если индикатор содержит полезную информацию, то сокраш;ение степеней свободы будет положительным. Чем выше сокращение степеней свободы, тем больше предсказательной информации содержит индикатор.

Возможность случайного сокращения

степеней свободы

К сожалению, в ходе исследований возникает одно довольно серьезное затруднение. Положительные значения сокращения степеней свободы могут быть получены случайно. Чем больше количество исследуемых индикаторов, тем больше вероятность случайных результатов. Полностью преодолеть эту проблему невозможно, но есть два способа свести ее к минимуму: перекрестное подтверждение и проверка значимости.

Для проведения перекрестного подтверждения данные разбиваются на два периода: для обучения и проверки. Первый период (обучения) используется для вычисления средних значений зависимой переменной для каждой ячейки. Полученные значения используются для предсказаний на независимом периоде проверки. Другими словами, требуется, чтобы предсказательная способность индикатора проявилась на двух независимых периодах данных. Индикаторы, которые только случайно показали хорошие результаты на одном периоде, скорее всего не смогут хорошо предсказывать на другом периоде и будут отвергнуты.

Несмотря на внутреннюю строгость метода перекрестного подтверждения, остается небольшая вероятность того, что плохой индикатор случайно даст хорошие результаты и на периоде обучения, и на периоде теста. Поэтому вводится еще одна проверка - требуется, чтобы значение сокращения степеней свободы превышало некий порог значимости. Уровень порога значимости определяется с помощью сложной статистической теории. Эта теория помогает определить, какой уровень сокращения степеней свободы может быть случайно достигнут бесполезным индикатором в течение 5 % времени. Индикаторы, успешно прошедшие оба теста, скорее всего содержат полезную предсказательную информацию.

Оценка индикатора отношения роста/падения

методом ячеек

Мы оценили индикатор СОРП методом ячеек. Оказалось, что он имеет очень слабую предсказательную способность. Кроме сглаживания по 10 дням.



Индикатор

10 дней

Временной горизонт 20 дней 60 дней 120 дней

250 дней

сорп/10

+0.00

сорп/13

+0.00

сорп/20

+ 0,

+ 0.00

сорп/40

+ 0,

+ 0.00

сорп/52

+0.00

сорп/66

+0.00

+ 0.

+ 0,

+ 0,

сорп/100

+0.00

сорп/150

+0.00

Анализ CO многами переменными

Выше бьшо описано использование метода для оценки одного отдельного индикатора.

Однако использование нескольких индикаторов вместе может повысить предсказательную способность модели. Объединение информации нескольких индикаторов может привести к значительным результатам. Объединив несколько индикаторов, которые по отдельности не имеют предсказательной способности, иногда можно получить очень эффективную модель. Обнаружению подобных эффектов посвящено отдельное направление анализа данных - анализ со многими переменными. С помощью методов этого анализа можно построить действительно полезные модели для прогноза.

Компьютерные реализации метода ячеек

Несколько программ по методу ячеек разработано в составе системы распознавания фигур и информационного синтеза (PRISM), которая является

мы проверили и другие сглаживания, чтобы определить, не улучшит ли это качество прогнозов с помощью СОРП. В таблице на рис. 18 приведены значения сокращения степеней свободы для каждого сглаживания СОРП и для пяти временных горизонтов.

Из таблицы видно, что СОРП сам по себе практически лишен предсказательной способности. Однако, это не означает, что он не сможет внести свой вклад в сокращение степеней свободы в модели с несколькими переменными. Для ответа на этот вопрос необходимо провести дальнейшие исследования.

Рис.18:

Сокращение степеней свободы для нескольких версий СОРП и для пяти временных горизонтов

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [ 21 ] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] [167] [168] [169] [170] [171] [172] [173] [174] [175] [176] [177] [178] [179] [180] [181] [182] [183] [184] [185] [186] [187] [188] [189] [190] [191] [192] [193] [194]