сят или могут быть предсказаны, исходя из текущего значения индикатора.
Метод ячеек дает оценку этой зависимости: оценка может принимать любое значение от О % до 100 %. Величина 100 % означает способность индикатора полностью предсказывать будущее, тогда как О % означает совершенное отсутствие предсказательной информации. Такие оценки называются сокращением степеней свободы.
По нашему опыту, индикаторы с оценкой, близкой к 100, не существуют. Финансовые рынки слишком сложны и подвержены случайным скачкам, поэтому невозможно найти индикатор, обладающий такой предсказательной силой. Обычно индикаторы оцениваются в пределах от О % до 10 %, причем большая часть ближе к нулю, чем к 10. Достигнуть больших уровней сокращения степеней свободы можно путем обьединения несколышх дополняющих друг друга индикаторов в модель с многими переменными. Такой вид моделирования весьма сложен, он будет обсуждаться далее в этой главе.
Основное преимущество метода ячеек состоит в том, что он позволяет сравнивать различные индикаторы по отношению к нескольким временным горизонтам. Это очень важно, так как часто в распоряжении аналитика есть целая библиотека различных индикаторов, однако нет метода, позволяющего сравнить их предсказательную ценность для краткосрочного, среднесрочного и долгосрочного прогнозов.
Как производится исследование по методу ячеек
Чтобы на примере показать работу метода ячеек, рассмотрим его применение для исследования хорошо известного индикатора: сглаженного отношения роста/падения (СОРП) Нью-Йоркской фондовой биржи (smoothed advance/decline ratio). Отношение определяется как разность между числом растущих и падающих акций, поделенная на полное число торгующих акций. Так как ежедневный график этого отношения колеблется случайным образом, многие аналитики сглаживают его с помощью скользящего среднего, обычно десятидневного. Ддя данного исследования мы использовали эквивалентное экспоненциальное скользящее среднее (постоянная сглаживания 0.1818). Ддя прогноза бьшо выбрано будущее процентное изменение индекса Standard and Poors 500 (S&P 500) на временном горизонте 60 дней. Предсказываемая величина на языке статистического анализа называется зависимой переменной. Слово зависимая здесь означает, что значение этой переменной в какой-то степени зависит от текущего значения индикатора. Сокращение степеней свободы, определенное с помощью метода ячеек, есть численное измерение этой зависимости.
Сокращение степеней свободы определяется статистически по историческим данным. Ддя данного исследования бьши взяты дневные данные с 1
| больше чем | + 0. | | | |
| больше чем меньше или равно | + 0, + 0, | ,094 ,13 | | |
| больше чем меньше или равно | + 0, +0, | , 064 ,094 | | |
| больше чем меньше или равно | + 0, + 0, | , 038 .064 | | |
| больше чем меньше или равно | +0, + 0, | .013 .038 | | |
| больше чем меньше или равно | -0, + 0 | .014 .013 | | |
| больше чем меньше или равно | -0, -0, | . 047 .014 | | |
января 1945 по 1 июля 1986, всего 10 708 наблюдений. Для сокращения вычислительного времени мы использовали для анализа данные через день, всего 5354 наблюдений. Каждый прощедщий день, или наблюдение, характеризовался двумя величинами: значением индикатора СОРП на данный день и значением зависимой переменной (процентным изменением индекса S&P 500 за следующие 60 дней).
В основе метода ячеек лежит объединение наблюдений с близкими значениями индикатора в отдельные группы, или ячейки. Сортировать данные можно самыми разными способами, однако самый распространенный из них основан на «десятках». Для распределения в «десятки» создается 10 ячеек с одинаковым количеством наблюдений в каждой (а именно, 10 %). Распределение в «пятерки» гораздо фубее - создаются 5 ячеек, в каждой по 20 % наблюдений. Так как для разного количества ячеек результаты исследований могут отличаться, рекомендуется проводить эксперименты с разным числом ячеек. При этом наиболее надежные индикаторы дадут хорошие результаты для многих разбиений на ячейки. Для иллюстрации метода мы использовали ячейки-«десятки».
Процесс группировки данных начинается с сортировки всех 5354 дней в соответствии с их значением СОРП. Дни, попавшие в верхнюю «десятку» (т.е. 535 дней с наибольшими значениями СОРП), помещаются в ячейку 10. Из оставшихся 4819 дней, 535 дней с наибольшими значениями СОРП помещаются в ячейку 9. В ячейку 8 помещаются следующие 535 дней с наибольшими значениями СОРП. Процесс группировки продолжается до тех пор, пока 535 наблюдений с наименьшими значениями СОРП не попадут в ячейку 1. В нашем случае, в ячейку 10 попали дни со значениями СОРП, большими чем +0.13. В ячейке 1 оказались наблюдения со значениями СОРП, меньшими чем -0.146. В следующей таблице показаны уровни СОРП, разделяющие разные ячейки.
ЯчейкаУровень СОРП Количество случаев
ЯчейкаУровень СОРПКоличество случвев
| больше чем меньше или равно | -0, -0, | .088 и .047 | |
| больше чем меньше или равно | -0, -0, | .146 и .088 | |
| меньше чем | | .146 | |
После того, как все 5354 наблюдения были распределены по соответствующим ячейкам, ограниченным уровнями СОРП, мы переходим к исследованию зависимой переменной. Напоминаем, что каждое наблюдение характеризуется еще одной величиной - его зависимой переменной, которая в нашем случае является будущим процентным изменением рынка. Во-первых, вычислим среднее значение зависимой переменной «по большой выборке» (по всем 5354 наблюдениям). При усреднении по 40 годам данных, используемых в нашем исследовании, среднее значение зависимой переменной равно -1-1.85 %. Другими словами, для всех 5354 случаев среднее процентное изменение через 60 дней равняется -1-1.85 %. Эта положительная величина отражает долгосрочный растущий тренд фондового рынка с 1945 года.
Такое среднее значение по большой выборке данных может служить основой для простейшего прогноза. По этой причине оно часто называется наивным предсказанием. Если необходимо сделать прогноз, не имея другой информации, то такое среднее значение является лучшей оценкой того, что можно ожидать через 60 дней. Под другой информацией мы подразумеваем значение индикатора на данный день.
Затем подсчитываются средние значения зависимой переменной для каждой ячейки. Другими словами, начиная с ячейки 10, в каждой ячейке вычисляется среднее значение зависимой переменной по 535 наблюдениям. Полученные величины приведены в следующей таблице:
Усредненнвя Ячейказввисимая
переменнвя
| +3.22% |
| +2.29% |
| +2.34% |
| +1.82% |
| +1.55% |
| +1.23% |
| +1.31% |
| +1.66% |
| +1.37% |
| +1.70% |