назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [ 37 ] [38] [39] [40] [41] [42]


37

где d-i - правильный сигнал для к-то образца, а - сигнал, который выдает сеть. В формулу включен параметр Г для того, чтобы веса не могли принимать очень больших значений, - это сужало бы класс функций, которые сеть способна реализовать. Такой критерий ошибки уже обсуждался в гл. 1 (соотношение (17)).

Далее, был введен параметр 9, чтобы уменьшить число сигналов о покупке/продаже, выдаваемых сетью. Смысл этого очевиден: количество сделок в течение одного дня ограниченно из-за расходов на совершение сделок (транзакционных издержек). Сеть никогда не даст на выходе значение, в точности равное 0.5, и мы относили к нейтральным все сигналы, лежащие от 0.5 на расстоянии плюс/минус 9.

Для оценки качества работы сети использовались три показателя, аналогичные тем, которые были взяты в табл. 10.3:

•i?(KynHTb)- средний доход по сигналам на покупку,

•]?(продать)- средний доход по сигналам на продажу,

•i?(KynHTb/npoflaTb) - средний доход по сигналам обоих видов.

РЕЗУЛЬТАТЫ РАБОТЫ НЕЙРОННОЙ СЕТИ

5-20-1-сеть обучалась в течение 3000 эпох. Число скрытых элементов было выбрано волевым образом из расчета, чтобы было достаточно вычислительных ресурсов для размещения сигмоидов в гиперпространстве. Коэффициент обучения е был взят равным 0.25, а ограничивающий параметр г\ - равным 0.0005. Так как обучение прекраща-

ется после фиксированного числа эпох и нет оснований ожидать, что сходимость будет достигггута, то и не следует обращать слишком большое внимание на числовые значения параметров. Однако на моделях с нужными свойствами даже ранняя остановка обучения (как это имеет место в нашем случае) может дать определенный результат. При этом произвол в выборе параметров является главным недостатком нейронно-сетевого подхода.

В табл. 10.4 представлены результаты, которые показала обученная сеть на новых данных при различных значениях отсекающего порога. Транзакционные издержки, по-прежнему, в расчет не брались. Интересно, что с повышением порога (т.е. при уменьшении количества сделок) возрастали доли правильных сигналов и на покупку, и на продажу. По-видимому, те неэффективности (т.е. малые отклонения от 0.5-линии на рис. 10.3), которые имели место в периоде обучения (1970-е годы), подтвердились в проверочном периоде (1980-е годы).

При 9 = 0 доля правильных сигналов была менее 50%, потому что в этом случае каждый раз должен был выдаваться сигнал (на покупку или продажу), тогда как в значениях целевой переменной до 10% могут составлять распоряжения удерживать имеющуюся позицию. На рис. 10.4 показана зависимость достигнутого дохода от пороговых значений. Средний доход на одну сделку (покупку или продажу) примерно 0.13% выигрывает в сравнении с безусловным средним доходом 0.064% (для наибольших значений 9).

0.05 0.075 0.09

0.1 0.105

Порог

0.11 0.115 0.12 0.125

Сеть---Средний доход

• Сеть-покупка

• Сеть-продажа

Рис. 10.4. Совокупный доход для возрастающих значений 0

Модель торговли достигает наилучших показателей при количестве сделок около 250 в расчете на все тестовое множество (или около 25 сделок в год). Дальнейшее уменьшение числа сделок путем поднятия порога приводит к уменьшению дохода на одну сделку.

8-6928

от 0.5-гиперплоскости (жирная кривая), или, иначе говоря, такое решение, которое дало бы квадратный корень из среднеквадратичной ошибки RMSE, близкий к 0.5 (за вычетом нейтральных сигналов). Степень обучения трудно отследить с помощью подтверждающего множества, так как при исходных малых случайных весах (сплошная 0.5-линия) ошибка RMSE уже будет близка к 0.5. Мы не применяли известный метод перекрестного подтверждения, потому что процедура обучения обычно прекращалась сразу же, когда начинал работать обучающий алгоритм (в зависимости от порядка подачи образцов обучающего множества). Вместо этого мы использовали методы регуляризации.

Для того чтобы сеть не выдавала слишком сложную решающую поверхность, в критерий ошибки был добавлен штрафной член и соответствующим образом изменен алгоритм обучения. В результате мы минимизировали следующее выражение:

E=-bd,-s,y+j;W,(3)



£ а /о о

&

£

£

£

к; О о о

« 9

§ £

со го

со О)

1 ГО

о оо

CN 1Л

CN 1Л

ю тр

00 1Л

00LO

. ГО

, in

, CN

I тг CN On On

On CN OO ГО о CN 00

ON d 00

, о d

о oo oo

§s

o; CO

ON -1 Ю 22

о Tf о • о

о о о о о о So IP I d d о

ООО о I О

d d

о о о

. CN

CNГ:; О

On t

Tj< 00 COCN . .

00 О CO-H LO

О :О

P о То

ON lO

. со

ON ON ON CN о CN

Ю . CO

ЧО.

о го о

4§d§s

CN CN

00 CN

CN

LO LO

О

CN Ю ГО

ГО CN

CN ,

CO ro

о S

о о

X SB

к :

a;-m

о;

SB

4• ST,

-Ли-в

12345

Образцы входных данных с большой положительной активацией выхода

1 I-

12345

Образцы входных данных с большой отрицательной активацией выхода Рис. 10.5. Примеры активации

Чтобы лучше представить себе механизмы, стоящие за сигналами на покупку или продажу, мы изобразили на графике (см. рис. 10.5) восемь входных образцов, породивших правильные сигналы, соответственно, на покупку и продажу. Мы не исследовали каждое значимое отклонение от 0.5-линии по отдельности (это можно сделать, например, при помощи техники кластеризации весов состояния методом Гормана и Сейновского [127], который обсуждался в гл. 4), и поэтому из результатов, относящихся к этим восьми примерам, нельзя делать обобщения. Однако, образцы внутри каждой группы обладают определенными общими чертами, и это говорит о том, что они соответствуют одним и тем же областям в пространстве входов.

/ \\/ж



ooooooooooooogocDpooooooo

Число дней

Рис. 10.6. Нереализованная прибыль

ОБСУЖДЕНИЕ

Применение нейронных сетей в этой задаче показало, что статическая нелинейная система может быть обучена так, чтобы выполнять технический анализ на начальном уровне. Наш подход отличается от других, известных в этой области, тем, что мы не пытаемся оптимизировать входное множество. На вход сети, предсказывающей направление будущих изменений цен, подавались временные ряды данных в исходном виде. При помощи перемасштабирования данных достигалась инвариантность пространства входов. Затем сеть обучалась с использованием регуляризирующего штрафного члена, ограничивающего положение интерполирующей поверхности, построенной нейронной сетью. Модель выдавала до 54% правильных сигналов.

Этот результат, по-видимому, свидетельствует о присутствии свойств неэффективности рынка (которые определяются как малые отклонения от 0.5-гиперплоскости) и о том, что нейронная сеть является адекватным инструментом для их обнаружения. Однако необходимы дальнейшие исследования, прежде чем данный метод можно будет использовать непосредственно в торговом зале. При том, что результаты оказались многообещающими, прибыльной стратегии торговли не выработано. Мы хотим высказать ряд предложений, реализация которых, по нашему мнению, могла бы способствовать выработке более совершенной стратегии торговли.

Во-первых, следует расширить базу данных и таким образом повысить представительность данных и увеличить размерность входньгх образцов. Это можно сделать, включив в рассмотрение акции других компаний, похожих на Юнилевер. При этом остается неясным, как определить степень сходства.

Во-вторых, можно было бы использовать данные котировок с мониторов (тикеров) и таким путем увеличить частоту поступления данных и получить возможность использовать экономический (или операционный) масштаб времени, когда время сжимается (соответственно, растягивается) по сравнению с календарем. Не следует также недооценивать возможность подключения подсказок (см. [ 1], [2]).

В-третьих, сеть, использующая радиальные функции, позволяет получить локально более точные отображения, чем классическая сиг-моидальная, и за счет этого, по-видимому, можно добиться более точного распознавания «неэффективностей» в пространстве входов. Далее, доверительные интервалы (полосы ошибок) можно вычислять по методам, которые были предложены МакКеем [184] и Ле Каном [174]. Правда, эти методы предполагают сходимость обучающего алгоритма.

Четвертое: улучшение характеристик может быть получено за счет использования другого критерия ошибок, который включал бы в себя транзакционные издержки и, наряду с абсолютным значением, раздельный подсчет потоков платежей в обоих направлениях. Другая возможность заключается в том, чтобы ввести дополнительный выходной элемент, выдающий абсолютное значение дохода.

И последнее: модель может быть включена в качестве составной части в многосетевую среду принятия решений, а полученная общая производительность - измеряться, исходя из заданного решающего правила (см. [290]). Наконец, более динамичные подходы можно получить, используя рекурсивные сети с механизмами обратной связи.

Наконец, есть еще один способ оценить качество модели: подсчитать, сколько денег вы заработаете с ее помощью. На рис. 10.6 представлены соответствующие результаты для 9 = 0.15. Сигналы на покупку или продажу дают возможность трейдеру свести свой дневной баланс с плюсом. Ложные же сигналы уменьшают суммарный доход. Нейтральные сигналы игнорируются, т.е. полученный доход переходит на следующий день. При торговле по данной системе, в предположении, что все сигналы были правильные, будет получено 14% от максимально достижимого дохода. Хорошо видно, что система дает отклонение в положительную сторону от линии случайного прогноза. Однако, если бы учитывались транзакционные издержки, то прибыли могло и не быть.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [ 37 ] [38] [39] [40] [41] [42]