назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [ 58 ] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71]


58

узле. Множество ограничений определяет условия, которым должны удовлетворять примеры, чтобы достичь данного узла - эта информация используется при формировании набора вопросов для создаваемого нового узла. Для завершения процедуры построения дерева TREPAN использует локальный критерий - он оценивает состояние данного узла и решает, превратить ли его в лист, и глобальные критерии - максимальный размер дерева и общую оценку качества классификации примеров деревом.

Возникает естественный вопрос: "А зачем вообще нужна нейронная сеть для данного алгоритма?" Ведь он может просто использовать обучающую выборку - известно же, какому классу принадлежит каждый пример. Более того, как бы хорошо ни была обучена сеть, она все равно будет делать ошибки, неправильно классифицируя некоторые примеры. Дело в том, что именно использование нейросетей в качестве Оракула дает возможность получать деревья решений, имеющих более простую структуру, чем у деревьев, обученных на исходных примерах. Это является следствием как хорошего обобщения информации нейронными сетями, так и использования при их обучении операции исправления данных (CLEARNING). Кроме того, алгоритмы построения деревьев, исходя из тренировочного набора данных, действительно разработаны и с их помощью такие деревья строятся путем рекурсивного разбиения пространства признаков. Каждый внутренний узел подобных деревьев представляет критерий расщепления некоторой части этого пространства, а каждый лист дерева - соответствует классу векторов признаков. Но в отличие от них TREPAN конструирует дерево признаков методом первого наилучшего расширения. При этом вводится понятие наилучшего узла, рост которого оказывает набольшее влияние на точность классификации генерируемым деревом. Функция, оценивающая узел п , имеет вид F(n) = r(n)(l - f (п)) , где г(п) - вероятность достижения

узла п примером, а /(п) - оценка правильности обработки этих примеров деревом. TREPAN очень интересно осуществляет разделение примеров, достигающих данный внутренний узел дерева, а именно, использует так называемый т- of -п тест. Такой тест считается выполненным, когда выполняются по меньшей мере т \лг п условий. Если, например, имеется 3 булевых переменных XjjXjjXj, то использование выражения 2 - о/- {Xj, -iXj,Х3} будет

эквивалентно использованию логической функции (Xj п -iXj) и (Xj п Х3) и (-iXj 0X3). Подобная формулировка правил делает деревья вывода более компактными и четкими. Приведем пример дерева решений, полученного алгоритмом TREPAN, Оракулом в которой являлась нейронная сеть, обученная предсказывать курс обмена немецкой марки на доллар (Weigend et al., 1996). Заметим, что для обучения сети использовался рекомендуемый для финансовых приложений метод CLEARNING, с которым мы уже познакомились. Сеть обучалась на данных, охватывающих период с 1985 по 1994 гг. и предсказывала рост или падение курса обмена на следующий день в течение всего 1995 г.



f доход инвестирования DM н доход инвестирования DM на -j qj t рынок акций США* рынок акций Франции

рыно Y/$:F(Y)<0.39

рынок акции Фраи DM/$>I(D) ? нет f,( DM/$):F(DM)>0.17

f2( DM/$):F(DM)<0.17 f3(SF/$):F(SF)<0.39

f4(DM/$)<-1.02 f5(F(DM)>-1.38 fs( DM/$)<-0.1

f7(SF/$):F(SF)<0.16 }

f,( DM/$):F(DM)<-0.32

f3(SF/$):F(SF)<0.06

f3(SF/$):F(SF)<-02] JM/$)

f3(F(DM)<0.37j (М/$,

DM/$

DM/$ (dm

Рисунок 5. Дерево решений, построенной с использованием нейронной сети, обученной предсказывать рост или падение курса немецкой марки по отношению к доллару США. Обозначения: DM - немецкая марка; Y-иена; SF - швейцарский франк; $- доллар США; F- фьючерс; f - мера; 1(D)-германский интерес. DM/$ - курс марки по отношению к доллару - другие курсы обозначены аналогичным образом.

Таким образом, нейронные сети могут эффективно использоваться в практически важных задачах извлечения хорошо сформулированных знаний не только в случае, если их структура достаточно проста, но и в общем случае.

ЛИТЕРАТУРА

Craven, M.,W., & Shavlik, J.,W. "Extracting tree-structured representations of trained networks". In Touretzky, D., Mozer, M. and Hasselmo, M., eds. Advances in Neural Information Processing Systems (volume 8). MIT Press, Cambridge МА/

Lu Hongjun, Setiono, R. and Liu Huan (1995). "NeuroRule: A connectionist approach to Data Mining". Proc.oftiie 21st VLDB Conference, Zurich, Swizerland

Weigend, A.,S. and Zimmerman H.,G. "The observer-observation dilemma in Neuro-Forecasting: Reliable models from unreliable data through CLEARNING". http: www.cs.colorado.edu/~andreas/Home.html

Weigend, A.,S., Zimmermann, H.,G., and Neuneier, R. (1996) "Clearning. In Neural Networks in Financial Engineering", World Scientific, Singapore.



Глава

Предрказание рисков и рейшнгование

Зачем нужны и какие бывают рейтинги? Нейросетевое рейтингование ценных бумаг. Предсказание банкротств. Возможно ли объективное рейтингование? Пример нейросетевого анализа российских банков.

Ш Если хотите броситься из окна, - сказал Швейк, - так идите в комнату, окно я открыл. Прыгать из кухни я бы вам не советовал, потому что вы упадете в сад прямо в розы, поломаете все кусты, и за это вам же придется платить. А из того окна вы прекрасно слетите на тротуар и, если повезет, сломаете себе шею. Если же не повезет, то вы переломаете себе только ребра, руки и ноги и вам придется платить за лечение в больнице. Я.Гашек. Похождения бравого солдата Швейка

Введение: предсказание рисков

Существуют две базовые инвестиционные стратегии: активная, основанная на предсказаниях доходности тех или иных активов, и пассивная, в которой рынок полагают непредсказуемым, и главной целью ставят минимизацию рисков. Оценка инвестиционного риска, таким образом, является одним из краеугольных камней финансового анализа. В этой главе рассмотрены основные нейросетевые методики оценки рисков и составления рейтингов.

Эти методики используют два основных подхода: обучение с учителем - на примерах экспертных оценок или обанкротившихся фирм, и обучение без учителя - путем категоризации имеющихся данных. Сначала рассмотрим первый, более прямолинейный подход.

Рейтинги ценных бумаг

Рейтинг корпоративных облигаций

Существенную часть рынка ценных бумаг составляют корпоративные облигации - займы корпораций под фиксированный процент. Только на Нью-Йоркской Фондовой бирже в 1992 г. обращались облигации около 1500 компаний с общей номинальной стоимостью свыше $260 млрд. Для оценки риска невыплаты процентов или невозврата денег по облигации практически для всех таких корпораций существуют и периодически обновляются рейтинги, составляемые независимыми рейтинговыми агентствами.

В рейтинговом бизнесе доминируют две компании: Standard & Poors и Moodys. Свыше 2000 долговых эмитентов поставляют свои финансовые отчеты этим двум организациям. Рейтинги этих агентств чрезвычайно авторитетны, от них напрямую зависят процентные ставки по

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [ 58 ] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71]