назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [ 31 ] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42]


31

ех post-оценки ошибок 2-го рода, поскольку данные о клиентах, чьи заявки на получение займа были отвергнуты, не хранятся.

ОПИСАНИЕ БАЗЫ ДАННЫХ ГОЛЛАНДСКОГО ИНВЕСТИЦИОННОГО БАНКА

По соображениям коммерческой тайны банк уклонился от того, чтобы полностью раскрыть схему выбора и построения совокупности 44 качественных переменных. В общих словах, в качестве переменных были выбраны показатели успеха, которые были признаны решающими на основании 45-летнего опыта работы в сфере инвестиций. Данное множество переменных годится для описания малых и средних компаний, действующих в самых разных отраслях, но не подходит для многонациональных компаний и для долгосрочного финансирования промышленных проектов. Конкретнее, охватываются следующие 5 групп факторов, влияющих на шансы фирмы выжить:

1Состояние рынка (10 переменньгх).

Сюда входит экзогенное окружение, на которое сама фирма влиять не может, в частности, влияние фазы торгового цикла и тенденции в структуре потребления.

2Положение на рынке (9 переменных).

Конкретные условия рынка, в которых действует данная фирма, анализируются более подробно в соответствующих терминах.

3Стратегия (9 переменных).

Цели компании на ближайшие годы с точки зрения их выполнимости и последовательности.

4Эффективность (9 переменньгх).

Производство или деятельность в сфере услуг оцениваются с точки зрения эффективности, логистики и дружественности окружения.

5Управление (7 переменньгх).

Работа высшего управляющего звена фирмы в прошлом и в настоящее время с учетом фаз жизненного цикла компании.

Все переменные принимают значения от О до 4, при этом соответствие следующее:

0значительно ниже среднего

1ниже среднего

2на среднем уровне

3выше среднего

4значительно выше среднего

Было замечено, что результаты очень чувствительны к выбору начального приближения и потому могут не быть оптимальными. Для удобства мы брали все время одинаковое число эпох и одно и то же начальное приближение для весов. Значимые переменные были выделены по результатам исследования зависимостей по отдельным переменным, хотя более правильным в данном случае представлялся бы многомерный подход.

Мы не пытались применять в этой задаче нелинейный (например, квадратичный) MDA-анализ - вероятно, это была бы более подходящая точка отсчета для оценки качества нейронного классификатора. Разница между линейной и квадратичной моделью может сказываться в случае, когда точки попадают на участок насыщения логистической кривой. Также не рассматривались и методы к ближайших соседей (fcNN = к Nearest Neighbour). Они являются непараметрическими методами классификации и не требуют предварительного задания вида зависимости. Следовательно, такие методы могут давать лучшее качество аппроксимации на выборке за счет разбиения пространства переменных на произвольное число областей для последующего принятия решений. Однако, поскольку ШN-мeтoды обычно разбивают базу данных с помощью расстояния Махаланобиса (d), при этом неявно предполагается, что межгрупповые матрицы дисперсии одинаковы (см. [19]). Более того, осмысленный прогноз возможен только в предположении, что эти матрицы постоянны во времени. В этом вопросе необходимы дальнейшие исследования.

ОПЫТ ОЦЕНКИ КРЕДИТНОГО РИСКА

В ГОЛЛАНДСКОМ ИНВЕСТИЦИОННОМ БАНКЕ

Выше мы рассказали о результатах классификации гипотетической совокупности компаний на основании оценок, сделанных группой польских экспертов в области кредитов. Нельзя при этом исключить, что работники банков сочтут построение достаточно содержательной базы качественных данньгх слишком трудоемким делом, и весь метод, будучи теоретически правильным, может оказаться непрактичным. Частично такие сомнения снимаются тем обстоятельством, что уже в настоящее время Голландский инвестиционный банк (N1B) (торговый банк, специализирующийся на средне- и долгосрочном финансировании корпораций) использует порядка 44 ка-чественньгх показателей для оценки кредитного риска по реальному инвестиционному портфелю, состоящему из займов, выданных банком своим корпоративным клиентам. Наряду с качественными показателями используются также 5 количественньгх. Используя информацию об этой работе, можно получить обобщения построенных нейронно-сетевых методов. При этом отсутствует возможность для



Совокупность переменных дополняется пятью количественными показателями. Сюда входят: степень прибыльности (отношение операционного дохода к используемому кагшталу), коэффициент платежеспособности (отношение собственного капитала к суммарному), ликвидность (отношение текущих активов к обязательствам), коэффициент покрытия (отношение операционного дохода к заемному капиталу) и разница между наивысшим и наинизшим показателями прибыльности за последние 4 года.

Итоговый показатель рисковости кредита получается как взвешенное среднее всех переменных. Он может принимать такие значения:

1банкроты

2перспективы неясны

3жизнеспособные

По каждому из трех классов мы получили доступ к данным, позволяющим вычислить рейтинги 10 компаний. Равномерность распределения наблюдений по классам повышает представительность данньгх и облегчает обучение (сравните это с предыдущими задачами, где нам приходилось уравновешивать неравномерность представительства в двух группах из трех). Так как особенности отраслей уже учтены в переменньгх, данные по разным группам не сравнивались между собой на предмет стандартизации факторов, характеризующих специфику отраслей и окружения.

Год оценки Класс целевой переменной

плохо (1)

средне (2)

хорошо (3)

всего

1986

. . . . .,.„ 2

1987 V

" 4

1988

1989

1990

0 10

Всего

Таблица 8.7. Кросс-таблица классов целевой переменной по годам оценки

Рейтингам, полученным из качественньгх переменньгх, придается в банке большое значение. Оценка компании проделывается финансовым менеджером совместно со специалистами из отделов финансирования корпораций и финансового анализа. Несмотря на то, что переменные по своей сути в высшей степени субъективны, выработка единого мнения как минимум трех специалистов такую субъективность уменьшает. Разумеется, и это мнение может быть результа-

том коллективной ошибки (и такой пример будет далее приведен). Вся описанная довольно сложная процедура применялась совершенно одинаковым образом ко всем 30 компаниям из выборки при принятии решения о предоставлении им кредита в период с 1986 г. по 1990 г. Таким образом, значения переменньгх отражали мнение банка о перспективах заемщика на момент рассмотрения его просьбы о займе. После этого состояние дел заемщика ежегодно оценивалось вновь. Все 30 компаний находились в 3-й группе в течение, по меньшей мере, одного года после получения займа в период 1986-90 гг., так что для наблюдения ех post были доступны только ошибки 1-го рода. Поэтому в качестве ех post-оценивающей (целевой) переменной мы взяли результат переоценки от декабря 1992 г. В табл. 8.7 приведены частоты для целевой переменной по всем годам.

Анализ главных компонент

При наличии 49 переменных и 30 наблюдений возникает проблема, связанная с числом степеней свободы.. Если число подлежащих оцениванию параметров превышает число наблюдений, то всегда можно достичь абсолютного соответствия модели наблюдаемым данным, но это соответствие будет на самом деле мнимым. Не имея возможности существенно увеличить число наблюдений, мы приняли решение уменьшить число переменных. При помощи нелинейного анализа главньгх компонент были выделены три наиболее значимых показателя (измерения), на которые приходится большая часть (около 60%) вариаций в исходной базе данньгх.

Измерение Собственное значение .

1..2487. ,...........фг.

2.л,.„ .1593-VJ-+-.--......w., -

3.1218 м.и7-гчка?;й:2.;й.» ;,«»).,, .**>

С первым измерением тесно связаны восемь переменньгх, причем все они являются эндогенными, т.е. зависят от способа управления, и характеризуют рыночную интуицию, приоритеты и дальновидность управления. Можно сказать, что это измерение служит количественным выражением качества управления фирмой. Следующее измерение связано с состоянием рынка вообще и положением данной фирмы на рынке и характеризует, в какой степени компания в состоянии должным образом реагировать на изменения обстановки. Третий показатель связан с эффективностью торговой политики фирмы. Производство с небольшой капиталоемкостью обычно в большей степени ориентировано на рынок в целом, а с большой капиталоемкостью - на продвижение конкретного продукта, и наоборот. Следует отметить, что количественные переменные модели вносят в эти



три измерения лишь относительно небольшой вклад. Малость этого влияния подтверждает предположение Арженти [15] о том, что финансовые переменные выражают скорее симптомы, чем причины явлений. В то же время исследуемые данные относятся к компаниям, чьи просьбы о предоставлении кредита были удовлетворены, так что с финансовыми показателями у них должно было быть все в порядке. Поэтому вопрос о том, существенно ли количественные показатели влияют на результат, остается открытым.

<>•*;,Sv-.;; .г:,4 .

ДВЕ ТОЧКИ ОТСЧЕТА: MDA И кШ i f u

Имея трехмерные числовые показатели, мы воспользовались линейным множественным дискриминантным анализом. Мы выбрали одинаковые (33%) априорные вероятности того, что данное наблюдение принадлежит той или иной группе. Данные о неправильньгх классификациях приведены в табл. 8.8.

Действительный

Число

Предсказанный номер группы

номер группы

случаев

1 2 3

60.0% 3

- 30.0%

0.0%

30.0% 4

40.0% 2

, ; 20.0%

10.0% 3

30.0% 8

80.0%

Группа 110

Группа 2 10

Группа 310

Доля правильно классифицированньгх случаев:

Таблица 8.8. Результаты классификации для MDA

Оценивая результаты классификации по методу MDA, мы видим значительную долю ошибочньгх решений по компаниям-банкротам (группа 1)- одной из них кредит был бы предоставлен. Фирмы с неясным положением (группа 2) с трудом поддаются правильной классификации, потому что, в конечном итоге, они могут попасть в 1-ю или 3-ю группу. Дело нельзя улучшить, приводя априорные вероятности в соответствие с представлениями банка о вероятности принадлежности фирмы различным группам. Общий показатель правильности прогноза составил всего 56.6%, причем из 1-й группы правильно классифицированы были только 30%.

В отличие от метода MDA, который разделяет все множество на группы линейно, метод к ближайших соседей (1-NN) выделяет группы, линейно разделяя их попарно. Коль скоро мы допускаем, что на-

Действительный 2 номер группы * ; ;

. 0

Доля правильно классифицированньгх случаев:

Таблица 8.9. Результаты классификации для метода ближайших соседей

РЕЗУЛЬТАТЫ КЛАССИФИКАЦИИ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ

Были опробованы различные нейронные классификаторы, основанные на стандартной MBPN-модели, и их результаты сравнивались с тем, что дают методы MDA и 1-NN. Чтобы сохранить естественное отношение упорядоченности между тремя классами, вьгход был выбран одномерным. Описанные выше три агрегированньгх количественньгх показателя никаким преобразованиям не подвергались, поскольку их значения лежат в интервале от -2 до 2, и это вполне подходит для подачи на входной слой сети. Оба скрытьгх элемента и выходной элемент имели сигмоидную функцию преобразования с единичной крутизной и коэффициентом обучения 0.1. Полученные на вьгходе значения разбивались на три группы в соответствии с предполагаемым вариантом ответа на основной вопрос:

О < вьгход < 0.33 положить вьгход равным О банкроты

0.33 < вьгход < 0.66 положить вьгход равным 0.5 неясно

0.66 < выход < 1 положить вьгход равным 1 жизнеспособные

Здесь, как и в предыдущих случаях, мы применяли процедуру перекрестного подтверждения (по очереди отбрасывая каждое наблю-

ша задача в какой-то степени нелинейна, этот метод представляется подходящим. Результат аппроксимации выборочного распределения (с применением обычного евклидова расстояния) этим непараметрическим методом может быть лучше, чем в предыдущем случае. Однако приведенные в табл. 8.9 результаты классификации говорят об обратном. Возможно, более подходящими для данной задачи оказались бы NN-методы более высокого порядка (например, 3-NN).

Предсказанный номер группы 1-NN

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [ 31 ] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42]