назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [ 18 ] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42]


18

ANNUAL

AIBOR

RAIN

Положительное

Нейтральное

Отрицательное

Таблица 4.4. Влияние отдельных переменных (по видам)

Хотя в целом переменные RAIN и AIBOR ведут себя индифферентно, обращают на себя внимание случаи, когда их вклад положителен (таких, соответственно, И и 7). Эти случаи заслуживают дальнейшего исследования. С другой стороны, годовой прогноз, который по результатам регрессии играет значительную роль, в 11 случаях неожиданно дает отрицательный вклад.

Можно сделать вывод о том, что здесь желателен дальнейший анализ, который включал бы в себя выявление различных типов входных конфигураций и формирование на их базе архетипов. Разработка такой типологии может привести к выводу правил, с помощью которых MoF сможет более точно предсказывать уровень валовых налоговых поступлений.

Подход, основанный на исследовании архетипов, соответствующих кластерам похожих наблюдений, обладает тем достоинством, что он является многомерным, и в этом состоит его отличие от анализа весов и влияний. Горман и Сейновски [127] предложили способ кластеризации наблюдений с помощью весовой матрицы, зависящей от весов соединений, идущих от входных элементов к исследуемому i-му скрытому элементу. Для fc-ro наблюдения метрический вектор,

или вектор весов-состояния, Q имеет вид Qf\i] = [w,ypj*], где р- выход j-ro входного элемента. Затем для каждой пары векторов весов-состояния вычисляется евклидово расстояние между ними, и все они записываются в матрицу расстояний. На последнем этапе к этой матрице применяется метод иерархической кластеризации. Наблюдения с близкими векторами весов-состояния образуют кластер. Усредняя все наблюдения, принадлежащие одному кластеру, получаем центроид этого кластера. Все центроиды могут быть упорядочены по уровню выходного сигнала или по уровню активации нужного скрытого элемента. Вся процедура проделывается независимо для каждого скрытого элемента. В нашем случае конфигурация сети имеет два скрытых элемента, так что описанный шаг повторяется дважды. Особенно важны значения тех центроидов, которые наиболее сильно активируют данный элемент. Поскольку вес связи, идущей от второго скрытого элемента (РЕ2) к выходному (PEOUT), очень мал (0.09), с учетом того факта, что элемент РЕ1 не всегда насыщается (уровень активации меняется в интервале [0.01,0.77]), мы при дальнейшем анализе элемент РЕ2 из рассмотрения исключим.

Подход, основанный на рассмотрении векторов весов-состояний, хорошо подходит для сетей такой архитектуры, где имеется только один скрытый слой и нет непосредственных связей между входом и выходом. Поскольку конфигурация нашей сети не удовлетворяет второму требованию, подход был несколько видоизменен.

мой весов, поэтому при анализе необходимо учитывать и сами входные значения. Далее мы рассмотрим два эвристических способа такого анализа.

Прежде всего мы измеряем чувствительность решения к изменениям значения одной входной переменной. Здесь пока каждая переменная учитывается изолированно. Для того чтобы учесть их возможное взаимодействие, мы во втором методе, независимо друг от друга, оцениваем уровни активации всех скрытых элементов. Наблюдения, принадлежащие одному кластеру, дают сходные результаты. При подходе, основанном на оценке чувствительности, измеряется вклад переменных в величину остатка для каждого наблюдения. Вся процедура происходит так:

1Все значения одной входной переменной х заменяются на ее безусловное математическое ожидание (т.е. среднее значение).

2Выход сети перевычисляется для сокращенной матрицы входов и при той же матрице весов.

3Абсолютный остаток полученного вьгхода сравнивается с абсолютным остатком выхода, полученного на исходной входной матрице, а именно:

Вклад ,,= I (Цел.перем. - Прогноз )/(Цел.перем. - Прогноз „,,,„ ) .

Если величина этого отношения меньше единицы, то это значит, что исходный остаток больше, чем повторно вычисленный, и переменная влияет на результат с отрицательным знаком. Наоборот, если дробь больше единицы, то эта переменная способствует уменьшению остатка, и ее вклад в искомое решение положителен. Значение дроби около 1 (например, в интервале [0.75,1.25]) соответствует нейтральному вкладу.

4Проделать все перечисленные выше действия для всех других переменных.

В табл. 4.4 представлена статистика по видам влияния переменных на результат, полученная на материале обучающего множества. Из нее видно, что наибольшее влияние на прогноз оказывают годовой прогноз правительства, число рабочих дней и календарные эффекты.



CENTROID CAL ANNUAL SEA DAY CON AIBOR CYC ТЕМ RAIN ACTIVATION

C6(4)*

0.00

0.64

C5(9)

0.43

0.73

C8(l)

1.00

0.78

C3(6)

0.00

0.09

C7(7)

0.92

0.68

C4(l)

0.73

0.17

C2(10)

0.43

0.07

Cl(7)

1.00

0.10

0.41 0.56 0.00 0.37 0.52 0.13 0.53 0.68

055 0.67 0.80 0.47 0.57 0.00 0.66 0.80

0.72 0.74 1.00 0.36 0.55 0.04 0.35 0.26

0.40 0.37 0.42 0.42 0.37 0.85 0.24 0.25

0.61 0.61 0.68 0.42 0.68 0.84 0.37 0.50

0.60 0.49 0.39 0.58 0.68 0.49 0.58 0.62

0.48 0.33 0.49 0.40 0.28 0.31 0.39 0.23

0.01 0.04 0.07 0.10 0.18 0.22 0.35 0.77

*B скобках указано число наблюдений

Таблица 4.5. Значения центроидов (промасштабированные) и соответствующие значения активации (упорядочен)

По результатам кластерного анализа в обучающем множестве было выделено 8 кластеров. Были вычислены центроиды, затем они были упорядочены по возрастанию величины активации. Две пары кластеров (6&5 и 2&1), составляющих вместе 30 наблюдений, относятся, соответственно, к очень низким и очень высоким выходным значениям первого скрытого элемента. Далее, наблюдения вьывили для кластеров групп 5 и 6 высокие, а для кластеров 1 и 2 - низкие реальные значения целевой переменной.

Нетрудно определить причинные факторы, вызывающие такие значения активации. Для каждой пары кластеров мы нарисовали (в промасщтабированном виде) значения девяти входных переменных. В обеих парах значения переменных для обоих центроидов давали примерно одну и ту же картину.

Рис. 4.3. Значения центроидов для кластеров 1 и 2, дающих большие значения активации скрытого элемента РЕ 1

Рис. 4.4. Значения центроидов для кластеров 5 и 6, дающих низкие значения активации скрытого элементаPEI

Низкие значения годового прогноза и потребления подавляют выходной сигнал скрытого элемента. В то же время, большие значения календарного эффекта, числа рабочих дней и температуры стимулируют выходной сигнал элемента РЕ1, идущий к элементу РЕОиТ. Заметьте, что группы наблюдений, образующие кластеры 5 и 6, соответствуют низкому целевому показателю.

Помимо сигналов, приходящих от элементов РЕ1 и РЕ2, выходной элемент принимает также 9 сигналов, идущих непосредственно от входных элементов. Как неявно заметили Горман и Сейновски, эти сигналы тоже могут быть разбиты на кластеры и упорядочены по уровню активации выходного элемента. В результате такого анализа количество кластеров может оказаться другим, причем в один кластер, вообще говоря, будут входить элементы разных групп. Поэтому определить суммарный эффект, который оказывают выходные сигналы скрытых и входных элементов, будет довольно трудно.

Чтобы упростить задачу, мы для каждого из восьми кластеров вычислили усредненный входной вектор, и вместо исходной базы данных взяли эти усредненные векторы. Затем были получены и рассортированы соответствующие уровни активации вьгходного элемента. Теперь усредненные входные векторы кластеров 5 и 6 порождают очень высокие значения активации элемента PEOUT (0.993 и 0.996), а усредненные векторы кластеров 1 и 2 дают наименьшие значения активации (0.48 и 0.77), По-видимому, такое изменение порядка говорит о том, что прямые связи (квазилинейные функции) систематически порождают завышенную оценку целевой переменной



(RECEIPTS), а соединения, идущие через узел РЕ1, уменьшают этот порог.

Теперь, соединяя вместе анализ матрицы весов, учет положительных и отрицательных влияний и выходных значений кластеров, мы в состоянии оценить значимость вклада каждой из переменных. В случае, если разные подходы приведут к разным выводам, следует, скорее, доверять результатам кластерного анализа в силу его многомерной природы.

Календарные эффекты (VI) и число рабочих дней (V4) сильно влияют на вьгход сети, что подтверждается большими значениями весов их прямых соединений с выходом (0.85 и 0.73), а также кластерным анализом их соединений, проходящих через РЕ1 (центроиды 1 и 2). Поскольку эти кластеры объединяют наблюдения с низким действительным поступлением налогов, можно считать, что эти две переменные вызывают уменьшение выхода. На интуитивном уровне это понятно: возможности отсрочки платежей отрицательно сказываются на поступлении налогов. Аналогично, опосредованное влияние температуры (V12) на целевую переменную отрицательно, хотя ее суммарный вклад в выходной сигнал остается неясным. Годовой прогноз правительства (V2) влияет на выход резко положительно - все варианты анализа показывают, что высокие значения целевой переменной приходятся на высокие значения переменной V2. Но, поскольку точного совпадения в значениях этих двух переменньгх нет, MoF не может с абсолютной уверенностью положиться на правительственный прогноз при управлении своими активами. Здесь также играет роль то, каким образом MoF раскладывает годовой прогноз по месяцам. Далее, кластерный анализ вьывляет положительную связь между потреблением (V5) и выходным значением. Большой отрицательный (-0.76) вес прямой связи невозможно объяснить экономическими соображениями, а общий результат двух влияний может указывать на нейтральность действия этой переменной. Сезонность, по-видимому, влияет на выход линейно (вес = 0.42) с небольшими побочными эффектами. Ее общий вклад примерно в 50% случаев положителен. Но эта переменная не может быть однозначно связана только с большими либо только с малыми вьгходными значениями. Цикличность (VII) имеет слабое прямое влияние (вес 0.08) и слабое побочное действие. Роль остальных переменных - AIBOR (V6) и дождя (V13) - с трудом поддается интерпретации. Их окончательное влияние нейтрально, и остается неясным, каким образом опосредованные связи компенсируют довольно большие отрицательные веса прямых связей (-0.29 и -0.3).

ti .

• ;->г W5

ВЫВОДЫ

Нейронная модель показывает лучшие результаты, чем ARIMA и OLS-регрессия как на обучающих, так и на новых данных. При этом, однако, из-за небольшого объема базы данных не удается применить полноценное подтверждающее множество, и поэтому обучающее множество было оптимизировано по отношению к тестовому множеству.

Была сделана попытка вьшснить структуру реализуемого отображения. Исследование вклада каждой Переменной через веса непосредственных связей и через значения векторов весов-состояния позволило получить представление как о линейных, так и о нелинейных компонентах модели. По-видимому, календарные эффекты, число рабочих дней и температура влияют на значения целевой переменной отрицательно, тогда как увеличение годового правительственного прогноза и потребления приводит к росту целевого значения. Остальные переменные активны при-любьгх значениях целевой переменной. Такое сложное влияние переменных едва ли уловимо средствами регрессионного анализа. Различие между линейными и нелинейными компонентами, возможно, несколько преувеличено, так как значение отношения больше 0.7.

В настоящее время Министерство финансов пробует различные способы улучшения нейронно-сетевой модели. Показатели работы сети могут улучшиться после разбиения целевой переменной на составные части, потому что, например, на размер налога с продаж влияют одни факторы, а на размер налогов на наследство - совсем другие. Другой способ состоит в том, чтобы свести целевую переменную к совокупности банковских счетов. Так как разные группы налогоплательщиков перечисляют налоги на разные счета, каждый из этих счетов имеет свои особенности, которые можно учесть. Далее, можно включить сюда сдвинутые назад значения целевой переменной или разности. Еще одна возможность состоит в том, чтобы включить в число входов оценку, полученную с помощью модели ARIMA. Наконец, следуя идее Фуллертона, из прогнозов, полученных разными методами, можно тем или иным способом составить один более надежный.

ПРИМЕЧАНИЯ , . Ji-." . «Г гГ [

in = дисперсия остатков нелин«1кр1МОЯеш/дис11ер91Я остатков линейной модсг

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [ 18 ] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42]