Направление причинной связи между переменными определяется через предварительное обоснование и включается в модель как гипотеза. Регрессионный анализ проверяет статистическую состоятельность модели при данной гипотезе.
Например, предположим, выдвинута гипотеза о том, что уровень фондового индекса FTSE (FTSE 100) линейно зависим от уровня фондового индекса S&P 500, т.е., когда растет S&P 500, растет и FTSE 100, а когда S&P 500 падает, падает и FTSE 100. Можно проверить эту гипотезу, используя простую линейную регрессию с включением только двух переменных.
Альтернативной гипотезой может быть то, что индекс FTSE 100 находится под влиянием не одного фактора, а нескольких. Например, на текущий уровень FTSE 100 могут влиять индекс S&P 500, уровень рынка облигаций Великобритании и обменный курс $/£. Эта гипотеза может быть проверена с помощью множественной регрессии.
Необходимо различать кросс-секционную регрессию и регрессию временных рядов. Кросс-секционная регрессия проверяет связь между переменными в определенный момент времени. В качестве примера кросс-секционной регрессии можно привести задачу измерения связи между размером компании и доходами по инвестициям в акции. Чтобы измерить эту связь, мы могли бы собрать данные по доходам на акции за один период, скажем за один год, и данные о размерах достаточно большого числа компаний на начало того же периода. Данные о доходах компаний соответствовали бы зависимой переменной, в то время как данные о размерах компаний были бы независимой переменной. Таким образом, регрессионный анализ показывает, как в среднем проявляется связь между переменными в определенный момент времени.
При анализе регрессии во временных рядах данные по каждой из переменных собираются в течение следующих друг за другом периодов времени. Приведенный выше пример фондовых индексов является регрессией временных рядов, потому что данные по FTSE 100 и S&P 500 должны были собираться на протяжении определенного периода времени. Регрессионный анализ позволил бы установить взаимосвязь в среднем в течение того периода времени, по которому имеются данные.
Независимо от того, проводится ли кросс-секционный анализ или анализ временных рядов, основные принципы приложения регрессионного анализа остаются те же.
ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Применим регрессионный анализ для простой линейной зависимости между зависимой переменной (У) и одной независимой переменной (X).
Под линейностью мы имеем в. виду, что переменная Y предположительно находится под влиянием переменной X в следующей зависимости:
Y = a + $X + e, (6.1)
где a - постоянная, т.е. если бы даже X была равна нулю, Y имела бы какое-либо положительное или отрицательное значение. Можно ли дать разумное объяснение значению Y даже при X равном нулю, зависит от гипотезы, для которой применяется регрессионный анализ;
Р - коэффициент регрессии, отражает наклон линии, вдоль которой рассеяны данные наблюдений. Он может быть истолкован как показатель, характеризующий процентное изменение переменной Y, которое вызвано изменением значения X на единицу. Таким образом, если Y и X - это соответственно индексы FTSE 100 и S&P500, то Р будет указывать, на какое количество пунктов изменится FTSE 100 при изменении индекса S&P 500 на один пункт. Если знак р положителен, то переменные положительно коррелированы. При отрицательном знаке р переменные отрицательно коррелированны;
е - ошибка или значение помехи, также называемая остатком. Она отражает тот факт, что обычно движение Убудет по крайней мере неточно описываться лишь движением X. Присутствуют другие факторы, не включенные в данную модель. Однако если исследуемая гипотеза реалистична, то эти другие переменные должны быть относительно неважными.
Обращаясь снова к взаимосвязи между FTSE 100 и S&P 500, отметим, что индекс FTSE 100 - зависимая переменная Y, так как мы выдвинули гипотезу о том, что движение этого индекса находится под влиянием, т.е. зависит от изменения индекса S&P 500, который представлен переменной X. В данной гипотезе мы предполагаем, что множество других незначительных и несвязанных влияний представлены в модели величиной е.
Если экономические аргументы достаточно сильны, мы можем развить гипотезу о том, что уровень индекса S&P 500 находится под влиянием индекса FTSE 100. При таком допущении величина индекса S&P 500 стала бы переменной У, а индекса FTSE 100 - переменой X.
Расположив данные из табл. 6.1 на приведенной ниже точечной диаграмме рассеяния (рис. 6.1), мы действительно видим, что высокие (низкие) значения S&P 500 соответствуют высоким (низким) значениям FTSE 100. Таким образом создается впечатление, что данные по двум индексам растут и падают вместе.
Таблица 6.1
FTSE 100 (У) | | S&P 500 (X) | | (Х-Х)2 | (X-X)(Y-Y) |
2851,6 | 320,8596 | 442,52 | 51,10135 | 2611,348 | 16396,358 |
2882,6 | 351,8596 | 442,01 | 50,59135 | 2559,484 | 17801,052 |
2878,4 | 347,6596 | 450,3 | 58,88135 | 3467,013 | 20470,666 |
2813,4 | 282,3596 | 442,46 | 51,04135 | 2605,219 | 14412,015 |
2849,2 | 318,4596 | 453,83 | 62,41135 | 3895,176 | 19875,493 |
2888,8 | 358,0596 | 449,02 | 57,60135 | 3317,915 | 20624,716 |
2941,7 | 410,9596 | 450,15 | 58,73135 | 3449,371 | 24136,211 |
3085 | 554,2596 | 463,15 | 71,73135 | 5145,386 | 39757,788 |
3039,3 | 508,5596 | 461,28 | 69,86135 | 4880,608 | 35528,659 |
3164,4 | 633,6596 | 469,1 | 77,68135 | 6034,392 | 49223,532 |
3233,2 | 702,4596 | 461,89 | 70,47135 | 4966,211 | 49503,275 |
У =2530,740 | | * =391,419 | | | |
Z(X-X)2= Z(X-X)(Y-Y)= 108046,7 644387,4688
| 3400 |
| 3200 |
| 3000 |
| 2800 |
| 2600 |
| |
| 2400 |
| 2200 |
| 2000 |
| 1800 |
300 320 340 360 380 400 420 440 460 480
S 4 P 500
Рис. 6.1. Диаграмма рассеяния уровней FTSE 100 и S&P 500