назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [ 25 ] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]


25

. ежегодным затратам на строительство автомобильных 1977 гг. (мли. ф. ст.) и вычисления, ЩМя построения линии регрессии

313 600

369 664

1216

469 225

2055

651 249

3228

703921

835 396

5484

1100

1 210 000

7700

1196

1 430 416

9568

1490

2 247 001

13 491

1574

2 477 476

15 740

1513

2 289 169

16 643

11295

12 997 117

79 880

Истчник. Transport Statistics Great Britain 1967 - 1977 (1979) Qovertiment Statistical Service.

Ha основании табл. 7.1 и формул (7.2), (7.3) находим:

, nZtyt-gt Ib79880-66*U295878680-745470 " nZt-iZif 11.506-(66)2 " 5566 -4356

bit n

133210 1210

11295 110.09.66

= 110,09,

- 1026,81 -660,54 - 366,27.

Таким образом, уравнение регрессии будет иметь вид:

366,27+ 110,09/.

, что любая линия регрессии, в том числе и эта, проходит 1юю точку (у, i), которая в нашем случае соответствует

проделанные вычисления могут показаться довольно [МИ, однако с помощью ЭВМ или программируемых каль-ши могут быть легко автоматизированы. [ный анализ изучает взаимосвязи между переменными, *и не только в виде временных рядов; eL частности, негенная необязательно должна принимать равноотстоя-[римененне регрессионного анализа к временным рдам анализом трендов.



Источники дисперсии в регрессионном анализе

Для определения значимости характеристик, вычисляемых в регрессионном анализе, необходимо определить, насколько хорошо уравнение регрессии объясняет дисперсию зависимой переменной в зависимости от / по сравнению с общей дисперсией у (независимо от /).

Общая дисперсия

Дисперсия ряда наблюдений измеряется суммой квадратов разностей (отклонений) между фактическими значениями наблюдений и их средним значением. Таким образом, общая дисперсия у может быть вычислена по формуле

общая дисперсия = 2 (/ - yf, (7.4)

-=~-St/,. (7.5)

С точки зрения вычислений удобнее пользоваться формулой, эквивалентной (7.4), а именно

общая дисперсия = 2yf , (7.6)

Для данных о затратах на строительство дорог (см. табл. 7.1): общая дисперсия - 12997117 11295V11 = 1399205,64. Дисперсия, объясняетя регрессией

Очевидно, что если между у t существует тесная зависимость, то большая доля общей дисперсии будет объяснена регрессией. При отсутствии подобной зависимости доля объясненной общей дисперсии у будет ничтожна.

Дисперсия у, объясняемая линией регрессии, измеряется суммой

квадратов отклонений между выравнеными значениями yi и их средним значением, которое обозначим у (оно находится по формуле (7.5)). Итак, эта дисперсия вычисляется по формуле

объясняемая дисперсия = S {yt - yf. (7.7)

Ее удобно переписать в виде

объясняемая дисперсия 2* , (7.8)

объясняемая дисперсия = a2yt + bty -i- (Щ). (7.9)

Для примера с затратами на строительство дорог по формуле (7.8): объясняемая дисперсия = 110.09- (506 - 66V11) = 1333178,89. Остаточная дисперсия

Дисперсию, которую .нельзя объяснить с помощью регрессии, называют остаточной. Ее вычисляют как сумму квадратов разностей



между фактическими значениями yt и значениями, выравненными по уравнению регрессии у. Таким образом,

остаточная дисперсия == 2 ijyt -tf. (7.10)

Ее находят как разность между общей и объясняемой дисперсией. Для нашего примера: остаточная дисперсия=общая дисперсия - - объясняемая дисперсия == 1399205,64 - 1333178,89 - 66026,75.

Остаточную дисперсию можно найти непосредственно, а именно

(7.11)

Проверяя, вычислим остаточную дисперсию для примера со строительством дорог по формуле (7.11):

2 (t/t -lif = 12997117 - 366,27.11295 - 110,9-79880 = 66006,

что на 20,75 (3 % ошибки) меньше прежнего значения; эта разность объясняется округлением значений а н Ь.

В табл. 7.2 сведены определения и формулы вычисления дисперсий в регрессионном анализе.

Таблица 7.2. Источники дисперсий в регрессионном анализе

Источник дисперсии

Описание

Формула

Объясняемая Остаточная

Общая

Разброс значений зависимой переменной, объясняемой регрессией

Разброс значений зависимой переменной, которые не смогли быть объяснены регрессией, т. е. разброс отклонений фактических значения от выравненных

Общий разброс зависимой переменней

-(20Vn) или aXyt+bZiyjt-lyf/n

Коэффициент корреляции г и детерминации

Коэффициент корреляции колеблется от -1 до +1 и служит мерой тесноты зависимости между двумя переменными, в частности для временных рядов между зависимой переменной (у) и независимой переменной «время» (i). На рис. 7.2 показаны случаи:

а) г = 0; между и f нет корреляции;

б) +1; между у и t существует сильная положительная корреляция; увеличение t в большинстве случаев приводит и к увеличению у\

в) г -1; между у н t существует сильная отрицательная корреляция; увеличение / приводит, как правило, к уменьшению у.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [ 25 ] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]