назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [ 26 ] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]


26

Коэффициент (индекс) детерминации (т. е. квадрат коэффициента корреляции) определяется как доля общей дисперсии, объясняемой регрессией, т. е.

2 дисперсия, объясняемая регрессией общая дисперсия J

или более формально с помощью уравнения (7.8):

(7.12)

Коэффициент детерминации и коэффициент корреляции г - важнейшие показатели в среднесрочном прогнозировании. Коэффициент

• • •

• ч

Рис. 7.2. Временные ряды с различными коэффициентами корреляции

корреляции распространен более широко, однако нередко можно встретить и коэффициент детерминации. Сделаем следующие замечания,

1. Коэффициент детерминации г® всегда неотрицателен, тогда как коэффициент корреляции может иметь разные знаки. Его знак совпадает со знаком коэффициента регрессии Ь. Знак коэффициента корреляции указывает на направленность зависимости у от t (см. рис. 7.2); при г > О зависимость положительная, при г < О - отрицательная. Например, г = - 0,86 указывает на более сильную (отрицательную) корреляцию, чем, скажем, в случае г = 0,68.

2. Именно коэффициент детерминации г, а не коэффициент корреляции г определяет долю дисперсии, объясняемой регрессией (см. уравнение (7.11)). Поэтому если значение г = 0,7 кажется довольно высоким, то это на самом деле означает, что коэффициент детерминации равен лишь = 0,49, т. е. регрессией можно объяснить меньше половины разброса зависимой переменной.

Поскольку оба показателя меньше либо равны 1, то это означает, что коэффициент корреляции всегда больше (по абсолютной величине) коэффициента детерминации (г > г) при условии, конечно, что они отличны от 1. Другими словами, доля дисперсии, объясняемой регрессией, всегда меньше коэффициента корреляции.

3. Значимость г и зависит от п - числа наблюдений. Меньшим значешям п должна соответствовать и большая корреляция вре*



ценного ряда у п t. В табл. 7.3 представлены пороговые значения (нижние границы) гиг* (для соответствующих значений п) при использовании уравнения регрессии в прогнозировании.

Таблица 7.3. Пороговые значения г и при использовании регрессии в прогнозировании (90%-иый уровень доверия)

Число

Значение

Значение коэф-

Чвсао

Значение

Значение коэф-

наблюде-

коэффициента

фициента детер-

коэффициента

фициента детер-

ний п

корреляции г

минации

вей а

корреляции г

минации г>

0,58

0,34

0,29

0,08

0,55

0,27

0,07

0.52

0.27

0,25

0,06

0.50

0.25

0,23

0,05

0,48

0,22

0,05

0,46

0,39

0,21

0.20

0,04

0,15

0,19

0,04

0,34

0,12

0.18

0.03

0,31

0,10

0,17

0,03

0,15

0,03

Для данных о строительстве дорог анализ дисперсий (см. табл. 7.2) был прдаеден ранее; коэффициент детерминации для этого примера равен:

п дисперсия, объясненная регрессией 1333178.89 общая дяеперсия 1399205.64 *

1399205,64

и г = 0,98. Коэффнциедтк г в этом случае положителен,

поскЦ?ку коэф«цнент регрессии 6 также положителен {Ь = 110,09). К(<Ш«Дйент детерминации = 0,95 для одиннадцати наблюдений (г-11) намного превосходит нижнюю границу значимости (см, табл. 7.3), поэтому соответствующая регрессия может быть использована для прогнозирования.

Прогнозирование с помощью регрессии и домрительные интервалы

Прогнозирование с помощью регрессии осуществляется вес1л«а просто: необходимо вместо t в уравнение подставить нужное значение и найти прогноз

Ti-a + bt (7.13)

В примере со строительством дорог (см. предыдущие разделы) для прогнозирования затрат в 1978 г, заметим, что этому году соответствует

f == 12, вследствие чего 7ia =-Й6,27-- 110,09.12 === 1687,35.



Нетрудно догадаться, что если прогноз необходимо сделать в году а период упреждения равен т, то в уравнение (7.13) подставляется значение t = п + i: (в нашем примере п = И соответствует 1977 г., а т - 1).

Доверительный интервал

Напомним, что прогноз должен давать несмещенную оценку будущей ситуации. Вместе с тем прогноз должен сопровождаться двусторонними границами, в которых с достаточной степенью уверенности следует ожидать появления прогнозируемого показателя. Точечная оценка в этом смысле представляется малозначащей.

В регрессионном анализе эти границы задаются с помощью доверительного интервала. Доверительный интервал-это интервал (содержащий сам прогноз), в котором с определенной степенью уверенности можно ожидать появления фактического значения прогнозируемой переменной. Например, значение прогноза, равное 1000, с доверительным интервалом ±100 и степенью уверенности 95 % означает, что приблизительно с 95%-ной вероятностью следует ожидать, что будущее значение показателя будет лежать в пределах от 900 до 1100. Тот же самый прогноз с 95%-ным доверительным интервалом ±1000 означал бы, что будущее значение показателя лежит в пределах от О до 2000.

В регрессии минимальная длина доверительного интервала соответствует точке [у, t) - «середине» наблюдений; по обе стороны от этой середины длина интервала увеличивается.

Для тогд чтобы определить доверительный интервал, необходимо прежде всего найти стандартную ошибку уравнения (иногда называемую среднеквадр этическим отклонением). Стандартная ошибка уравнения определяется как квадратный корень из суммы квадратов

отклонений выравненных значений yt и их фактических значений ytj деленной на степень свободы. Таким образом,

Степень свободы для регрессии (7.13) равна п - 2: потеря двух степеней свободы связана с числом оцениваемых параметров регрессии (7.13) а н Ь.

После того как найдена стандартная ошибка уравнения S,., нетрудно определить и стандартную ошибку прогноза S. Она вычисляется по формуле

5ггЛ/-1 + - + -. " (7.15)

причем стандартная ошибка прогноза зависит от: 1) 1/п, т. е. от числа наблюдений; при больших п величина 1/п стремится к нулю;

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [ 26 ] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]