назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [ 17 ] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]


17

1 Tyxi уХ2

УЧ Х\Х2 - х\Хр

уХ2 Х2Х\ 1•• Х2Хр

ухр хрхх ХрХ2 - 1

парных коэффициентов корреляции;

- определитель матрицы

•Х2Х1

XIХ2 1

ХрХх ХрХ2

XlXp

..... ......

- определитель матрицы

межфакторной корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на у фактора х, при неизменном уровне других факторов, можно определить по формуле

ух, xix2..xi ixj + i.. хр или по рекуррентной формуле:

1 - R

\ - R

ухХр

УХ\Х2

ух, хХ2 Хр уХр хХ2 Хр хХр ХХ2 хр -

ух, XiX2 Хр

~ ух р XiX2 Хр ~ хХр хХ2 Хр >

Частные коэффициенты корреляции изменяются в пределах от -1 До1.

Качество построенной модели в целом оценивает коэффициент (индекс) детерминации Кпэффтшент множественной детерминации рассчитывается как квадрат индекса множественной корреляции:

ух\хг. лр



Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле

(п-т-\)

где п - число наблюдений, т- чисто факторов

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

i?2 n-m-l

Частный Г-критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении. В общем виде для фактора X, частный F-критерий определится как

yxi JC, JCp

Оценка значимости коэффициентов чистой рефессии с помощью f-критерия Стьюдента сводится к вычислению значения

где mjy -средняя квадратическая ошибка коэффициента регрессии Ь„ она может быть определена по следующей формуле

mij--,• .=.

а, Jl-R-Jn-m-l

При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности.

Считается, что две переменные явно коллинеарны, т.е. находятся

между собой в линейной зависимости, если rj - 0.7 .



По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мулътиколлинеарности факторов. Чем сильнее мультикол-линеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.

Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэффициентов корреляции между факторами была бы единичной матрицей, поскольку все недиагональные элементы г

XiXj

{х, Ф Xj) были бы равны нулю. Так, для включающего три объясняющих переменных уравнения

y = a + biXi + 22 + 33 + е

матрица коэффициентов корреляции между факторами имела бы определитель, равный 1:

Det R

xjxj x2Xi xxi Гх,.Х2 !x2.X2 .X3X2

XlXj

= 1,

так как г, = л = г = 1 и Л;, - хх,

Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0:

Det R

1 1 1 1 1 1 1 1 1

= 0.

Чем ближе к О определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [ 17 ] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]