назад Оглавление вперед


[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [ 24 ] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]


24

Значения коэффициентов парной корреляции указывают на весьма тесную связь выработки у как с коэффициентом обновления основных фондов -хь так и с долей рабочих высокой квалификации -Хг (j.j, = 0,9699 и г, = 0,9408). Но в то же время межфакторная связь rjjj = 0>9428 весьма тесная и превышает тесноту связи хгсу.В связи с этим для улучшения данной модели можно исключить из нее фактор Хг как малоинформативный, недостаточно статистически надежный.

Коэффициенты частной корреляции дают более точную характеристику тесноты связи двух признаков, чем коэффициенты парной корреляции, так как очищают парную зависимость от взаимодействия данной пары признаков с другими признаками, представленными в модели. Наиболее тесно связаны и х\. Гу 2 = 0,7335, связь и Х2 гораздо слабее: Гу = 0,3247, а межфакторная зависимость xi и Х2 выше, чем парная у и хг: Гу = 0,3247 < г у = 0,3679. Все это приводит к выводу о необходимости исключить фактор хг - доля высококвалифицированных рабочих - из правой части уравнения множественной регрессии.

Если сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-зя высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные оценки тесноты связи:

Гух, = 0,9699; Гух, 2 = 0-7335; Гу = 0,9408; Гухг X, =0,3247.

Именно по этой причине рекомендуется при наличии сильной коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у которого теснота парной зависимости меньше, чем теснота межфакторной связи.

3. Вычисление параметров линейного уравнения множественной регрессии.

Решение с помощью ППП Excel

Эта операция проводится с помощью инструмента анализа данных Регрессия. Она аналогична расчету параметров парной линейной регрессии, описанной в 1-м разделе практикума, только в отличие от парной регрессии в диалоговом окне при заполнении параметра входной интервал X следует указать не один столбец, а все столбцы, содержащие значения факторных признаков. Результаты анализа представлены на рис. 2.9.



ЛФЯтis*------- -. --------.......

J » El Е )С l-Tjr ;5

----1-"I-**" п~?кDс"- Л - "•

iэссионная статистика

4 411, <« TKimuiiR0,973101182

.i, ..0>4ЙI2»1

0.9406819 0,398670364 20

ЩДиспврскоаный аншпо

Значимо

сть F

ЩРегрессм

108,7070943

3433354736

131,6333

I.4SE-1I

Остаток

6,092903478

0Д384О62О5

КоаЛЛииианты •"-••Р Нижние Верхние Нижние

похрфициенты „„д, статистика Знамние 95« 96% 95.0%

Верхние 95,0%

ШЗЗОШ 0.471064997 ЗШ34 0Д)62 0,841443 2,829169 0,841443 2,829169 J 0,943947723 0Л2ЭТ6487 4,449917001 0.000331 0,49745 U94446 0,49745 1.394446 \ 0183617787 0,060483309 1.4135603Т7 0,174964 .0,04199 0.313227 А04199 0.213327 4

Рис. 2.9. Результат применения инструмента Рефессия

Решение с помощью ППП Statgraphics

Для вычисления параметров множественной регрессии можно использовать процедуру Multiple Regression. Для этого:

1)введите исходные данные или откройте существующий файл;

2)в главном меню последовательно выберите Relate / Multiple Regression;

3)заполните диалоговое окно ввода данных. В поле Depended Variable введите название столбца, содержащего значения зависимой переменной, в поле Independed Variable - названия столбцов, содержащих значения факторов. Щелкните по кнопке ОК.

Результаты вычисления функции Multiple Regression появятся в отдельном окне (рис. 2.10).

По результатам вычислений составим уравнение множественной регрессии вида

y = bQ+bi-Xi +b2X2\

j) = 1,8353 + 0,9459 • + 0,0856 • .

Значения случайных ошибок параметров bo, bi и Ьгс учетом округления:

mt = 0,471 l;wi, = 0,2126; w =0,0605.



St-ndard T

rcor Sb»cl*Cic

P-V»lua

СОИЯТАЯТ

1,93531

o,oee£i?e

0,4710*5 3,89608 0.212576 4,44992 0,0604833 1,4155в

0,0012 0,0004 0,1750

Analysl*

of V*rlaiu:a

Boucc.

3uk of 8c[u*raa

DC Иавп 3qu*ra Г-Яясю

P-Valu«

[odai Bw*ldu>l

10B.707 e,09291

2 54,3535 151.65 17 0,350406

0.0000

rotJiJ, (Cort >

114,8

It-C<iu*rad - 94,6926 parcanc

R-cquuad tadjuatvd for d 1 ) - 94,0682 prnzcmtM BcandArd Irror o( «« - 0,59867 Uan kbsoluca areoc - 0,426528 >urbin-Hac*on »tfttMsclc » 2,39705

Рис. 2.10. Итоговое окно функции Multiple Regression

Они показывают, какое значение данной характеристики сформировалось под влиянием случайных факторов. Эти значения используются для расчета f-критерия Стьюдента:

= 3,90; tb, = 4,45; f = 1-42.

Если значения f-критерия больше 2-3, можно сделать вывод о существенности данного параметра, который формируется под воздействием неслучайных причин. Здесь статистически значимыми являются bo и Ь\, а величина Ьг сформировалась под воздействием случайных причин, поэтому фактор хг, силу влияния которого оценивает Ьг, можно исключить как несущественно влияющий, неинформативный.

На это же указывает показатель вероятности случайных значений параметров регрессии: если а меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01; это соответствует 10%; 5% или 1% вероятности), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уравнения. Здесь а. = 17,5% > 5%, что

позволяет рассматривать хг как неинформативный фактор и удалить его для улучшения данного уравнения.

Величина оценивает агрегированное влияние прочих (кроме учтенных в модели факторов х и хг) факторов на результат д.

[Старт] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [ 24 ] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63]