назад Оглавление вперед


[Старт] [ 1 ] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]


1

Во-вторых, положим «о равным среднему нескольких первых Hiliii дыдущих членов ряда. Наконец, если ряд dt стационарный, т. е. отсутствует, то в качестве «о можно взять среднее ряда. Заметим однако, что выбор начального уровня ряда имеет меньшее значение, чем выбор константы сглаживания: чем больше длина сглаживания ряда, тем меньший эффект на результат сглаживания, а значит, и ка прогноз оказывает выбор Uq.

3. Выбор начального момента сглаживания (длины базы сгложи-ваиия или прогноза), С какой точки ряда начать сглаживание для построения прогноза? Чем ближе начальная точка к текуш,ей. тем меньше информации потребуется при построении прогноза; чем дальше начальная точка от текущей, тем менее чувствительным будет прогноз к вновь поступившим данным. Проблема выбора начальной точки сглаживания тесно связана с проблемой выбора константы сглаживания.

Аналитического решения поставленных задач на сегодняшний день не существует, да и в принципе оно вряд ли возможно. Выбор характеристик сглаживания должен быть основан на экспериментальных рдс-четах и осуществляться в каждом конкретном случае по-разному. В настоящее время широко практикуется следующая процедура экспериментальной проверки качества прогнозируемых систем, известная под названием метода обучающей выборки. Разобьем имеющийся временной ряд d, d, dn на две части. Первую часть, di, dj, d, назовем обучающим рядом (выборкой), а вторую, й/+г» а. - экзаменующим. На обучающем ряде оцениваем все необходимые параметры, а на экзаменующем смотрим, насколько наша прогностическая модель хорошо предсказывает фактические етачения показателя.

Этот метод может быть легко адаптирован для модели экспоненциального сглаживания и ее обобщений (модели Холта, Брауна, Бокса- Дженкинса и др.). Начальный уровень «о найдем, например, по первым трем средним значениям фактического ряда df, длину базы сглаживания положим равной, например, k< п. Задача, таким образом, будет заключаться в выборе оптимального, в некотором смысле, коэффициента сглаживания а; уточним: оптимального в смысле качества прогноза на одну точку вперед. Зададим сетку значений для а, например а 0; 0,1; 0,2; 0,9; I. Для каждого из этих значений а сгладим ряд dj, d, тогда прогноз на момент времени k + 1 есть Ufi, а ошибкой прогноза будет d+i- м; ее обозначим е,. Далее сдвинем базу на единицу вправо, т. е. сгладим ряд d., d+i; ошибка прогноза в этом случае будет равна dz - k+i 2 и т. д. Всего таким способом будет построено п - k ошибок прогноза. Найдем «среднюю» ошибку. Можно взять среднюю абсолютную ошибку

/ п-к \1/2

n-fe



или среднюю относительную (%)

Проигрывая таким образом прогнозируемые ситуации, можно найти то значение коэффициента сглаживания а, которое обращает в минимум один из выписанных выше функционалов качества прогнозов. Аналогично можно оптимальным образом подбирать и длину базы Л, и начальный уровень сглаживания «о-

Несколько замечаний о методе идентификации линейного тренда с помощью автокоррелограммы, предлагаемой автором книги. Такой метод выявления тренда кажется нам необоснованным. Визуализация тренда в автокорреляциях ряда (см. рис. 6.6 (б)) не прозрачнее тренда в исходном ряду показателя. Проще воспользоваться методами регрессионного анализа из второй части книги, т. е..выделить линейный тренд в исходном ряду и проверить значимость коэффициента наклона. Эти процедуру нетрудно и автоматизировать.

Наконец, нельзя не отметить существование другого, конкурирующего семейства методов краткосрочного прогнозирования. Речь идет о методах авторегрессии и скользящего среднего или как Мх иногда называют, методах Бокса-Дженкинса [341. Последнее, конечно, мощнее и разнообразнее методов экспоненциального сглаживания, однако они уже не столь просты, как вторые; требуют не только повышенной эрудиции в области математической статистики, но и больших вычислительных затрат.

Методы среднесрочного прогнозирования, основанные на выде- лении тренда и экстраполяции. Во второй части книги излагается стандартная методика выделения линейного тренда, построения довери- тельных интервалов и стандартной ошибки прогноза. Далее показа-1 но, как с помощью линейного регрессионного аппарата оценивать не- линейные тренды, сводящиеся к линейным с помощью некоторого пре-( образования. Изложение материала довольно тенденциозно и содержите ряд методологических ошибок. Основная заключается в попытке статистической интерпретации коэффициента корреляции и детерминации вре менного ряда yt и показателя времени /, принимающего целочислен-; ные значения t = 1, 2, Напомним, что коэффициент корреляций вычисляется между двумя случайными величинами хну по случайно? выборке JCi, лгг, Хп\ Угу У2г 77. извлеченной из статистич0рой со вокупности хи у соответственно. Таким образом, все yt иледщедина): ковое математическое ожидание и одинаковую дисперсию, шш Кай и Xi. Можно ли говорить о последовательности 1, 2, гь, io слу чайной выборке из некоторой статистической совокупносда1з нет; значит, и коэффициент корреляции и детерминации, и всШ дисперн сионный анализ в рамках тренда применять и штерпретШЩЬ в Tpai диционном статистическом смысле нельзя. В этомсл)ш1еЙициен1 детерминации может быть интерпретирован лишь тщго, насколько модель линейного тренда лучше (в омттШШЩШ) модели среднего yt = const.Сделанное выше зттгтшШш мере

Более подробно эта точка зрения изложена в



не 03HatiaeT, что пользоваться другими стандартными trettntrmtcmm характеристиками регрессии при выделении трендов, например стандартными ошибками и доверительными интервалами для параметров и прогнозов, невозможно.

Перейдем к важному вопросу выбора «оптимальной» кривой. Выше нами было отмечено, что коэффициент детерминации при наличии тренда не может быть интерпретирован стандартным образом, как «мера объяснения дисперсии зависимой переменной». Поэтому выбирать оптимальную кривую на основе этого коэффициента, как предлагает автор книги, нельзя. К. Д. Льюис соглашается с тем, что истинное сравнение качества подгонки по разным кривым необходимо осуществлять по качеству подгонки к фактическому ряду, а не преобразованному, однако это условие следует усилить: выбирать оптимальную кривую надо только таким образом.

При выборе кривой весьма полезна процедура обучающей выборки, описанная выше (в эконометрии этот метод называют иногда «прогноз экс-пост»). Допустим, необходимо построить среднесрочный прогноз некоторого показателя на 7 точек вперед по ctaTHCTH4ecKou базе в 20 точек. Для сравнения нескольких кривых на прогностическую точность оценим их на базе в 13 точек и построим по каждой из этих кривых прогноз на 20-й момент времени. Поскольку фактическое значение имеется, нетрудно выявить, какая из кривых дает лучшие результаты.

Подобная проверка может осуществляться и аналитическими средствами. Для этого необходимо построение доверительных интервалов для прогноза. Заметим, что чем хуже и «неадекваткее» кривая описывает фактический ряд наблюдений, тем шире будет интервал прогноза. В случае криволинейного тренда, в котором преобразуется только переменная времени, а параметры входят в уравнение тренда линейно, доверительный интервал прогноза строится стандартным образом, как ±2 ошибки прогноза. В случае когда преобразуется и зависимая переменная, можно предложить следующую Простую и достаточно надежную процедуру построения интервала прогноза фактического значения показателя. Строим сначала интервал прогноза для преобразованного ряда, а затем нижние и верхние границы интервала так же, как и прогноз преобразованного ряда, приводим обратным преобразованием к исходному виду. В качестве оптимальной кривой можно взять, например, ту, которай имеет минимальную длину интервала прогноза фактического ряда.

Методы регрессионного анализа, в отличие, скажем, от методов экспоненциального сглаживания, дают, помимо самого прогноза, другую важнейшую характеристику качества прогноза, выражаемую в виде стандартной ошибки прогноза и его доверительного интервала. Не принимать во внимание эту характеристику значит не до конца воспользоваться всеми преимуществами, которые дает применение методов математической статистики.

Предложенный автором книги расчет параметров модифицированной экспоненты (гл. 9) является приближенным. Как всякий приближенный метод, он не всегда приводит к положительному результату. Более правильной была бы следующая постановка задачи оценива-

[Старт] [ 1 ] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43]