Аналитические методы выделения (оценки) неслучайной состав-
ляющей временного ряда. Эти методы реализуются в рамках моделей
регрессии, в которых в роли зависимой переменной выступает переменная
x
t
, а в роли единственной объясняющей переменной
время t. Таким обра-
зом, рассматривается модель регрессии вида
x
t
= f(t,
) +
t
, t = 1,…, T,
в которой общий вид функции f(t,
) известен, но неизвестны значения па-
раметров
= (
0
,
1
,…,
m
). Оценки параметров
~
строятся по наблюде-
ниям
T
t
t
x
t
1
,
. Выбор метода оценивания зависит от гипотетического вида
184
функции f(t,
) и стохастической природы случайных регрессионных остат-
ков
t
.
Алгоритмические методы выделения неслучайной составляющей
временного ряда (методы скользящего среднего). В основе этих методов
элиминирования случайных флуктуаций в поведении анализируемого вре-
менного ряда лежит простая идея: если «индивидуальный» разброс значе-
ний члена временного ряда x
t
около своего среднего (сглаженного) значе-
ния a характеризуется дисперсией
2
, то разброс среднего из N членов
временного ряда (x
1
+ x
2
+…+ x
T
) / N около того же значения a будет харак-
теризоваться гораздо меньшей величиной дисперсии, а именно дисперсией,
равной
2
/ N. А уменьшение меры случайного разброса (дисперсии) и
означает как раз сглаживание соответствующей траектории. Поэтому вы-
бирают некоторую нечетную «длину усреднения» N = 2m + 1, измеренную
в числе подряд идущих членов анализируемого временного ряда. А затем
сглаженное значение
t
fˆ
временного ряда x
t
вычисляют по значениям
x
t
m
, x
t
m+1
,…, x
t
, x
t+1
,…, x
t+m
по формуле
,
,...,
2
,
1
,
ˆ
m
T
m
m
t
x
w
t
f
m
m
k
k
t
k
(П2.9)
где w
k
(k =
m,
m + 1,…, m)
некоторые положительные «весовые» коэф-
фициенты, в сумме равные единице, т.е. w
k
> 0 и
1
m
m
k
k
w
. Поскольку,
изменяя t от m + 1 до T
m, мы как бы «скользим» по оси времени, то и
методы, основанные на формуле (П2.9), принято называть методами сколь-
зящей средней (МСС).
Очевидно, один МСС отличается от другого выбором параметров m и
w
k
.
Определение параметров w
k
основано на следующей процедуре. В со-
ответствии с теоремой Вейерштрасса любая гладкая функция f(x) при са-
мых общих допущениях может быть локально представлена алгебраиче-
ским полиномом подходящей степени p. Поэтому берем первые 2m + 1
членов временного ряда x
1
,…, x
2m+1
, строим с помощью МНК полином
t
x
1
ˆ
степени p, аппроксимирующий поведение этой начальной части тра-
ектории временного ряда, и используем этот полином для определения
оценки
t
fˆ
сглаженного значения f(t) временного ряда в средней (т.е. (m +
1)-й) точке этого отрезка ряда, т.е. полагаем
1
ˆ m
f
1
ˆ
1
m
x
. Затем
185
«скользим» по оси времени на один такт и таким же способом подбираем
полином
t
x
2
ˆ
той же степени p к отрезку временного ряда x
2
,…, x
m+2
и
определяем оценку сглаженного значения временного ряда в средней точке
сдвинутого на единицу отрезка временного ряда, т.е.
2
ˆ
2
ˆ
2
m
x
m
f
, и
т.д.
В результате мы найдем оценки для сглаженных значений
t
fˆ
анали-
зируемого временного ряда при всех t, кроме t = 1,…, m и t = T,… T
m + 1.
Подбор наилучшего (в смысле критерия МНК) аппроксимирующего
полинома к траектории анализируемого временного ряда приводит к фор-
муле вида (П2.9), причем результат не зависит от того, для какого именно
из «скользящих» временных интервалов был осуществлен этот подбор.
Метод экспоненциально взвешенного скользящего среднего (ме-
тод Брауна [Brown (1963)]). В соответствии с этим методом оценка сгла-
женного значения
t
fˆ
в точке t определяется как решение оптимизацион-
ной задачи вида
,
min
1
0
2
f
t
k
k
t
k
f
x
f
Q
(П2.10)
где 0 <
< 1. Следовательно, веса
k
в критерии Q( f) обобщенного («взве-
шенного») МНК уменьшаются экспоненциально по мере удаления наблю-
дений x
t
k
в прошлое.
Решение оптимизационной задачи (П2.10) дает:
.
1
1
ˆ
1
0
t
k
k
t
k
t
x
t
f
(П2.11)
В отличие от обычного МСС здесь скользит только правый конец ин-
тервала усреднения и, кроме того, веса экспоненциально уменьшаются по
мере удаления в прошлое. Формула (П2.11) дает оценку сглаженного зна-
чения временного ряда не в средней, а в правой конечной точке интервала
усреднения.
П 2 . 2 . 3 . П о д б о р п о р я д к а а п п р о к с и м и р у ю щ е г о п о л и н о м а
с п о м о щ ь ю м е т о д а п о с л е д о в а т е л ь н ы х р а з н о с т е й
Реализация алгоритмических методов выделения неслучайной состав-
ляющей временного ряда связана с необходимостью подбора порядка p
локально-аппроксимирующего полинома. Эта же задача возникает и при
186
реализации аналитических методов выделения неслучайной составляющей.
При решении этой задачи широко используется так называемый метод по-
следовательных разностей членов анализируемого временного ряда, кото-
рый основан на следующем математическом факте: если анализируемый
временной ряд x
t
содержит в качестве своей неслучайной составляющей
алгебраический полином f( t) =
0
+
1
t +
p
t
p
порядка p, то переход к после-
довательным разностям порядка p + 1, исключает неслучайную составля-
ющую, оставляя элементы, выражающиеся только через остаточную слу-
чайную компоненту
t
.
Обсудим способ подбора порядка p полинома, представляющего собой
неслучайную составляющую f( t) в разложении анализируемого временного
ряда x
t
. Заметим, прежде всего, что если мы знаем, что среднее значение
наблюдаемой случайной величины
равно нулю ( E
= 0), то выборочным
аналогом ее дисперсии является величина
T
i
i
T
T
1
2
ˆ
, где
I
, i = 1, 2,…,
T
наблюденные значения этой случайной величины. Если же E
0, то
выборочным аналогом дисперсии будет статистика
2
1
1
2
T
i
i
T
i
i
T
T
, так
что величина
T
ˆ
будет давать в этом случае существенно завышенные
оценки для D
. Возвращаясь к последовательному переходу к разностям
k
x
t
, k = 1, 2,…, p + 1, отметим, что при всех k < p + 1 средние значения
этих разностей будут отличны от нуля, так как будут выражаться не только
через остатки
t
, но и через коэффициенты
0
,
1
,…,
p
и степени t. И только
для k
p + 1 можно утверждать, что:
E(
k
x
t
) = 0 и
1
1
2
2
p
p
t
k
C
x
D
.
С учетом этих замечаний можно сформулировать следующее правило
подбора порядка сглаживающего полинома p, называемое методом после-
довательных разностей.
Последовательно для k = 1, 2,… вычисляем разности
k
x
t
( t = 1,…, T
k), а также величины
.
ˆ
2
`
2
1
2
k
k
k
T
t
t
k
k
T
C
x
k
(П2.12)
187
Анализируем поведение величины
k
2
ˆ
в зависимости от k. Величина
k
2
ˆ
как функция k будет демонстрировать явную тенденцию к убыва-
нию до тех пор, пока k не достигнет величины p + 1. Начиная с этого мо-
мента величина (П2.12) стабилизируется, оставаясь (при дальнейшем уве-
личении p) приблизительно на одном уровне. Поэтому значение k = k
0
,
начиная с которого величина
k
2
ˆ
стабилизируется, и будет давать завы-
шенный на единицу искомый порядок сглаживающего полинома, т.е. p = k
0
1.
Этот метод привлекателен своей простотой, но его практическое при-
менение требует определенной осторожности. Последовательные значения
k
2
ˆ
не являются независимыми, и часто обнаруживается тенденция их
медленного убывания (а иногда возрастания) без видимой сходимости к
постоянному значению. Кроме того, процесс перехода к разностям имеет
тенденцию уменьшать относительное значение любого систематического
движения, кроме сезонных эффектов с периодом, близким к временному
интервалу, так что сходимость отношения
k
2
ˆ
не доказывает, что ряд
первоначально состоял из полинома плюс случайный остаток, а только то,
что он может быть приближенно представлен таким образом. Однако для
нас этот метод ценен лишь тем, что он дает верхний предел порядка поли-
нома p, который целесообразно использовать для элиминирования неслу-
чайной составляющей.
П2.3. Модели стационарных временных рядов и их идентификация
В П2.2 рассматривался класс стационарных временных рядов, в рам-
ках которого подбирается модель, пригодная для описания поведения слу-
чайных остатков исследуемого временного ряда (1.1.1). Здесь рассматрива-
ется набор линейных параметрических моделей из этого класса и методы
их идентификации. Таким образом, речь здесь идет не о моделировании
временных рядов, а о моделировании их случайных остатков
t
, получаю-
щихся после элиминирования из исходного временного ряда x
t
его неслу-
чайной составляющей (П2.8). Следовательно, в отличие от прогноза, осно-
ванного на регрессионной модели, игнорирующего значения случайных
остатков, в прогнозе временных рядов существенно используется взаимо-
зависимость и прогноз самих случайных остатков.
Введем обозначения. Так как здесь описывается поведение случайных
остатков, то моделируемый временной ряд обозначим
t
, и будем полагать,
188
что при всех t его математическое ожидание равно нулю, т.е. E
t
,
0. Вре-
менные последовательности, образующие «белый шум», обозначим
t
.
Описание и анализ, рассматриваемых ниже моделей, формулируется в
терминах общего линейного процесса, представимого в виде взвешенной
суммы настоящего и прошлых значений белого шума, а именно:
,
0
k
k
t
k
t
(П2.13)
где
0
= 1 и
0
2
k
k
.
Таким образом, белый шум представляет собой серию импульсов, в
широком классе реальных ситуаций генерирующих случайные остатки ис-
следуемого временного ряда.
Временной ряд
t
можно представить в эквивалентном (П2.13) виде,
при котором он получается в виде классической линейной модели множе-
ственной регрессии, в которой в качестве объясняющих переменных вы-
ступают его собственные значения во все прошлые моменты времени:
.
1
t
k
k
t
k
t
(П2.14)
При этом весовые коэффициенты
1
,
2
,… связаны определенными
условиями, обеспечивающими стационарность ряда
t
. Переход от (П2.14)
к (П2.13) осуществляется с помощью последовательной подстановки в
правую часть (П2.14) вместо
t
1
,
t
2
,… их выражений, вычисленных в со-
ответствии с (П2.14) для моментов времени t
1, t
2 и т.д.
Рассмотрим также процесс смешанного типа, в котором присутствуют
как авторегрессионные члены самого процесса, так и скользящее суммиро-
вание элементов белого шума:
.
1
1
q
j
j
t
j
t
p
k
k
t
k
t
Будем подразумевать, что p и q могут принимать и бесконечные значения,
а также то, что в частных случаях некоторые (или даже все) коэффициенты
или
равны нулю.
П 2 . 3 . 1 . М о д е л и а в т о р е г р е с с и и п о р я д к а p
( A R ( p ) - м о д е л и )
Рассмотрим сначала простейшие частные случаи.
189
Модель авторегрессии 1-го порядка
AR(1) (марковский процесс).
Эта модель представляет собой простейший вариант авторегрессионного
процесса типа (П2.14), когда все коэффициенты кроме первого равны ну-
лю. Соответственно, она может быть определена выражением
t
=
t
1
+
t
,
(П2.15)
где
некоторый числовой коэффициент, не превосходящий по абсолют-
ной величине единицу (|
| < 1), а
t
последовательность случайных вели-
чин, образующая белый шум. При этом
t
зависит от
t
и всех предшеству-
ющих
, но не зависит от будущих значений
. Соответственно, в
уравнении (П2.15)
t
не зависит от
t
1
и более ранних значений
. В связи с
этим,
t
называют инновацией (обновлением).
Последовательности
, удовлетворяющие соотношению (П2.15), часто
называют также марковскими процессами. Это означает, что
E
t
0,
(П2.16)
r(
t
,
t
k
) =
k
,
(П2.17)
D
t
=
2
2
0
1
,
(П2.18)
cov(
t
,
t
k
) =
k
D
t
.
(П2.19)
Одно важное следствие (П2.19) состоит в том, что если величина |
|
близка к единице, то дисперсия
t
будет намного больше дисперсии
. А
это значит, что если соседние значения ряда
t
сильно коррелированы, то
ряд довольно слабых возмущений
t
будет порождать размашистые коле-
бания остатков
t
.
Основные характеристики процесса авторегрессии 1-го порядка сле-
дующие.
Условие стационарности ряда (П2.15) определяется требованием к
коэффициенту
:
|
| < 1,
или, что то же, корень z
0
уравнения 1
z = 0 должен быть по абсолютной
величине больше единицы.
Автокорреляционная функция марковского процесса определяется со-
отношением (П2.17):
r(
) = r(
t
,
t
) =
.
(П2.20)
Отсюда же, в частности, следует простая вероятностная интерпретация
параметра
:
= r(
t
,
t
1
),
190
т.е. значение
определяет величину корреляции между двумя соседними
членами ряда
t
.
Из (П2.20) видно, что степень тесноты корреляционной связи между
членами последовательности (П2.15) экспоненциально убывает по мере их
взаимного удаления друг от друга во времени.
Частная автокорреляционная функция r
част
(
) = r(
t
,
t+
|
t+1
=
t+2
=…=
t+
1
= 0) может быть подсчитана с помощью формул (П2.4)–(П2.5).
Непосредственное вычисление по этим формулам дает следующий простой
результат: значения частной корреляционной функции r
част
(
) равны нулю
для всех
= 2, 3,…. Это свойство может быть использовано при подборе
модели: если вычисленные выборочные частные корреляции
част
rˆ
стати-
стически незначимо отличаются от нуля при
= 2, 3,…, то использование
модели авторегрессии 1-го порядка для описания поведения случайных
остатков временного ряда не противоречит исходным статистическим дан-
ным.
Спектральная плотность
~
p
марковского процесса (П2.15) может
быть подсчитана с учетом известного вида автокорреляционной функции
(П2.20):
,
~
2
cos
2
2
2
~
2
2
0
p
2
1
~
0
2
~
.
В случае значения параметра
близкого к 1, соседние значения ряда
t
близки друг к другу по величине, автокорреляционная функция экспонен-
циально убывает оставаясь положительной, а в спектре преобладают низ-
кие частоты, что означает достаточно большое среднее расстояние между
пиками ряда
t
. При значении параметра
близком к –1, ряд быстро осцил-
лирует (в спектре преобладают высокие частоты), а график автокорреляци-
онной функции экспоненциально спадает до нуля с попеременным измене-
нием знака.
Идентификация модели, т.е. статистическое оценивание ее параметров
и
2
0
по имеющейся реализации временного ряда x
t
(а не его остатков,
которые являются ненаблюдаемыми), основана на соотношениях
(П2.16)
(П2.19) и может быть осуществлена с помощью метода моментов.
191
Для этого следует предварительно решить задачу выделения неслучайной
составляющей
t
fˆ
, что позволит оперировать в дальнейшем остатками
.
ˆ
ˆ
t
f
x
t
t
(П2.21)
Затем подсчитывается выборочная дисперсия
0
ˆ
остатков по формуле
,
ˆ
1
0
ˆ
1
2
N
t
t
N
где
N
Т
е
t
1
ˆ
, а «невязки» (остатки) вычислены по формуле (П2.21).
Оценку
ˆ
параметра
получаем с помощью формулы (П2.18), под-
ставляя в нее вместо коэффициента корреляции его выборочное значение,
т.е.
0
ˆ
ˆ
ˆ
ˆ
1
1
1
1
1
N
t
t
t
N
.
Наконец, оценка
2
0
ˆ
параметра
2
0
основана на соотношении (П2.19), в
котором величины D
t
и
заменяются оценками, соответственно,
0
ˆ
и
ˆ :
.
0
ˆ
ˆ
1
ˆ
2
2
0
Dostları ilə paylaş: |