П2. Проблема анализа временных рядов
П2.1. Стационарные временные ряды и их основные
характеристики
Поиск модели, адекватно описывающей поведение случайных остат-
ков
t
анализируемого временного ряда x
t
, производят, как правило, в рам-
ках класса стационарных временных рядов.
Определение П2.1. Ряд x
t
называется строго стационарным (или стаци-
онарным в узком смысле), если совместное распределение вероятностей m
наблюдений
m
i
t
i
x
1
такое же, как и для m наблюдений
m
i
t
i
x
1
, при любых
, и t
1
,…, t
m
.
Другими словами, свойства строго стационарного временного ряда не
меняются при изменении начала отсчета времени. В частности, при m = 1
из предположения о строгой стационарности временного ряда x
t
следует,
что закон распределения вероятностей случайной величины x
t
не зависит от
t, а значит, не зависят от t и все его основные числовые характеристики, в
том числе: среднее значение Ex
t
=
и дисперсия Dx
t
=
2
.
177
Очевидно, значение
определяет постоянный уровень, относительно
которого колеблется анализируемый временной ряд x
t
, а постоянная вели-
чина
характеризует размах этих колебаний. Поскольку закон распреде-
ления вероятностей случайной величины x
t
одинаков при всех t, то он сам и
его основные числовые характеристики могут быть оценены по наблюде-
ниям x
1
,…, x
T
. В частности:
T
t
t
x
T
1
1
ˆ
оценка среднего значения,
T
t
t
x
T
1
2
2
~
1
ˆ
оценка дисперсии.
(П2.1)
Автоковариационная функция
(
). Значения автоковариационной
функции статистически оцениваются по имеющимся наблюдениям вре-
менного ряда по формуле
,
ˆ
ˆ
1
1
T
t
t
t
x
x
T
где
= 1,… T
1, а
ˆ вычислено по формуле (П2.1).
Очевидно, значение автоковариационной функции при
= 0 есть не
что иное, как дисперсия временного ряда, и, соответственно,
.
ˆ
1
ˆ
0
ˆ
1
2
2
T
t
t
x
T
(П2.2)
Автокорреляционная функция r(
). Одно из главных отличий по-
следовательности наблюдений, образующих временной ряд, от случайной
выборки заключается в том, что члены временного ряда являются, вообще
говоря, статистически взаимозависимыми. Степень тесноты статистиче-
ской связи между двумя случайными величинами может быть измерена
парным коэффициентом корреляции. Поскольку в нашем случае коэффи-
циент измеряет корреляцию, существующую между членами одного и того
же временного ряда, его принято называть коэффициентом автокорреля-
ции. При анализе изменения величины r(
) в зависимости от значения
принято говорить об автокорреляционной функции r(
). График автокорре-
ляционной функции иногда называют коррелограммой. Автокорреляцион-
ная функция (в отличие от автоковариационной) безразмерна, т.е. не зави-
сит от масштаба измерения анализируемого временного ряда. Ее значения,
по определению, могут колебаться от
1 до +1. Кроме того, из стационар-
ности следует, что r(
) = r(
), так что при анализе поведения автокорреля-
178
ционных функций ограничиваются рассмотрением только положительных
значений
.
Выборочный аналог автокорреляционной функции определяется фор-
мулой
.
1
,...,
1
,
0
ˆ
ˆ
ˆ
1
ˆ
ˆ
1
ˆ
1
2
1
T
x
T
x
x
T
r
T
t
t
T
t
t
t
(П2.3)
Существуют общие характерные особенности, отличающие поведение
автокорреляционной функции стационарного временного ряда. Другими
словами, можно описать в общих чертах схематичный вид коррелограммы
стационарного временного ряда. Это обусловлено следующим общим со-
ображением: очевидно, чем больше разнесены во времени члены времен-
ного ряда x
t
и x
t+
, тем слабее взаимосвязь этих членов и, соответственно,
тем меньше должно быть по абсолютной величине значение r(
). При этом
в ряде случаев существует такое пороговое значение r
0
, начиная с которого
все значения будут тождественно равны нулю.
Частная автокорреляционная функция r
част
(
). С помощью этой
функции реализуется идея измерения автокорреляции, существующей
между разделенными
тактами времени членами временного ряда x
t
и x
t+
,
при устраненном опосредованном влиянии на эту взаимозависимость всех
промежуточных членов этого временного ряда. Частная автокорреляция 1-
го порядка может быть подсчитана с использованием соотношения:
,
1
1
1
2
,
2
2
2
1
2
част
r
r
r
x
x
x
r
r
t
t
t
(П2.4)
где
среднее значение анализируемого стационарного процесса.
Частные автокорреляции более высоких порядков могут быть подсчи-
таны аналогичным образом по элементам общей корреляционной матрицы
R = ||r
ij
||, в которой r
ij
= = r(x
i
, x
j
) = r(|i
j|), где i, j = 1,…, T и r(0) = 1. Так,
например, частная автокорреляция 2-го порядка определяется по формуле:
.
1
1
2
1
1
2
1
,
3
2
2
2
1
3
част
r
r
r
r
r
x
x
x
x
r
r
t
t
t
t
(П2.5)
Эмпирические (выборочные) версии автокорреляционных функ-
ций получаются с помощью тех же соотношений (П2.4), (П2.5) при замене
участвующих в них теоретических значений автокорреляций r(
) их стати-
стическими оценками
rˆ
.
179
Полученные таким образом частные автокорреляции r
част
(1),r
част
(2),…
можно нанести на график, в котором роль абсциссы выполняет величина
сдвига
.
Знание автокорреляционных функций r(
) и r
част
(
) оказывает суще-
ственную помощь в решении задачи подбора и идентификации модели
анализируемого временного ряда.
Спектральная плотность p(
). Спектральную плотность стационар-
ного временного ряда определяется через его автокорреляционную функ-
цию соотношением
,
i
e
r
p
где
1
i
. Так как r(
) = r(
), спектральная плотность может быть запи-
сана в виде
.
cos
2
1
1
r
p
Следовательно, функция p(
) является гармонической с периодом 2
.
График спектральной плотности, называемый спектром, симметричен от-
носительно
=
. Поэтому при анализе поведения p(
) ограничиваются
значениями 0
. Спектральная плотность принимает только неотри-
цательные значения.
Использование свойств этой функции в прикладном анализе времен-
ных рядов определяется как «спектральный анализ временных рядов». До-
статочно полное описание этого подхода приведено, например, в [Джен-
кинс, Ватс (1971, 1972)] и [Ллойд, Ледерман (1990)]. Применительно к
статистическому анализу экономических рядов динамики этот подход не
получил широкого распространения, т.к. эмпирический анализ спектраль-
ной плотности требует в качестве своей информационной базы либо доста-
точно длинных стационарных временных рядов, либо нескольких траекто-
рий анализируемого временного ряда (и та и другая ситуация весьма редки
в практике статистического анализа экономических рядов динамики).
Для содержательного анализа важно, что величина спектральной
плотности характеризует силу взаимосвязи, существующей между времен-
ным рядом x
t
и гармоникой с периодом 2
/
. Это позволяет использовать
спектр как средство улавливания периодичностей в анализируемом вре-
менном ряду: совокупность пиков спектра определяет набор гармониче-
ских компонентов в разложении (1.1.1). Если в ряде содержится скрытая
180
гармоника частоты
, то в нем присутствуют также периодические члены с
частотами
/2,
/3 и т.д. Это так называемое «эхо», повторяемое спектром
на низких частотах. Эффект «эха» анализировался в статье [Granger (1963)]
на примере ряда ежемесячных безналичных расчетов между банками США
за 1875–1958 гг.
Можно несколько расширить класс моделей стационарных временных
рядов, используемых при анализе конкретных рядов экономической динами-
ки.
Определение 2.2. Ряд называется слабо стационарным (или стацио-
нарным в широком смысле), если его среднее значение, дисперсия и кова-
риации не зависят от t.
П2.2. Неслучайная составляющая временного ряда и методы его
сглаживания
Существенную роль в решении задач выявления и оценивания трендо-
вой, сезонной и циклической составляющих в разложении (1.1.1) играет
начальный этап анализа, на котором:
выявляется сам факт наличия/отсутствия неслучайной (и зависящей от
времени t) составляющей в разложении (1.1.1); по существу, речь идет
о статистической проверке гипотезы
H
0
: Ex
t
=
= const
(П2.6)
(включая утверждение о взаимной статистической независимости
членов исследуемого временного ряда) при различных вариантах кон-
кретизации альтернативных гипотез типа
H
А
: Ex
t
const;
строится оценка (аппроксимация) для неизвестной интегральной не-
случайной составляющей f( t) =
1
f
тр
( t) +
2
( t) +
3
( t), т.е. решается за-
дача сглаживания (элиминирования случайных остатков
t
) анализиру-
емого временного ряда x
t
.
П 2 . 2 . 1 . П р о в е р к а г и п о т е з ы о н е и з м е н н о с т и с р е д н е г о
з н а ч е н и я в р е м е н н о г о р я д а
Критерий серий, основанный на медиане. Расположим члены анали-
зируемого временного ряда в порядке возрастания, т.е. образуем по наблю-
дениям вариационный ряд:
x
(1)
, x
(2)
,…, x
( T)
.
Определим выборочную медиану по формуле
181
четно.
если
,
2
1
нечетно,
если
,
1
2
2
2
1
Т
x
x
Т
x
x
T
T
T
T
med
После этого мы образуем «серии» из плюсов и минусов, на статисти-
ческом анализе которых основана процедура проверки гипотезы (П2.6). По
исходному временному ряду, построим последовательность из плюсов и
минусов следующим образом: вместо x
t
ставится «+», если
T
med
t
x
x
, и «
»,
если
T
med
t
x
x
(члены временного ряда, равные
T
med
x
, в полученной таким
образом последовательности плюсов и минусов не учитываются).
Образованная последовательность плюсов и минусов характеризуется
общим числом серий
(Т) и протяженностью самой длинной серии
(Т).
При этом под «серией» понимается последовательность подряд идущих
плюсов и подряд идущих минусов. Если исследуемый ряд состоит из ста-
тистически независимых наблюдений, случайно варьирующих около неко-
торого постоянного уровня (т.е. справедлива гипотеза (П2.6)), то чередо-
вание «+» и «
» в построенной последовательности должно быть
случайным, т.е. эта последовательность не должна содержать слишком
длинных серий подряд идущих «+» или «
», и, соответственно, общее чис-
ло серий не должно быть слишком малым. Так что в данном критерии це-
лесообразно рассматривать одновременно пару критических статистик
(
(Т);
(Т)).
Справедлив следующий приближенный статистический критерия про-
верки гипотезы Н
0,
выраженной соотношением (П2.6): если хотя бы одно
из неравенств
,
1
96
,
1
2
2
1
T
T
T
1
ln
43
,
1
T
T
окажется
нарушенным, то гипотеза (П2.6) отвергается с вероятностью ошибки
,
такой, что 0,05 <
< 0,0975 и, тем самым, подтверждается наличие зави-
сящей от времени неслучайной составляющей в разложении (1.1.1).
Критерий «восходящих» и «нисходящих» серий. Этот критерий
«улавливает» постепенное смещение среднего значения в исследуемом
распределении не только монотонного, но и более общего, например, пе-
риодического характера.
Так же, как и в предыдущем критерии, исследуется последователь-
ность знаков
плюсов и минусов, однако правило образования этой после-
довательности в данном критерии иное. Здесь на i-ом месте вспомогатель-
ной последовательности ставится «+», если x
i+1
x
i
> 0, и «
»с, если x
i+1
x
i
182
< 0 (если два или несколько следующих друг за другом наблюдений равны
между собой, то принимается во внимание только одно из них). Последо-
вательность подряд идущих «+» (восходящая серия) будет соответствовать
возрастанию результатов наблюдения, а последовательность «
» (нисхо-
дящая серия)
их убыванию. Критерий основан на том же соображении,
что и предыдущий: если выборка случайна, то в образованной последова-
тельности знаков общее число серий не может быть слишком малым, а их
протяженность
слишком большой.
При уровне значимости 0,05 <
< 0,0975 критерий вид:
,
,
90
29
16
96
,
1
3
1
2
0
T
T
T
T
T
(П2.7)
где величина
0
(Т) определяется следующим образом:
Т
Т
26
26 < Т
153
153 < Т
1170
0
(Т)
0
= 5
0
= 6
0
= 7
Если хотя бы одно из неравенств (П2.7) окажется нарушенным, то ги-
потезу (П2.6) следует отвергнуть.
Критерий квадратов последовательных разностей (критерий Аб-
бе). Если есть основания полагать, что случайный разброс наблюдений x
(t)
относительно своих средних значений подчиняется нормальному закону
распределения вероятностей, то для выяснения вопроса о возможном си-
стематическом смещении среднего в ходе выборочного обследования целе-
сообразно воспользоваться критерием Аббе, являющимся в этом случае
более мощным.
Для проверки гипотезы (П2.6) с помощью данного критерия подсчи-
тывают величину
T
s
T
q
T
2
2
, где
;
1
2
1
1
1
2
1
2
T
i
i
i
x
x
T
T
q
,
1
1
1
2
2
T
i
t
x
x
T
s
.
1
1
T
i
i
x
T
T
x
x
Если
,
min
T
T
то
гипотеза (П2.6) отвергается. При этом величина
T
min
для T > 60 под-
считывается как
,
1
5
,
0
1
2
min
u
T
u
T
где u
-квантиль
183
нормированного нормального распределения. Величины
T
min
при T
60 для трех наиболее употребительных значений уровня значимости
приведены в табл. 4.9 книги [Большев, Смирнов (1965)].
П 2 . 2 . 2 . М е т о д ы с г л а ж и в а н и я в р е м е н н о г о р я д а ( в ы д е л е -
н и е н е с л у ч а й н о й с о с т а в л я ю щ е й )
Методы выделения неслучайной составляющей в траектории, отража-
ющей поведение временного ряда, подразделяются на два типа.
Методы первого типа (аналитические) основаны на допущении, что
известен общий вид неслучайной составляющей в разложении (1.1.1)
f( t) =
1
f
тр
( t) +
2
( t) +
3
( t).
(П2.8)
Например, если известно, что неслучайная составляющая временного
ряда описывается линейной функцией времени f( t) =
0
+
1
t, где
0
и
1
некоторые неизвестные параметры модели, то задача ее выделения (задача
элиминирования случайных остатков или задача сглаживания временного
ряда) сводится к задаче построения хороших оценок
0
ˆ
и
1
ˆ
для парамет-
ров модели.
Методы второго типа (алгоритмические) не связаны ограничитель-
ным допущением о том, что общий аналитический вид искомой функции
(П2.8) известен исследователю. В этом смысле они являются более гибки-
ми, более привлекательными. Однако «на выходе» задачи они предлагают
исследователю лишь алгоритм расчета оценки
t
fˆ
для искомой функции
f( t) в любой наперед заданной точке t и не претендуют на аналитическое
представление функции (П2.8).
Dostları ilə paylaş: |