ЭКОНОМЕТРИКА
ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Методические указания к лабораторным работам
для студентов бакалавриата направлений
21.03.02, 38.03.01
САНКТ-ПЕТЕРБУРГ
2017
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное
учреждение высшего образования
Санкт-Петербургский горный университет
Кафедра информатики и компьютерных технологий
ЭКОНОМЕТРИКА
ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Методические указания к лабораторным работам
для студентов бакалавриата направлений
21.03.02, 38.03.01
САНКТ-ПЕТЕРБУРГ
2017
УДК 519.86:622.3.012 (073)
ЭКОНОМЕТРИКА. Парная линейная регрессия: Методические указа-
ния к лабораторным работам / Санкт-Петербургский горный университет. Сост.:
В.В. Беляев, Т.Р. Косовцева. СПб, 2017. 43 с.
Методические указания содержат необходимые теоретические сведения
по выполнению лабораторных работ по эконометрике. Приведены примеры выпол-
нения заданий по исследованию корреляционных и регрессионных связей между
характеристиками экономического процесса, которые являются теоретической ос-
новой применения эконометрических методов. Все решения выполнены с исполь-
зованием электронных таблиц MS Excel, в том числе с применением надстройки
«Пакет анализа».
Предназначены для студентов бакалавриата направлений 21.03.02 «Земле-
устройство и кадастры» по дисциплине «Экономико-математические методы и мо-
делирование», 38.03.01 «Экономика» по дисциплине «Эконометрика» и могут быть
полезны всем, изучающим математическое моделирование. Выполнение этих работ
способствуют приобретению студентами следующих компетенций:
способности осуществлять сбор, анализ и обработку данных, необходимых
для решения поставленных экономических задач;
способности выбрать инструментальные средства для обработки экономиче-
ских данных в соответствии с поставленной задачей, проанализировать ре-
зультаты расчетов и обосновать полученные выводы;
способности на основе описания экономических процессов и явлений строить
стандартные теоретические и эконометрические модели, анализировать и со-
держательно интерпретировать полученные результаты.
Научный редактор доц. А.Б. Маховиков
Санкт-Петербургский
горный университет, 2017
3
ВВЕДЕНИЕ
Эконометрика – наука о применении статистических
методов в экономическом анализе для проверки правильности
экономических теоретических моделей и способов решения
экономических проблем.
Основной целью эконометрики является модельное описание
конкретных количественных взаимосвязей, обусловленных общими
качественными закономерностями, изученными в экономической
теории.
Области применения эконометрических моделей напрямую
связаны с целями эконометрического моделирования, основными из
которых являются:
1) анализ экономических и социально-экономических
показателей, характеризующих состояние и развитие анализируемой
системы;
2) прогноз различных возможных сценариев социально-
экономического развития анализируемой системы.
В качестве анализируемой экономической системы могут
выступать страна в целом, регионы, отрасли и корпорации, а также
предприятия, фирмы и домохозяйства.
Одним из основных типов эконометрических моделей
являются регрессионные модели с одним уравнением. Простейшей
моделью является парная регрессия, т.е. модель, в которой
анализируется взаимосвязь между двумя величинами.
В таких моделях зависимая (объясняемая) переменная
Y
представляется в виде функции
,
X
f
Y
,
где
X
- независимая (объясняющая) переменная,
)
,...
,
(
1
1
k
- параметры.
В зависимости от вида функции модели делятся на линейные
и нелинейные.
В данных методических указаниях рассматриваются
способы исследования взаимосвязи между переменными с помощью
линейной регрессии.
4
ЛАБОРАТОРНАЯ РАБОТА 5. ПАРНАЯ ЛИНЕЙНАЯ
РЕГРЕССИЯ
Цель: освоить на практике с помощью табличного
процессора MS Excel:
основы теории корреляции;
построение модели линейной парной регрессии.
5.1. ТЕОРЕТИЧЕСКИЕ СВЕДЕНИЯ
5.1.1. ОСНОВЫ ТЕОРИИ КОРРЕЛЯЦИИ
Рассмотрим некоторый экономический объект (процесс,
явление, систему) и выделим только два признака (величины),
характеризующие этот объект. Обозначим признаки буквами
y
и
x
Тесноту линейной связи между признаками
y
и
x
характеризует коэффициент корреляции
xy
r
:
y
x
xy
y
x
r
)
,
cov(
,
(5.1)
где величина
)
,
cov(
Y
X
называется ковариацией между признаками
Y и X , где
y
x
y
x
x
x
y
y
n
y
y
x
x
M
y
x
n
i
i
i
1
1
)
(
)
(
)
,
cov(
;
i
n
i
i
n
i
i
n
i
i
y
y
n
y
x
x
n
x
y
n
y
1
1
1
1
;
1
;
1
;
n
i
i
X
n
i
i
Y
x
x
n
y
y
n
1
2
2
1
2
2
1
;
1
.
Отметим, что
1
1
xy
r
. Чем ближе
xy
r
к единице, тем
сильнее связь. Если
0
xy
r
, то между признаками
y
и
x
существует прямая зависимость, т.е. с ростом одного признака
5
другой признак тоже возрастает. Если
0
xy
r
, то между признаками
y
и
x
существует обратная зависимость, т.е. с ростом одного
признака другой признак убывает. Если
1
xy
r
, то между
признаками
y
и
x
существует линейная зависимость. Если
0
xy
r
, то между признаками
y
и
x
отсутствует линейная
зависимость.
Следует отметить, что в формулу для вычисления
коэффициента
корреляции
xy
r
оба
входят
симметрично
(равноправно), т.е. он характеризует как зависимость
y
от
x
, так и
зависимость
x
от
y
.
5.1.2. ОСНОВЫ РЕГРЕССИОННОГО АНАЛИЗА
В ряде случаев необходимо не только установить факт
взаимосвязи между признаками
x
и
y
, но и исследовать, как
изменение одной величины влияет на изменение другой. Обычно
согласно некоторой экономической гипотезе выделяют зависимые и
независимые переменные.
Будем предполагать, что независимая переменная
x
(объясняющая переменная, предиктор, факторный признак,
регрессор, экзогенная переменная) оказывает воздействие на
значения зависимой переменной
y
(отклик, результативный
признак, эндогенная переменная), т.е. имеет место зависимость
y
от
x
.
Зависимость между переменными может быть строгой
(функциональной), либо статистической. Связь между показателями
называется
функциональной,
если
каждому
значению
x
соответствует определенное значение
y
, т. е.
y
x
, где
–
обычная числовая функция.
В
экономике
функциональная
зависимость
между
переменными проявляется редко. Обычно на связь переменных
накладывается воздействие случайных факторов и каждому
6
конкретному значению фактора соответствует не одно, а множество
значений отклика, точнее, некоторое вероятностное распределение
зависимой переменной.
Если при изменении значений
x
изменяется закон
распределения случайной величины
y
, то зависимость переменной
y
от переменной
x
называется статистической. Для изучения
статистической зависимости необходимо располагать большими
совокупностями наблюдений переменной
y
для каждого значения
переменной
x
. Обычно исследуют, как изменяется среднее
значение
y
при изменении значений
x
. Зависимость, при которой
изменение
x
приводит к изменению математического ожидания
случайной величины
y
, называется корреляционной.
Функцией регрессии (уравнением регрессии)
y
на
x
называется
функция,
описывающая
изменение
условного
математического ожидания (среднего значения) зависимой
переменной
y
при изменении
x
:
).
(
)
|
(
x
f
x
y
М
(5.2)
График
f x
называется линией регрессии. Если
f x
const
, то корреляционная зависимость отсутствует.
Реальное значение зависимой переменной
y
не всегда
совпадает с ее условным математическим ожиданием
)
|
(
x
y
М
.
Чтобы отразить статистическую суть зависимости, вводят
случайную составляющую
u
, которая является случайной
величиной. Таким образом, связь между зависимой и объясняющей
переменными можно выразить следующей формулой:
,
)
(
u
x
f
y
(5.3)
которая называется регрессионной моделью, где
u
– случайное
возмущение или отклонение.
В зависимости от количества факторов регрессионные
модели подразделяются на модели парной регрессии и модели
множественной регрессии. В парной регрессионной модели отклик
зависит только от одного фактора.
7
Особенностью эконометрической модели является наличие
двух составляющих:
неслучайная составляющая
)
(x
f
– это часть
отклика, которая полностью объясняется значением
фактора
x
;
случайная составляющая
u
– часть зависимой
переменной, которая не может быть объяснена
значением фактора
x
.
Регрессионную модель, записанную в виде (5.3), можно
рассматривать со следующими целями:
установления самого факта наличия или отсутствия
значимой связи между
x
и
y
;
прогнозирования неизвестных значений
y
по известным
значениям
x
,
выявления причинно-следственных связей между
x
и
y
.
Таким образом, уравнение регрессии позволяет провести
анализ и прогноз исследуемого экономического процесса. Процесс
построения, изучения и применения эконометрических моделей
называется эконометрическим моделированием.
Пусть мы располагаем
n
парами переменных
x
и
y
:
.
...,
,
,
;
,...,
,
2
1
2
1
n
y
y
y
x
x
x
На практике эти значения часто получаются как результаты
некоторого эксперимента (реального или условного), поэтому их
часто
называют
наблюдаемыми
или
экспериментальными
(эмпирическими)
значениями.
Эти
данные
могут
также
рассматриваться как выборка (выборочные данные) из некоторой
генеральной совокупности, где
n
– объем выборки (количество
наблюдений).
Парная линейная регрессионная модель имеет вид
,
1
0
u
x
a
a
y
(5.4)
8
где
y
– отклик – результативный признак (случайная
величина);
x
– факторная переменная (детерминированная
величина);
1
0
, a
a
– параметры модели (постоянные неизвестные
коэффициенты);
u
– случайное возмущение или отклонение
(случайная величина), характеризующее отклонение от уравнения
регрессии
0
1
= +
f x a a x
(теоретической линейной зависимости).
Присутствие в модели (5.4)
u
(ошибки регрессии)
называемой случайным членом или возмущением, обусловлено
следующими причинами:
- ошибками спецификации, то есть отбора факторов и выбора
связи между явлениями;
- ошибками измерения.
Уравнения
для
отдельных
наблюдений
зависимой
переменной
y
записываются в виде
,
1
0
i
i
i
u
x
a
a
y
(5.5)
где
,
i
i
x y
,
1, ,
i
n
– выборочные данные
(наблюдения),
n
– объем выборки (количество наблюдений).
Относительно возмущений
i
u
,
1, ,
i
n
, необходимо
принять ряд гипотез, известных как условия Гаусса-Маркова:
1. Равенство нулю математического ожидания случайного
члена:
.
,...,
1
,
0
n
i
u
M
i
(5.6)
2. Постоянство
дисперсии
регрессионных
остатков
(гомоскедастичность остатков):
.
.
2
2
i
i
u
D
u
M
(5.7)
3. Отсутствие систематической связи (корреляции) между
значениями случайного члена в любых двух наблюдениях:
9
.
0
j
i
u
u
M
j
i
(5.8)
4.
n
x
x
x
,...,
,
2
1
- неслучайные величины.
Точные значения параметров модели могут быть определены
с использованием значений переменных
x
и
y
всей генеральной
совокупности, что практически невозможно. Поэтому задача
линейного регрессионного анализа состоит в том, чтобы по
имеющимся статистическим данным
,
i
i
x y
,
1, ,
i
n
, для
переменных
x
и
y
получить наилучшие оценки неизвестных
параметров. Следовательно, по выборке нужно построить так
называемое эмпирическое (выборочное) уравнение регрессии
.
ˆ
1
0
x
b
b
y
(5.9)
где
yˆ
– оценка условного математического ожидания,
1
0
, b
b
–
оценки неизвестных параметров
0
a
и
1
a
, называемые
коэффициентами регрессии.
Будем называть
yˆ
- теоретическим значением отклика.
Коэффициент
1
b
в уравнении (5.9) называется коэффициентом
регрессии. Его величина показывает среднее изменение результата
при изменении фактора на единицу. Параметр
0
b
может и не иметь
экономического смысла, формально это значение уравнения
регрессии при нулевом значении параметра
x
. Для определения
коэффициентов уравнения (5.9) используется метод наименьших
квадратов (МНК).
Геометрический смысл МНК показан на рис. 5.1. Каждая
пара чисел
i
i
Y
X
,
определяет точку на плоскости
XOY
.
10
Рис.5.1 Геометрический смысл МНК,
I
– отклонение наблюдаемых
значений
i
Y
от теоретических
i
Yˆ
.
Рассмотрим сумму
n
i
i
i
n
i
i
i
n
i
i
x
y
y
y
u
S
1
2
1
0
1
2
1
2
1
0
)
b
b
(
)
ˆ
(
)
b
,
(b
. (5.10)
Она равна сумме квадратов отклонений (остатков) наблюдаемых
(эмпирических) значений отклика
i
y
от теоретических значений
i
yˆ
в точке
i
x
, при этом
i
i
x
b
b
y
1
0
ˆ
. Величина суммы
)
b
,
(b
1
0
S
зависит от коэффициентов
0
b
и
1
b
.
Суть метода наименьших
квадратов (МНК) заключается в выборе таких значений
0
b
и
1
b
, для
которых
сумма
квадратов
отклонений
(остатков)
будет
минимальной.
Для того чтобы найти набор коэффициентов
0
b
и
1
b ,
которые доставляют минимум функции
)
b
,
(b
1
0
S
, используем
необходимое условие экстремума функции нескольких переменных
11
- равенство нулю частных производных. В результате получим
линейную систему для определения коэффициентов
0
b
и
1
b
:
.
0
b
)
b
,
(b
;
0
b
)
b
,
(b
1
1
0
0
1
0
S
S
(5.11)
С помощью алгебраических преобразований систему (5.11)
можно привести к виду
.
b
b
b
b
1
2
1
1
0
1
1
1
0
1
n
i
i
n
i
i
n
i
i
i
n
i
i
n
i
i
x
x
x
y
x
n
y
(5.12)
Таким образом, нахождение коэффициентов
0
b
и
1
b
сводится к решению системы линейных уравнений относительно
0
b
и
1
b
Эту систему можно решить различными способами: с
помощью обратной матрицы, по формулам Крамера, методом
Гаусса, методом подстановки.
Решая последним способом, получаем соотношения:
.
b
b
,
b
1
0
1
2
1
1
x
y
x
x
x
x
y
y
n
i
i
n
i
i
i
(5.13)
Таким образом, коэффициенты
0
b
и
1
b
линейного
уравнения парной регрессии можно получить по формулам (5.13).
Формулы (5.13), с учетом ранее определенной величины
)
,
cov( y
x
могут быть записаны в виде
1
2
2
2
cov ,
x
x y
xy x y
b
S
x
x
Dostları ilə paylaş: |