Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лекции - Эконометрика - файл 1.doc


Лекции - Эконометрика
скачать (745 kb.)

Доступные файлы (1):

1.doc745kb.04.12.2011 21:00скачать

содержание
Загрузка...

1.doc

  1   2   3
Реклама MarketGid:
Загрузка...
Всероссийский заочный финансово-экономический институт


Э К О Н О М Е Т Р И К А
Конспект лекций


Тема 1. Введение. Эконометрика и эконометрическое моделирование: основные понятия и определения



Эконометрика – это наука, которая даёт количественное выражение взаимосвязей экономических явлений и процессов.

Основные задачи эконометрики: построение количественно определённых экономико-математических моделей, разработка методов оценки их параметров по статистическим данным, анализ свойств построенных моделей и прогнозирование на их основе экономических процессов.

Можно выделить три основных класса моделей, которые применяются для анализа и прогнозирования экономических процессов:

  • модели временных рядов,

  • регрессионные модели с одним уравнением,

  • системы одновременных уравнений.

При этом все переменные любой эконометрической модели по способу их вхождения в эту модель можно разбить на объясняемые (зависимые, исследуемые) переменные и объясняющие (предопределённые, факторные) переменные.

Например, если мы будем решать задачу прогнозирования продаж мороженого в определённый день каким-либо торговым предприятием, то объясняемой переменной будет объём продаж, а объясняющими переменными могут выступать: температура воздуха, торговая наценка, среднедушевой доход населения и другие.

Необходимым условием использования той или иной переменной при построении модели является наличие ряда данных наблюдений (измерений) величины этой переменной, либо получение ряда значений с использованием дополнительных вычислений на основе наблюдений о показателях, объясняющих интересующую нас переменную.

Например, определение достоверных значений среднедушевого дохода непосредственно по результатам опросов и бухгалтерской отчётности может оказаться сложнее оценки изменения дохода на основе информации об изменении розничного оборота товаров и услуг, а также изменении общей суммы банковских вкладов населения.

В эконометрике выделяют три типа данных:

^ I. Кросс секционные (перекрёстные) данные представляют ситуацию в группе переменных в отдельный момент времени. Таковыми, например, являются публикуемые в деловых разделах газет списки цен на различные акции, процентные ставки по разным видам вкладов и обменные курсы разных валют. Другим примером может служить информация о продажах торговым предприятием в определённый день товаров различных групп (пищевых, хозяйственных и т.д.)

^ II. Пространственные данные характеризуют ситуацию по конкретной переменной (или набору переменных), относящейся к пространственно разделённым однотипным объектам в один момент времени. Например, данные о курсах валют в один день по разным обменным пунктам города или продажи мороженого в различных киосках в один день.

  1. Временные ряды отражают изменения (динамику) какой-либо переменной на промежутке времени. Например, данные об обменном курсе валюты за каждый день в конкретном обменном пункте или данные о продажах мороженого в одном киоске за каждый день будут являться ежедневным временным рядом.
Эконометрическое моделирование состоит из следующих этапов:

  1. На постановочном этапе формулируются конечные цели моделирования, определяется наборы возможных исследуемых (объясняемых) переменных и факторных (объясняющих) переменных .

  2. На предварительном этапе осуществляется предварительный анализ экономической сути изучаемого явления, возможностей сбора и обработки статистических данных.

  3. На этапе параметризации производится выбор общего вида модели, в том числе состава и формы входящих в неё связей. Например, может быть выбрана модель с одной объясняющей и одной объясняемой переменными – модель парной регрессии. Если объясняющих (факторных) переменных используется две или более, то говорят об использовании модели множественной регрессии. При этом, в качестве вариантов могут быть выбраны линейная, экспоненциальная, гиперболическая, показательная и другие виды функций, связывающие эти переменные.

  4. Информационный этап заключается в сборе информации (проведение наблюдений, использование материалов отчётности и т.д.) и предварительном анализе данных (проверка аномальных значений показателей, сглаживание, тестирование на наличие тенденции исследуемых показателей к изменению).

5. Идентификация модели посвящена определению неизвестных параметров (коэффициентов) модели с использованием имеющегося набора данных. Наибольшее распространение для оценки параметров получил метод наименьших квадратов.

  1. Проверка (верификация) модели и прогнозирование предполагает сопоставление реальных и модельных данных, проверку адекватности модели, оценку точности модельных данных. Если модель адекватна и имеет приемлемую точность, то на её основе строится прогноз – точечный и интервальный.



^

Тема 2. Парная корреляция и регрессия



Изучение действительности показывает, что изменение каждого исследуемого (объясняемого) показателя находится в связи и взаимодействии с изменением объясняющих (факторных) показателей. Например, изменение производительности труда работников предприятия зависит от степени совершенства применяемого оборудования, технологии, организации труда, управления и других факторов.

Рассматривая зависимости между признаками, необходимо выделить два вида зависимостей: функциональные и корреляционные.

Функциональные связи характеризуются полным соответствием между изменением факторного признака (признаков) и исследуемого показателя. Так, величина начисленной зарплаты при повременной оплате труда однозначно определяется количеством отработанных часов.

В корреляционных связях между изменением факторного и результативного признаков нет однозначного соответствия, воздействие факторов проявляется лишь в среднем при многократном наблюдении фактических данных. Например, чем больше у человека заработная плата, тем больше он тратит денег на покупку одежды. Однако, точную величину таких расходов при определенной величине заработной платы назвать нельзя. Можно только определить среднюю величину расходов на одежду у людей с определённым размером заработной платы.

В отличие от жёсткости функциональной связи корреляционные связи характеризуются множеством причин и следствий и устанавливаются лишь тенденции изменения исследуемого признака при изменении факторного признака (признаков).

^

2.1. Ковариация. Выборочный коэффициент парной корреляции




Основная задача корреляционного анализа заключается в выявлении взаимосвязи между случайными переменными путём оценки коэффициентов корреляции и детерминации, а также проверки значимости полученных значений.

В эконометрике корреляционный анализ применяется для отбора факторов, оказывающих наибольшее влияние на исследуемый показатель и оценки качества построенных эконометрических моделей.

Мерой взаимосвязи между двумя переменными v и w является выборочная ковариации, вычисляемая по правилу:
,

где - результаты наблюдений, n – число наблюдений, Обозначения переменных специально выбраны отличные от x и y, чтобы подчеркнуть возможность наличия связи между двумя любыми переменными, не обязательно являющимися объясняющей и объясняемой переменными.

Существенным недостатком ковариации является зависимость от единиц, в которых измеряются переменные v и w. Если мы одни и те же данные запишем с использованием различных единиц измерения, то получим различные значения ковариации. То есть любое ненулевое значение ковариации само по себе не позволяет сделать вывод о тесноте связи между переменными.

Поэтому для измерения силы связи между двумя переменными используется парный коэффициент корреляции. Парный коэффициент корреляции является показателем тесноты связи между переменными v и w лишь в случае линейной зависимости между этими переменными.

В практических расчётах обычно используется выборочный парный коэффициент парной корреляции, определяемый по имеющемуся набору фактических данных:
, (2.1)
где - выборочные значения дисперсии переменных v и w.

Парный коэффициент корреляции обладает следующими свойствами:

  1. принимает значение в интервале [-1;1], то есть ;

  2. не зависит от выбора начала отсчёта и единицы измерения ,

где a, b, c, d – постоянные величины, причём a и с – положительны;

  1. если , то между переменными имеется прямая связь, то есть при возрастании (убывании) одной из них другая также возрастает (убывает); если , то связь является обратной, то есть при возрастании одной переменной другая убывает;

  2. если , то между переменными имеется функциональная линейная зависимость, а если , то линейная связь между переменными отсутствует; соответственно, чем ближе модуль коэффициента парной корреляции к единице, тем теснее связь между переменными.

Заметим, что при отсутствии линейной связи между двумя переменными, между ними может существовать тесная связь другого вида.

Пример 1. В таблице приведены данные об объёмах продаж мороженого в магазине за день y, в зависимости от температуры воздуха в городе x2 и процента торговой надбавки x3. Видно, что спрос быстро растёт при повышении температуры воздуха. При наступлении очень высоких температур, предприятие резко увеличивает наценку, поскольку оказывается не в состоянии физически удовлетворить резко возрастающий спрос и сдерживает его повышением цен.

Требуется определить наличие между переменными линейных корреляционных связей, сделать выводы об их тесноте и охарактеризовать как прямые или обратные.

Таблица 1.

y

x1

x2

2

5

20

3,5

10

20

5

15

20

12

20

20

22

25

20

40

30

25

42

35

50


Решение. В первую очередь вычислим средние значения переменных в предложенной выборке данных:. Аналогично, . Тогда выборочные коэффициенты парной корреляции:


Следовательно, мы можем сказать, что между переменными y (объём продаж) и x1 (температура воздуха) имеется тесная прямая линейная связь. Между переменными x1 (температура воздуха) и x2 (торговая наценка) также наблюдается тесная прямая линейная зависимость. То же самое можно сказать о взаимосвязи между переменными y и x2.

Для того, чтобы проверить, можем ли мы делать вывод о наличии линейной корреляционной связи между переменными по полученному значению коэффициента парной корреляции производится оценка его значимости, то есть определяется действительно ли полученное значение отражает наличие линейной связи, или же ненулевое значение коэффициента получено в результате случайных колебаний показателей или является следствием погрешности в вычислениях.

^

2.2. Оценка значимости выборочного коэффициента парной корреляции




Для оценки значимости выборочного коэффициента парной корреляции применяется t-критерий Стьюдента. При этом фактическое значение этого критерия определяется по формуле:



, (2.2)
где n – число наблюдений. Полученное значение сравнивается с табличным критическим значением , зависящим от уровня значимости α и числа степеней свободы . Критическое значение может быть найдено по соответствующим таблицам, а при использовании табличного процессора Excel – с помощью функции СТЬЮДРАСПОБР (α ; γ).

При полученное значение коэффициента корреляции r признается значимым, то есть между переменными имеется линейная корреляционная зависимость.

Для рассмотренного Примера 1 при , с учётом количества степеней свободы критическое значение . Вычислим для каждой пары переменных и сделаем вывод о значимости соответствующих коэффициентов корреляции.

Для пары переменных y, x1 :
.

Следовательно, значение коэффициента является значимым.

Для пары переменных y, x2 :
.

Следовательно, мы можем утверждать, что значение коэффициента является значимым.

Для пары переменных x1, x2 :
.

Следовательно, значение коэффициента является значимым.

Поскольку мы выбрали уровень значимости , то с вероятностью 10% мы сделали ошибочные выводы, а с вероятностью наши выводы верны.

^

2.3. Модель парной регрессии. Основные понятия. Линейная парная регрессия



Регрессионное уравнение, разрешённое относительно исследуемой переменной у при наличии одной факторной переменной x, в общем виде записывается как:

,

и показывает, каково будет в среднем значение переменной y, если переменная х примет конкретное значение. Индекс р указывает на то, что мы получаем расчётное значение переменной y. Мы говорим в среднем, поскольку под влиянием неучтённых в модели факторов и в результате погрешностей измерения фактическое значение переменной y может принимать различные значения для одного значения x.

Если f(x) является линейной функцией, то мы имеем общий вид модели парной линейной регрессии:

, (2.3)

где a – постоянная величина (или свободный член уравнения), b – коэффициент регрессии, определяющий наклон линии, вдоль которой рассеяны наблюдения. Коэффициент регрессии характеризует изменение переменной y при изменении значения x на единицу. Если , то переменные положительно коррелированны, если - отрицательно коррелированны. Фактическое значение исследуемой переменной y тогда может быть представлено в виде:

, (2.4)

где ε – разность между фактическим значением (результатом наблюдения) и значением, рассчитанным по уравнению модели. Если модель адекватно описывает исследуемый процесс, то ε – независимая нормально распределённая случайная величина с нулевым математическим ожиданием (Мε = 0) и постоянной дисперсией (Dε = σ2). Наличие случайной компоненты ε отражает тот факт, что присутствуют другие факторы, влияющие на исследуемую переменную и не учтённые в модели.
^

2.4. Определение параметров линейной парной модели методом МНК



Для оценки параметров a и b линейной парной регрессии с использованием имеющегося набора результатов наблюдений наиболее часто используют метод наименьших квадратов (МНК), который минимизирует сумму квадратов εi - отклонения результатов наблюдений yi от рассчитанных по линейной модели (2.3) значений yрi:

(2.5)

Такое решение может существовать только при выполнении условия , то есть когда не все наблюдения проводились при одном и том же значении факторной переменной (сумма квадратов равна нулю, если каждое слагаемое равно нулю). Это условие называется условием идентифицируемости модели.

По данным, приведённым в Примере 1, построим линейную модель для объёма продаж мороженного y в зависимости от температуры воздуха x1. Промежуточные данные вычислений и модельные значения yр приведены в Таблице 2.

Таблица 2.




x1

y

x1i-x1ср

yi-yср

(x1i-x1ср)2

(x1i-x1ср)*(yi-yср)

yр

ε




5,0

2

-15,0

-16,07

225,00

241,07

-4,43

6,43




10,0

3,5

-10,0

-14,57

100,00

145,71

3,07

0,43




15,0

5

-5,0

-13,07

25,00

65,36

10,57

-5,57




20,0

12

0,0

-6,07

0,00

0,00

18,07

-6,07




25,0

22

5,0

3,93

25,00

19,64

25,57

-3,57




30,0

40,0

10,0

21,93

100,00

219,29

33,07

6,93




35,0

42,0

15,0

23,93

225,00

358,93

40,57

1,43

Сумма

140,0

126,5

0,0

0,00

700,00

1050,00

126,50

0,00

Среднее

20,0

18,1

b=

1,5

a=

-11,93








И

ε3

ε6
сходные данные наблюдений и результаты расчётов приведены на следующем рисунке Рис 1. Модель парной линейной регрессии

Таблица и график построены средствами табличного процессора Excel.

Таким образом уравнение парной линейной модели имеет вид:

.
^

2.5. Проверка значимости параметров парной линейной модели



Поскольку в результате наблюдений мы имеем случайные значения yi, то и вычисленные с их помощью параметры парной линейной модели a и b также являются случайными величинами. Для оценки надёжности полученных значений a и b производится проверка их значимости с использованием стандартной ошибки оценки, которая, в свою очередь, определяется по значениям ряда остатков εi:

, (2.6)

где n – количество наблюдений, m – количество факторных переменных в модели. Выражение (2.6) для определения стандартной ошибки оценки будет использоваться нами в дальнейшем неоднократно, поскольку применимо в случае нелинейных моделей, а также при наличии в модели двух и более факторных переменных, то есть является универсальным.

Собственно проверка значимости параметров линейной модели производится в три этапа, аналогично тому, как это делалось для проверки значимости выборочного коэффициента корреляции.

На первом этапе вычисляются t –статистики:
, (2.7)

где

. (2.8)
На втором этапе определяется критическое значение tкр(α;n-m-1) по таблицам или с помощью функции СТЮДРАСПОБР в Excel. Уровень значимости α задаётся, а число степеней свободы вычисляется по числу наблюдений n и числу факторов m (в парной модели фактор x единственный).

Наконец, на третьем этапе вычисленные значения t-статистик сравниваются с критическими значениями tкр. Если расчётное значение больше табличного, то соответствующий параметр (коэффициент уравнения) считается значимым. В противном случае коэффициент значимым не является, то есть его можно положить равным нулю.

Произведём проверку значимости линейной модели парной регрессии, которую мы построили по данным Примера 1. Стандартная ошибка оценки вычисляется по значениям ряда остатков линейной модели εi ( приведён в последней колонке Таблицы 2):

.

Тогда, с использованием результатов вычислений из Таблицы 2, получаем:

При уровне значимости 10% и числе степеней свободы 7-1-1=5 имеем tкр=2,02. Поскольку расчётные значения t-статистик для обоих параметров больше критического значения, то с вероятностью 90% можно утверждать, что оба параметра линейного уравнения - а и b являются значимыми.

^

2.6. Проверка выполнения предпосылок МНК.



Проверка выполнения предпосылок МНК выполняется на основе анализа остаточной компоненты . Ряд остатков должен удовлетворять ряду требований, а именно: равенство нулю математического ожидания, случайный характер отклонений от математического ожидания, отсутствие автокорреляции и неизменность дисперсии остатков при изменении факторной переменной, нормальный закон распределения. Рассмотрим способы проверки этих условий:

  1. Проверка равенства математического ожидания уровней ряда остатков нулю осуществляется в ходе проверки соответствующей . С этой целью строится t-статистика

, (5.5)

где - среднее арифметическое значение уровней ряда остатков , - среднеквадратическое отклонение для этой последовательности, рассчитанное по формуле для малой выборки. На уровне значимости α гипотеза отклоняется, если , где - критерий распределения Стьюдента с доверительной вероятностью (1-α) и степенями свободы.

  1. Для проверки условия случайности возникновения отдельных отклонений от тренда часто используется критерий поворотных точек. Значение случайной переменной считается поворотной точкой, если оно одновременно больше (или одновременно меньше) значений предыдущего и последующего члена. Если остатки случайны, то поворотная точка приходится в среднем примерно на каждые 1,5 наблюдения.

Существует определённая зависимость между средней арифметической , дисперсией количества поворотных точек в ряде остатков р и числом членов исходного ряда наблюдений n. С использованием этих зависимостей критерий случайности отклонений от тренда при с доверительной вероятностью 0,95 можно представить в виде:
, (5.6)

где квадратные скобки означают, что от результата вычисления в правой части необходимо взять целую часть (не путать с процедурой округления!).

Если неравенство (5.6) не выполняется, то ряд остатков нельзя назвать случайным (то есть он содержит регулярную компоненту) и, следовательно, модель не является адекватной.

  1. Наличие (отсутствие) автокорреляции в отклонениях фактических значений от модели роста проще всего проверить с помощью критерия Дарбина-Уотсона. С этой целью строится статистика Дарбина-Уотсона (d – статистика), в основе которой лежит расчётная формула

. (5.7)
Для формулирования вывода о наличии (отсутствии) автокорреляции полученное значение необходимо сравнить с критическими значениями (нижнее) и (верхнее), которые определяются по специальным таблицам для трёх уровней значимости (=0,01; =0,025; =0,05). При сравнении могут возникнуть следующие ситуации: - остатки содержат автокорреляцию; - область неопределённости, когда нет оснований принять или отвергнуть гипотезу о существовании автокорреляции; - ряд остатков некоррелирован. Если d превышает 2, то это свидетельствует о наличии отрицательной корреляции. Перед входом в таблицу такие значения следует преобразовать по формуле .

Если установлено наличие автокорреляции остатков, нужно улучшить модель (изменить кривые роста, попытаться выделить дополнительные регулярные компоненты и т.п.). Если же ситуация оказалась неопределённой, применяют другие критерии. В частности можно воспользоваться первым коэффициентом автокорреляции:

. (5.8)
Для суждения о наличии или отсутствии автокорреляции с исследуемом ряду фактическое значение коэффициента автокорреляции (5.8) сопоставляется с табличным (критическим) для 5%-го или 1%-го уровня значимости (вероятность допустить ошибку при принятии гипотезы о независимости уровней ряда). Если , то гипотеза об отсутствии автокорреляции в ряду может быть принята. Когда же фактическое значение больше табличного, делают вывод о наличии автокорреляции во временном ряду.

  1. Неизменность дисперсии остатков при изменении факторной переменной (исследование на гетероскедастичность) обычно проверяется с помощью трёх тестов, в которых делаются различные предположения о зависимости между дисперсией случайной компоненты и факторной переменной: тест ранговой корреляции Спирмена, тест Голдфельда-Квандта и тест Глейзера.

При малом объёме выборки для оценки гетероскедастичности может использоваться метод Голдфельда-Квандта. Для проведения такого теста необходимо выполнить следующие шаги:

- упорядочить n наблюдений по мере возрастания переменной x;

- разделить совокупность наблюдений на две группы (соответственно с малыми и большими значениями фактора x) и построить по каждой из групп уравнение регрессии

- определить остаточную сумму квадратов для первой регрессии и второй регрессии .

- вычислить отношения Fнабл = S2/S1 (или S1/S2). В числителе должна быть большая сумма квадратов. F распреде

- полученное отношение имеет сравнит с Fкр(, k1, k2), где k1 = n1 – m, k2 = n2 – m. Здесь n1 и n2 – количество наблюдений попавших в 1-ю и 2-ю группы. Если Fнабл > Fкр , то гетероскедастичность имеет место, то есть условие о неизменности дисперсии при изменении факторной переменной не выполняется.

  1. Соответствие ряда остатков нормальному закону распределения проверим с помощью R/S – критерия:

. (5.9)

Полученное значение проверяется на предмет попадания в интервал, границы которого являются табличными значениями, и зависят от уровня доверия α и количества наблюдений n.

Если все четыре пункта проверки 1-5 дают положительный результат, делается вывод о том, что выбранная трендовая модель является адекватной реальному ряду наблюдений. Только в этом случае её можно использовать для построения прогнозных оценок. В противном случае модель нужно улучшать.

^

2.7. Оценка качества уравнения регрессии



Для общей оценки качества построенной эконометрической определяются такие характеристики как коэффициент детерминации, индекс корреляции, средняя относительная ошибка аппроксимации, а также проверяется значимость уравнения регрессии с помощью F-критерия Фишера. Перечисленные характеристики являются достаточно универсальными и могут применяться как для линейных, так и для нелинейных моделей, а также моделей с двумя и более факторными переменными. Определяющее значение при вычислении всех перечисленных характеристик качества играет ряд остатков εi, который вычисляется путем вычитания из фактических (полученных по наблюдениям) значений исследуемого признака yi значений, рассчитанных по уравнению модели yрi.

Коэффициент детерминации

(2.9)
показывает, какая доля изменения исследуемого признака учтена в модели. Другими словами коэффициент детерминации показывает, какая часть изменения исследуемой переменной может быть вычислена, исходя из изменений включённых в модель факторных переменных с помощью выбранного типа функции, связывающей факторные переменные и исследуемый признак в уравнении модели.

Коэффициент детерминации R2 может принимать значения от 0 до 1. Чем ближе коэффициент детерминации R2 к единице, тем лучше качество модели.

Индекс корреляции можно легко вычислить, зная коэффициент детерминации:
. (2.10)
Индекс корреляции R характеризует тесноту выбранного при построении модели типа связи между учтёнными в модели факторами и исследуемой переменной. В случае линейной парной регрессии его значение по абсолютной величине совпадает с коэффициентом парной корреляции r(x, y), который мы рассмотрели ранее, и характеризует тесноту линейной связи между x и y. Значения индекса корреляции, очевидно, также лежат в интервале от 0 до 1. Чем ближе величина R к единице, тем теснее выбранный вид функции связывает между собой факторные переменные и исследуемый признак, тем лучше качество модели.

Средняя относительная ошибка аппроксимации
(2.11)
выражается в процентах и характеризует точность модели. Приемлимая точность модели при решении практических задач может определяться, исходя из соображений экономической целесообразности с учётом конкретной ситуации. Широко применяется критерий, в соответствии с которым точность считается удовлетворительной, если средняя относительная погрешность меньше 15%. Если Eотн.ср. меньше 5%, то говорят, что модель имеет высокую точность. Не рекомендуется применять для анализа и прогноза модели с неудовлетворительной точностью, то есть, когда Eотн.ср. больше 15%.

F-критерий Фишера используется для оценки значимости уравнения регрессии. Расчётное значение F-критерия определяется из соотношения:
. (2.12)
Критическое значение F-критерия определяется по таблицам при заданном уровне значимости α и степенях свободы (можно использовать функцию FРАСПОБР в Excel). Здесь, по-прежнему, m – число факторов, учтённых в модели, n – количество наблюдений. Если расчётное значение больше критического, то уравнение модели признаётся значимым. Чем больше расчётное значение F-критерия, тем лучше качество модели.

Определим характеристики качества построенной нами линейной модели для Примера 1. Воспользуемся данными Таблицы 2. Коэффициент детерминации:
.
Следовательно, в рамках линейной модели изменение объёма продаж на 90,1% объясняется изменением температуры воздуха.

^ Индекс корреляции

.

Значение индекса корреляции в случае парной линейной модели как мы видим, действительно по модулю равно коэффициенту корреляции между соответствующими переменными (объём продаж и температура). Поскольку полученное значение достаточно близко к единице, то можно сделать вывод о наличии тесной линейной связи между исследуемой переменной (объём продаж) и факторной переменноё (температура).

^ F-критерий Фишера


Критическое значение Fкр при α = 0,1; ν1=1; ν2=7-1-1=5 равно 4,06. Расчётное значение ^ F-критерия больше табличного, следовательно, уравнение модели является значимым.

Средняя относительная ошибка аппроксимации
.

Построенная линейная модель парной регрессии имеет неудовлетворительную точность (>15%), и её не рекомендуется использовать для анализа и прогнозирования.

В итоге, несмотря на то, что большинство статистических характеристик удовлетворяют предъявляемым к ним критериям, линейная модель парной регрессии непригодна для прогнозирования объёма продаж в зависимости от температуры воздуха. Нелинейный характер зависимости между указанными переменными по данным наблюдений достаточно хорошо виден на Рис.1. Проведённый анализ это подтвердил.


^

2.8. Нелинейные модели парной регрессии



Если между исследуемыми и факторными переменными связь имеет нелинейный характер, то для построения модели необходимо использовать нелинейные функции.

Рассмотрим наиболее распространённые парные нелинейные модели.

Парабола второй степени определяет следующий вид модели:
. (2.13)

Параболическую модель целесообразно использовать, если связь меняет свой характер: прямая связь меняется на обратную или, наоборот, обратная связь меняется на прямую. Например, размер заработной платы работников физического труда в среднем растёт до некоторого возраста, а затем начинает убывать. Для определения параметров модели a, b, c модель (2.13) сводится путём замены переменных к линейной модели двухфакторной модели

(2.14)

Для оценки параметров модели вида (2.14), как будет показано далее, используется метод наименьших квадратов (МНК).

В основе гиперболической модели лежит уравнение гиперболы:
(2.15)

Классическим примером гиперболической модели является кривая Филипса, характеризующая нелинейное соотношение между нормой безработицы x и процентом прироста заработной платы y: при росте x до некоторого уровня y также растёт, а при дальнейшем росте x рост y приостанавливается. Этот же характер связи проявляется при изучении зависимости расходов на единицу продукции сырья, материалов, топлива (то есть переменных затрат) от объёма выпускаемой продукции. Другим примером гиперболической зависимости является зависимость времени оборота товаров в зависимости от величины товарооборота. Кривые Энгеля, описывающие долю доходов, расходуемых на непродовольственные товары, в зависимости от размера доходов также описываются гиперболическими функциями.

Сделав замену , мы сведём уравнение (2.15) к линейному виду:

, (2.16)

для оценки параметров которого используется МНК.

Степенная модель

(2.17)
применяется для описания изменения спроса при изменении цены на товар. Параметр b в ней показывает, на сколько процентов уменьшится в среднем спрос, если цена увеличится на 1% (то есть b – отрицательная величина) и называется коэффициентом эластичности. Логарифмирование соотношения (2.17) приводит его к линейному виду:

(2.18)

Применение метода наименьших квадратов (с использованием прологарифмированных данных рядов наблюдений x и y) позволит нам найти коэффициенты уравнения (2.18) ln a и b, тем самым позволит найти параметры исходной степенной модели a и b.

В эконометрических исследованиях применяется также показательная модель:
. (2.19)

Она также сводится к линейному виду путём логарифмирования:

. (2.20)

После логарифмирования ряда фактических значений y и применения МНК получим значения ln a и ln b. Возводя основание логарифма (в данном случае число e) в степень с использованием полученных значений, мы получим оценки параметров а и b исходной показательной модели.

Необходимо отметить, что не все нелинейные модели можно свести к линейной. Если модель не сводится к линейной, то она называется внутренне нелинейной.

Построим показательную модель по данным Примера 1. Для этого построим таблицу, аналогичную Таблице 2, в качестве исходных данных которой будут выступать x1 и, z = ln y.

Таблица 3




x1

z

x1i-x1cp

zi - zср

(x1i-x1ср)2

(x1i-x1ср)*( zi - zср)




5,0

0,69

-15,00

-1,67

225,000

25,084




10,0

1,25

-10,00

-1,11

100,000

11,126




15,0

1,61

-5,00

-0,76

25,000

3,780




20,0

2,48

0,00

0,12

0,000

0,000




25,0

3,09

5,00

0,73

25,000

3,628




30,0

3,69

10,00

1,32

100,000

13,235




35,0

3,74

15,00

1,37

225,000

20,584

Сумма













700,000

77,437

Среднее

20,00

2,37

ln b

0,111

ln a

0,153


Тогда . Зная параметры степенной модели a и b, мы можем вычислить расчётные значения исследуемого признака по формуле (2.17) и составить ряд остатков.

Таблица 4

x1

5,0

10,0

15,0

20,0

25,0

30,0

35,0

y

2,0

3,5

5,0

12,0

22,0

40,0

42,0

yр

2,03

3,52

6,12

10,65

18,51

32,19

55,97

ε

-0,03

-0,02

-1,12

1,35

3,49

7,81

-13,97


Вычислим характеристики качества полученной показательной модели:

Характеристики качества показательной модели оказались лучше соответствующих характеристик линейной модели. Точность модели можно считать удовлетворительной.

Построив несколько моделей, выбрав из них лучшую, удовлетворяющую необходимым требованиям к качеству и точности модели, мы можем использовать эту модель для прогнозирования.

^

2.9. Прогнозирование с применением парного уравнения регрессии



Регрессионные модели могут использоваться для прогнозирования возможных ожидаемых значений исследуемой переменной при заданных (или определённых за рамками модели) значениях факторной переменной. При этом различают точечный и интервальный прогнозы.

Рассмотрим прогнозирование на основе парной линейной модели регрессии

,

Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:

. (2.21)

Вероятность реализации точечного прогноза практически равна нулю. Поэтому в дополнение к точечному прогнозу рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надёжностью. Размах прогнозного интервала L зависит от стандартной ошибки (3.8), удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза α :
. (2.22)
Тогда фактические значения исследуемого признака с вероятностью (1-α) попадут в интервал

(2.23)
Чем больше количество наблюдений n и чем ближе прогнозное значение факторной переменной xпрогн к среднему в ряду наблюдений значению xср, тем меньше прогнозный интервал, то есть лучше качество прогнозирования. Качество самой эконометрической модели влияет на величину прогнозного интервала через стандартную ошибку, которая зависит от величин элементов ряда остатков εi. Чем хуже качество модели, тем больше величины остатков ε, тем больше размах доверительного интервала. Наконец, на величину прогнозного интервала влияет задаваемый уровень значимости (вероятность ошибки). Чем меньше мы задаём уровень значимости, тем больше будет надёжность прогноза. Однако размах доверительного интервала при этом будет расти, поскольку величина t-статистики будет увеличиваться.

При определённых значениях размаха доверительного интервала прогноз теряет актуальность. Например, прогноз температуры воздуха на завтра с размером прогнозного интервала в 20-30 градусов никого не интересует.

Рассчитаем точечный и интервальный прогноз для объёма продаж в Примере 1 с использованием построенной нами в п. 2.4 линейной модели парной регрессии. Прогнозное значение факторной переменной x1прогн мы можем взять по данным Гидрометеоцентра, который, в свою очередь, делает прогноз на основе соответствующих математических моделей. Допустим прогнозное значение температуры воздуха x1прогн = 28 градусов. Тогда точечный прогноз по линейной модели:

.

Для построения доверительного интервала используем стандартную ошибку, вычисленную нами в п. 2.5 и данные Таблицы 2. С учётом получим размах доверительного интервала:

.

Следовательно, ожидаемое значение объёма продаж с вероятностью 90% будет находиться в интервале:

.

Прогнозный интервал получился достаточно большой, что и следовало ожидать исходя из неудовлетворительной точности линейной модели в данной задаче.

Прогнозирование на основе парных нелинейных моделей, которые заменой переменных сводятся к линейной модели, можно произвести, применив формулы (2.21)-(2.23) к линеаризованному виду нелинейной модели. Если исследуемая переменная не участвовала в заменах переменных, то полученный прогнозный интервал является конечным результатом прогнозирования. Если же мы произвели замену исследуемой переменной, то с помощью обратной замены мы должны будем вычислить прогнозный интервал для исходной исследуемой переменной.

Построим прогноз по данным нашего Примера 1 на основе построенной в п.2.7 парной показательной модели, у которой характеристики точности были выше, чем у линейной. В линеаризованном виде показательную модель можно записать в виде:

.

Построим дополнительную вспомогательную таблицу:

Таблица 5

x1

5,0

10,0

15,0

20,0

25,0

30,0

35,0

z

0,69

1,25

1,61

2,48

3,09

3,69

3,74

zр

0,71

1,26

1,81

2,37

2,92

3,47

4,02

ε

-0,013

-0,006

-1,203

0,120

0,173

0,217

-0,287


Значение точечного прогноза для переменной z = ln y будет равно:

.
Для построения прогнозного интервала вычислим стандартную ошибку линеаризованной модели:

,

а с её использованием размах прогнозного интервала для z:
.

Таким образом, мы получаем прогнозный интервал:
.
Для определения прогнозного интервала исходной исследуемой переменной применим обратную замену:

.
В итоге получим прогнозный интервал для исходной исследуемой переменной с использованием показательной модели:

.

Длина интервала получилась меньше, чем длина прогнозного интервала, построенного с использованием линейной модели, чего и следовало ожидать, учитывая лучшие характеристики качества показательной модели по сравнению с линейной.

Однако, величина прогнозного интервала осталась достаточно большой, то есть прогноз остался достаточно грубым. Одним из способов улучшения качества модели, а значит, качества прогнозирования является введение в рассмотрение дополнительных факторных переменных, влияющих на исследуемый признак.

  1   2   3



Скачать файл (745 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru