Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лабораторная работа - Построение и анализ многофакторной линейной эконометрической модели - файл 1.doc


Лабораторная работа - Построение и анализ многофакторной линейной эконометрической модели
скачать (895 kb.)

Доступные файлы (1):

1.doc895kb.16.11.2011 20:46скачать

Загрузка...

1.doc

Реклама MarketGid:
Загрузка...
Лабораторна робота№2

«Побудова та аналіз багатофакторної лінійної економетричної моделі »


Цель: закрепление теоретического и практического материала по теории «множественная регрессия», приобретение навыков построения и анализа многофакторных эконометрических моделей в модуле Multiple Regression.

Ход работы:

  1. Исходные данные (резулитирующим признаком является производительность труда).





  1. Для построения и анализа множественной линейной эконометрической модели воспользуемся модулем Multiple Regression.




Связь между переменными статистически значима, т.к. коэф. Регрессии равен 0,81. Коэффициент детерминации равен 0,66 (скорегированный = 0,59). Это означает, что вариация зависимой переменной (производительности труда) на 66% объясняется вариацией факторных признаков.

Дисперсия ошибок не значительна и составляет 1,36.

Критерий Фишера равен 9,52, при критическом значении 2,74. Это означает, что в целом модель статистически значима.

Критическое значие критерия Стьюдента = 1,78. Это означает, что не все параметры статистически значимы. Статистически значимыми параметрами являются а0, а2, а3.


  1. Для проверки гипотезы о значимости модели воспользуемся дисперсионным анализом, инициировав кнопку Advanced ANOVA.



Таким образом, сумма квадратов регрессии равна 70,77; квадратов ошибок = 37,14; дисперсия ошибок = 1,86


Проверим модель на наличие мультиколлинеарности, рассчитав матрицу парной корреляции (Descriptive statistic / Correlation matrices).




В данном случае можно говорить о мультиколинеарности между ФЗПср и Стоимостью ОПФср.

Построим гистограммы и диаграммы рассеивания переменных модели:





  1. Инициировав кнопку Partial Correlation получим таблицу со стандартизированными коэффициентами регрессии (Beta in); частными корреляциями (Partial Cor), которые отображают степень влияния каждой независимой переменной на результирующую при условии, что другии переменные не влияют на данную связь. (в данном случае наиболее влиятельными факторами являются стоимость ОПФ и фондоотдача); получастными корреляциями (Semipart Cor); коэф детерминации (R-square) , между переменной и другими независимыми переменными, что отображает меру максимальной сопряженности (сильно связанными переменными являются ОПФ и ФЗП); толерантность модели, которая рассчитывается как 1- R-square; значение критерия Стьюдента для проверки гипотезы о значимости частных коэф. Корреляции.






  1. Оценку степени влияния независимых переменных на результирующий показатель можно просмотреть инициировав кнопку Redundancy в окне Multiple Regression.




  1. Для оценки степени мультиколинеарности по методу Феррара-Глобера используются частные коэффициенты корреляции между факторными переменными и их статистическая значимость. Для их расчета необходимо исследовать модель без зависимой переменной сделав одну из факторных переменных зависимой и определить данные характеристики.









Таким образом, значение частных коэффициентов корреляций равно: , , , , , Значимость коэф. Частных корреляций по t-критерию равна: , , , , , . При этом t табл. равно 1,78

Можно сделать вывод, что между Фондом оплаты труда и среднегодовой стоимостью ОПФ существует линейная взаимосвязь (мультиколлинеарность), т.к частный коэффициент корреляции близок к 1 и этот показатель статистически значим.


Используя метод исключения 1-го из 2-ух сильно связанных признаков для устранения мультиколлинеарности можно исключить из модели ФЗПср, т.к. он оказывает меньшее влияние на производительность труда, чем ОПФср.

Тогда модель будет выглядеть так:




Для исследования общей мультиколлинеарности по методу Феррара-Глобера воспользуемся формулой:

Рассчитанное значение сравнивается с табличным для уровня значимости 0,05 и числа степеней свободы 0,5*m*(m-1)




Анализируя полученный результат ()можно сделать вывод, что факторная система подвержена эффекту мультиколлинеарности.

  1. Анализируя определитель матрицы коэффициентов системы уравнений , zij= можно сделать вывод, что в общем мультиколинеарность между признаками присутствует, хотя он и отличен от нуля и равен 1,82.




  1. Еще один метод исследования мультиколлинеарности – это мера обусловленности по Нейману-Голдштейну, которая заключается в отношении максимального собственного числа матрицы к минимальному.


Для расчета собственных чисел матрицы воспользуемся программным пакетом MatCad и получим следующий результат:




Такое большое значение говорит о наличиии сильной взаимосвязи между переменными.


  1. Также на эффект мультиколлинеарности модель можно проверить с помощью метода максимальной сопряженности.

Для этого фиксируется i-ая независимая переменная и строется регрессия данной переменной на остальные факторные признаки.













В качестве меры максимальной сопряженности выбираем максимальное значение коэффициента множественной корреляции. В данном случае – это кліф. Множественной корреляции для последней модели (R=0,95029), зависимой переменной в которой выступает ФЗПср/г. Данное значение близко к 1, а это означает присутствие эффекта мультиколлинеарности.


  1. Инициировав клавишу анализ ошибок Summary: Residuals & Predicted или Residuals|Casewise plot of residuals, получим таблицу со значениями зависимой переменной, теоретическими значениями зависимой переменной и ошибками модели.





Инициировав кнопку Advanced|Durbin-Watson statistic получим значение автокорреляции ошибок модели по критерию Дарбина-Уотсона и значение нециклического значения автокорреляции.




Табличное значение : dl=1,038 du=1,767 0 < 0,969 < dl. Следовательно можно говорить о положительной автокорреляции. А это может означать, что оценки данной модели не обладают эффективностью и t, F-статистика могут давать завышенные оценки.


Для исследования автокорреляции также применим критерий Фон-Неймана:


Для всестороннего анализа ошибок построим гистограмму и график распределения ошибок на нормальной вероятностной бумаге, на которых видно, что закон распределения ошибок близок к нормальному.





  1. Построение моделей по методу пошагового включения и исключения независимых переменных. Для этого в модуле Multiple Regression предусмотрены Forward Stepwise и Backward Stepwise.





Метод пошагового включения:












Нажав кнопку Stepwise Regression Summary (результаты пошаговой регрессии), получим таблицу результатов, где отображена адекватность модели на каждом этапе и изменение характеристик модели для каждого шага.





Анализ результатов регрессионной модели путем пошагового включения (адекватность, статистическая значимость) получим инициировав кнопку Summary Regression Results.




В данном случае можно сделать вывод, что статистически значима по отдельным показателям: коэф. регрессии равен 0,81; коэф. детерминации равен 65,58%. По критерию Фишера модель также статистически значима. По критерию Стьюдента статистически не значимыми остаются ФЗПср и премии.

Метод пошагового исключения:










Анализ результатов регрессионной модели путем пошагового исключения (адекватность, статистическая значимость) получим инициировав кнопку Summary Regression Results.





Нажав кнопку Stepwise Regression Summary (результаты пошаговой регрессии), получим таблицу результатов, где отображена адекватность модели на каждом этапе исключения и изменение характеристик модели для каждого шага.





Данная модель также является в целом адекватной и статистически значимой.


  1. Построение модели на основе метода ридж-регресси устранения мультиколинеарности.

В модуле Multiple Regression реализацию данного метода можно осуществить на стартовой панели в меню Advanced options (stepwise or ridge regression).

Для выбора ридж-регресси и параметра смещения λ в меню Advanced необходимо инициировать опцию Ridge Regression; lambda.





После нажатия кнопки Summary Regression Results получим таблицу:





Коэф. Детерминации говорит о том, что вариация значений производительности труд на 56,69% обусловлена вариацией независимых переменных, но при этом статистически значимыми параметрами среди независимых переменных являются только фондоотдача и Стоимость ОПФср (ФЗП, который был в линейной звиси мости с др. Переменными, не оказывает значительного влияния на модель – В=0). Также значимо влияние не учтенных в модели факторов.


Исследуем степень изменения параметров модели в зависимости от уровня смещения λ:



Параметры модели ридж-регрессии

 

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

0,99

а0

3,088984

3,954127

4,275497

4,504007

4,691179

4,852703

4,995700

5,124221

5,240907

5,347643

5,436376

а1

0,706144

0,762935

0,757821

0,743386

0,725977

0,707562

0,688984

0,670658

0,652802

0,635529

0,620527

а2

2,313921

1,363308

1,123387

0,990580

0,898005

0,826568

0,768362

0,719343

0,677137

0,640213

0,610621

а3

0,025891

0,012083

0,009225

0,007901

0,007094

0,006526

0,006093

0,005743

0,005449

0,005197

0,004996

а4

-0,000065

0,000000

0,000012

0,000016

0,000018

0,000019

0,000019

0,000019

0,000019

0,000019

0,000018


Построим график гребневого следа параметров, который отражает степень смещения оценок регрессионной модели:

  • Для а0





  • Для а1, а2, а3, а4





13 Еще одним методом устранения мультиколлинеарности является метод главных компонент, суть которого сводится к формированию искусственных переменных, которые являются линейной комбинацией исходных переменных, но не находятся в корреляционной зависимости между собой.

Для этого в меню Statistics откроем Multivariate Exploratory Techniques/Factor Analysis, выберем все переменные кроме Y , максимальное число факторов – 4 , минимальное собственное число = 0:





На вкладке Advanced установим переключатель в положение в положение Principal components и нажмем «Ок».

Инициируем опцію Eigenvalues и получим следующую таблицу:





Для рассмотрения нам нужно оставить первый и второй факторы, т.к. собственные числа більше 1 и в сумне они обьясняют более 75% вариации.

Инициируем Scree Plot, чтобы построить график собственных чисел:





График дает нам визуальное подтверждение предыдущих выводов.


На вкладке Loadings выберем Summary: Factor Loadings:





Данная таблица отражает факторные загрузки (коэффициенты корреляции в соответствии с фактором); Expl.Var – собственные числа; Prp.Totl – объясненная дисперсия.

Для того, чтобы получить таблицу факторов (главных компонент) инициируем опцию Factor Scores




Довавляем ранее выбранные 1-ый и второй факторы в исходные данные на лист Spreadsheet и строем уравнение регрессии по этим двум факторам и зависимой переменной Y.




Полученная модель является статистически значимой по критерию Фишера, но значимым остается влияние неучтенных факторов.


Учитывая то, что модели в целом адекватны, построим прогноз для производительности труда (Predict dependent variable):







При вышеуказанных значениях ФЗПср, стоимости ОПФср, фондоотдаче и премий, производительность труда составит 7,34 ед/час. Данное значение с вероятностью 95% будет принадлежать интервалу от 6,24 до 8,44 ед/час.


Вывод: приобретены навыки построения и анализа линейной многофакторной эконометрической модели.

Метод гребневой регрессии


Для определения оптимального значения параметра гребневой регрессии воспользуемся формулой: ,

где - вектор оценок параметров стандартной линейной модели и соответственно транспонированный вектор оценок параметров.

Результаты расчета представлены на рисунке:





Воспользуемся методом Ридж-регрессии, реализованным в Statistica. При этом примем за значение значение Q*:




В результате получим модель следующего вида:



Данная модель является в целом адекватной по критерию Фишера. Вариация результирующего признака (производительности труда) на 68,3% зависит от факторных признаков. При этом все же остается значимым влияние неучтенных факторов, а незначимым является влияние всех факторов, кроме стоимости ОПФср.

Метод главных компонент:

Полученная матрица парных корреляций имеет вид:



Определитель данной матрицы равен 0,0775


С помощью пакета Mathcad рассчитаем собственные числа и матрицу нормированных значений собственных векторов данной матрицы:



где n – матрица собственных чисел

mf – матрица нормированных значений собственных векторов

Рассчитаем матрицу факторных нагрузок А по формуле:

, где V- матрица нормированных значений собственных векторов

- матрица вида

Таким образом, матрица А будет выглядеть следующим образом:





Данная матрица отражает частные коэффициенты корреляции между исходными признаками xj и главными компонентами F соответственно.

Определим значение главных компонент, рассчитав матрицу F:




где Z – матрица стандартизированных значений факторных признаков (из исходных данных).

Матрица F будет иметь вид:









Скачать файл (895 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru