Лабораторная работа - Отбор факторов в SPSS
скачать (620.7 kb.)
Доступные файлы (6):
SPSS.doc | 503kb. | 05.05.2008 17:51 | ![]() |
SPSS_mine2.doc | 59kb. | 04.04.2010 17:31 | ![]() |
SPSS_mine.doc | 337kb. | 04.04.2010 17:32 | ![]() |
¦¦TА¦-TБ¦-¦-¦+¦-TА ¦¦TА¦-¦¦ 2004.xls | 1070kb. | 23.05.2008 03:00 | ![]() |
Вывод1.spo | |||
Данные.sav |
содержание
- Смотрите также:
- Эволюция приматов и анализ факторов окружающей среды, влияющих на эволюцию приматов [ реферат ]
- Реферат [ документ ]
- Лабораторные работы в программе SPSS (Тестовые и контрольные работы) [txt][doc] [ лабораторная работа ]
- База данных [ документ ]
- Размещение и развитие овцеводства [ лабораторная работа ]
- ПФЭ для четырех факторов [ лабораторная работа ]
- №6 Компьютерные технологии обработки табличной информации [ документ ]
- Интегральное моделирование пожара с применением программных компонентов FOGARD [ лабораторная работа ]
- Отбор средней пробы [ документ ]
- Miller R.L. SPSS For Social Scientists [ документ ]
- Статистический анализ в SPSS [ лекция ]
- Spss statistics быстрый старт [ документ ]
SPSS.doc
Практическая работаОтбор факторов для множественной регрессии с использованием SPSS.
Имеются: данные по 29 предприятиям области.
Требуется: составить уравнение регрессии, описывающее зависимость валовой продукции на 100 га сельскохозяйственных угодий (у) от системы факторов.
Ход решения (Пример).
Анализ проводится по предприятиям из вашего курсового проекта.
Комплекс факторов студент приводит свой, в зависимости от целей исследования, можно использовать как абсолютные показатели размера предприятия (производства), так и относительные показатели интенсификации и эффективности производства, эффективности использования ресурсов. Например:
Стоимость валовой продукции с.-х. в расчете на 100 га с.-х. угодий, тыс. руб. | Численность работников в расчете на 100 га с.-х. угодий, чел. | Плотность условного поголовья скота в расчете на 100 с.-х. угодий, гол. | Затраты на минеральные удобрения в расчете на 100 га посевной площади, тыс. руб. | Площадь сельскохозяйственных угодий, га | Среднегодовая численность работников, занятых в с.-х., чел. | Удельный вес затрат на продукцию растениеводства, % |
1609,2 | 4,4 | 0 | 172,4 | 8045 | 356 | 70,8 |
1749,2 | 3,5 | 18,3 | 49,5 | 6229 | 215 | 69,5 |
913,6 | 2,5 | 7,2 | 57,6 | 5266 | 132 | 0 |
2259,1 | 18,6 | 8,8 | 76,1 | 3497 | 649 | 100 |
2615,1 | 1,8 | 61,4 | 194 | 9272 | 168 | 99,8 |
9925,4 | 93,9 | 181,2 | 23,2 | 156 | 146 | 86,5 |
6110,6 | 9,4 | 3 | 99,1 | 884 | 83 | 36,8 |
1411,1 | 12,2 | 12,2 | 88,7 | 2566 | 313 | 51,5 |
2882,1 | 6 | 41,9 | 143 | 12713 | 758 | 55,6 |
675 | 1,4 | 31,2 | 24,8 | 5172 | 70 | 67,1 |
1980,4 | 17,6 | 9,6 | 133,6 | 5420 | 956 | 43,2 |
2701,5 | 1,2 | 75,8 | 210,3 | 16416 | 191 | 37,6 |
1157,7 | 6,2 | 9,7 | 118,6 | 4875 | 301 | 45,6 |
1713,4 | 3 | 31,4 | 53,8 | 5594 | 169 | 54,4 |
2736,1 | 13,7 | 2 | 169,7 | 7065 | 966 | 52,4 |
1255,2 | 3,8 | 16,8 | 86,2 | 5120 | 195 | 29,7 |
2599,1 | 3,9 | 0 | 2686,1 | 1646 | 65 | 0 |
1816,9 | 7,2 | 30,2 | 82,8 | 4698 | 338 | 53,7 |
2118,3 | 9 | 27,6 | 117,2 | 7530 | 675 | 35,2 |
2961,7 | 7,9 | 116 | 96,3 | 4608 | 364 | 56 |
1919,6 | 37,3 | 0 | 0 | 648 | 242 | 69 |
1227,6 | 2,3 | 0 | 70,2 | 3764 | 87 | 100 |
401,1 | 4,5 | 0 | 60,8 | 1859 | 83 | 67,7 |
2428 | 5,9 | 18,5 | 216 | 5253 | 312 | 100 |
887,7 | 1,8 | 15,5 | 64 | 9582 | 169 | 0 |
1458,3 | 10,2 | 12,8 | 46 | 4420 | 451 | 66,9 |
1757,3 | 3,7 | 27,3 | 132,2 | 3587 | 134 | 76,1 |
2370,8 | 1,9 | 55,8 | 122,8 | 19823 | 367 | 32,8 |
1234,3 | 9 | 7,2 | 66,5 | 10042 | 903 | 54,1 |
Копируем данные из EXCEL в SPSS, вводим обозначения переменных.
Анализ→Регрессия→Линейно…→ добавляем в модель у (зависимая переменная) и х1…х6 (независимые переменные). Способ отбора (Назад) → ОК

^ )
Модель | Включенные переменные | Исключенные переменные | Метод |
1 | х6, х5, х2, х3, х4, х1(a) | . | Принудительное включение |
2 | . | х6 | Исключение (критерий: вероятность F-исключения >= ,100). |
3 | . | х4 | Исключение (критерий: вероятность F-исключения >= ,100). |
4 | . | х5 | Исключение (критерий: вероятность F-исключения >= ,100). |
5 | . | х3 | Исключение (критерий: вероятность F-исключения >= ,100). |
a Включены все запрошенные переменные
b Зависимая переменная: у
Табл. 2. Сводка для модели
Модель | R | R квадрат | Скорректированный R квадрат | Стд. ошибка оценки |
1 | ,841(a) | ,708 | ,628 | 1106,4800 |
2 | ,841(b) | ,708 | ,644 | 1082,1642 |
3 | ,841(c) | ,708 | ,659 | 1059,4393 |
4 | ,841(d) | ,708 | ,673 | 1038,1145 |
5 | ,828(e) | ,685 | ,661 | 1057,0376 |
a Предикторы: (константа) х6, х5, х2, х3, х4, х1
b Предикторы: (константа) х5, х2, х3, х4, х1
c Предикторы: (константа) х5, х2, х3, х1
d Предикторы: (константа) х2, х3, х1
e Предикторы: (константа) х2, х1
В основе формирования уравнения регрессии лежит метод пошагового удаления переменных. В выходной таблице 1 из исходного уравнения регрессии, состоящей из 6 переменных, постепенно на каждом последующем шаге исключали по одной переменной. В итоге получили пять моделей с различным набором переменных (также см. примечание табл. 2.)
Считается, что фактор (переменную) можно включать в уравнение множественной регрессии, если R2 возрастает с включением дополнительный переменной, которая дает не менее 3-5% полной дисперсии признака. По таблице 2 можно сказать, что в пятой модели первый и второй факторы объясняют 68,5% общей дисперсии результата, дополнительно включенный третий фактор дает прибавку 2,3% (можно его и не включать), включение дополнительных факторов не дает прибавки R2.
^ )
Модель | | Сумма квадратов | ст.св. | Средний квадрат | F | Знч. |
1 | Регрессия | 65234350,115 | 6 | 10872391,686 | 8,881 | ,000(a) |
| Остаток | 26934555,726 | 22 | 1224297,988 | | |
| Итого | 92168905,841 | 28 | | | |
2 | Регрессия | 65234082,983 | 5 | 13046816,597 | 11,141 | ,000(b) |
| Остаток | 26934822,859 | 23 | 1171079,255 | | |
| Итого | 92168905,841 | 28 | | | |
3 | Регрессия | 65231028,615 | 4 | 16307757,154 | 14,529 | ,000(c) |
| Остаток | 26937877,227 | 24 | 1122411,551 | | |
| Итого | 92168905,841 | 28 | | | |
4 | Регрессия | 65226860,502 | 3 | 21742286,834 | 20,175 | ,000(d) |
| Остаток | 26942045,339 | 25 | 1077681,814 | | |
| Итого | 92168905,841 | 28 | | | |
5 | Регрессия | 63118364,595 | 2 | 31559182,297 | 28,245 | ,000(e) |
| Остаток | 29050541,247 | 26 | 1117328,509 | | |
| Итого | 92168905,841 | 28 | | | |
a Предикторы: (константа) х6, х5, х2, х3, х4, х1
b Предикторы: (константа) х5, х2, х3, х4, х1
c Предикторы: (константа) х5, х2, х3, х1
d Предикторы: (константа) х2, х3, х1
e Предикторы: (константа) х2, х1
f Зависимая переменная: у
Таблица 3 показывает, что каждая модель регрессии является значимой.
^ )
Модель | | Нестандартизованные коэффициенты | Стандартизованные коэффициенты | t | Знч. | |
| B | Стд. ошибка | Бета | |||
1 | (Константа) | 1023,098 | 743,784 | | 1,376 | ,183 |
| х1 | 58,941 | 20,032 | ,573 | 2,942 | ,008 |
| х2 | 17,052 | 8,397 | ,371 | 2,031 | ,055 |
| х3 | ,573 | ,483 | ,153 | 1,187 | ,248 |
| х4 | ,004 | ,069 | ,009 | ,052 | ,959 |
| х5 | -,068 | ,897 | -,010 | -,076 | ,940 |
| х6 | ,126 | 8,520 | ,002 | ,015 | ,988 |
2 | (Константа) | 1031,320 | 482,516 | | 2,137 | ,043 |
| х1 | 58,938 | 19,591 | ,573 | 3,008 | ,006 |
| х2 | 17,069 | 8,138 | ,372 | 2,097 | ,047 |
| х3 | ,571 | ,436 | ,152 | 1,308 | ,204 |
| х4 | ,003 | ,065 | ,008 | ,051 | ,960 |
| х5 | -,067 | ,874 | -,010 | -,077 | ,940 |
3 | (Константа) | 1044,968 | 393,307 | | 2,657 | ,014 |
| х1 | 58,272 | 14,311 | ,567 | 4,072 | ,000 |
| х2 | 17,309 | 6,499 | ,377 | 2,663 | ,014 |
| х3 | ,569 | ,425 | ,152 | 1,337 | ,194 |
| х5 | -,046 | ,757 | -,007 | -,061 | ,952 |
4 | (Константа) | 1027,344 | 261,176 | | 3,934 | ,001 |
| х1 | 58,144 | 13,870 | ,566 | 4,192 | ,000 |
| х2 | 17,394 | 6,219 | ,379 | 2,797 | ,010 |
| х3 | ,573 | ,410 | ,153 | 1,399 | ,174 |
5 | (Константа) | 1164,605 | 246,452 | | 4,725 | ,000 |
| х1 | 57,419 | 14,113 | ,559 | 4,069 | ,000 |
| х2 | 16,628 | 6,308 | ,362 | 2,636 | ,014 |
a Зависимая переменная: у
Можно оценить значимость включенных в модель факторов. Так, например, только в последней модели все входящие в нее переменные значимы.
Таким образом, анализ выходных таблиц показывает, что их шести перечисленных в исходных данных факторов в модель множественной регрессии целесообразно включить численность работников на 100 га сельхозугодий и плотность поголовья, как факторы, на 68,5% объясняющих вариацию стоимости валовой продукции в расчете на 100 га сельхозугодий.
^
Имеются: данные по предприятиям области.
Требуется: провести факторный анализ.
Ход решения.
Построение корреляционно-регрессионной модели с включением всех переменных не представляется возможным, поскольку на каждый фактор приходится менее 5-ти наблюдений. К тому же некоторые факторы можно объединить, поскольку содержание их похоже. Применение факторного анализа позволит объединить переменные в отдельные гипотетические факторы. выделенные факторы должны отражать содержание исходных данных. Однако часто полученные факторы сложно интерпретировать. Поэтому целью анализа является нахождение таких факторов, которые легко интерпретируются по исходным признакам.
Анализ→ Обработка данных→Фактор…→Добавляем переменные

Кнопка «Описание…»

Кнопка «Извлечение…»

Кнопка «Вращение…»

Кнопка «Очки…»

Кнопка «Установки…»

ОК.
Табл. 1. Полная объясненная дисперсия
Компонента | Начальные собственные значения | Суммы квадратов нагрузок извлечения | Суммы квадратов нагрузок вращения | ||||||
| Всего | % дисперсии | Кумулятивный % | Всего | % дисперсии | Кумулятивный % | Всего | % дисперсии | Кумулятивный % |
1 | 1,911 | 31,855 | 31,855 | 1,911 | 31,855 | 31,855 | 1,583 | 26,386 | 26,386 |
2 | 1,426 | 23,763 | 55,618 | 1,426 | 23,763 | 55,618 | 1,429 | 23,811 | 50,197 |
3 | 1,095 | 18,249 | 73,867 | 1,095 | 18,249 | 73,867 | 1,420 | 23,671 | 73,867 |
4 | ,872 | 14,533 | 88,401 | | | | | | |
5 | ,538 | 8,963 | 97,364 | | | | | | |
6 | ,158 | 2,636 | 100,000 | | | | | | |
Метод выделения: Анализ главных компонент.
Таблица 1 позволяет судить о значении исходных факторов в объяснение общей дисперсии, а также удельном весе выделенных компонент в общей дисперсии (выделено желтым).
^ )
| Компонента | ||
1 | 2 | 3 | |
х1 | ,793 | ,247 | -,306 |
х2 | ,952 | ,005 | ,120 |
х3 | -,093 | -,761 | -,289 |
х4 | ,004 | -,160 | ,918 |
х5 | -,134 | ,358 | ,569 |
х6 | ,148 | ,797 | -,249 |
Метод выделения: Анализ методом главных компонент.
Метод вращения: Варимакс с нормализацией Кайзера.
a Вращение сошлось за 4 итераций.
По результатам матрицы повернутых компонент можно определить какие факторы входят в выделенные SPSS три компоненты. Определить можно по величине максимальных нагрузок. Так, в первую компоненту вошли х1 и х2 переменные, во вторую – х3 и х6, в третью – х4, х5.
Дальнейший анализ сводится к интерпретации получившихся компонент. Первую компоненту можно обозначить как показатель уровня интенсификации производства, вторую – показатель уровня развития растениеводства на предприятиях области, третью – показатель размеров предприятия.
Таким образом, мы получили множественную модель регрессии с тремя новыми факторами, с использованием которых не сложно получить уравнение регрессии и оценить его достоверность.
Скачать файл (620.7 kb.)