Logo GenDocs.ru

Поиск по сайту:  


Загрузка...

Лабораторная работа - Отбор факторов в SPSS - файл SPSS.doc


Лабораторная работа - Отбор факторов в SPSS
скачать (620.7 kb.)

Доступные файлы (6):

SPSS.doc503kb.05.05.2008 17:51скачать
SPSS_mine2.doc59kb.04.04.2010 17:31скачать
SPSS_mine.doc337kb.04.04.2010 17:32скачать
¦¦TА¦-TБ¦-¦-¦+¦-TА ¦¦TА¦-¦¦ 2004.xls1070kb.23.05.2008 03:00скачать
Вывод1.spo
Данные.sav

содержание
Загрузка...

SPSS.doc

Реклама MarketGid:
Загрузка...
Практическая работа

Отбор факторов для множественной регрессии с использованием SPSS.

Имеются: данные по 29 предприятиям области.

Требуется: составить уравнение регрессии, описывающее зависимость валовой продукции на 100 га сельскохозяйственных угодий (у) от системы факторов.

Ход решения (Пример).

Анализ проводится по предприятиям из вашего курсового проекта.

Комплекс факторов студент приводит свой, в зависимости от целей исследования, можно использовать как абсолютные показатели размера предприятия (производства), так и относительные показатели интенсификации и эффективности производства, эффективности использования ресурсов. Например:

Стоимость валовой продукции с.-х. в расчете на 100 га с.-х. угодий, тыс. руб.

Численность работников в расчете на 100 га с.-х. угодий, чел.

Плотность условного поголовья скота в расчете на 100 с.-х. угодий, гол.

Затраты на минеральные удобрения в расчете на 100 га посевной площади, тыс. руб.

Площадь сельскохозяйственных угодий, га

Среднегодовая численность работников, занятых в с.-х., чел.

Удельный вес затрат на продукцию растениеводства, %

1609,2

4,4

0

172,4

8045

356

70,8

1749,2

3,5

18,3

49,5

6229

215

69,5

913,6

2,5

7,2

57,6

5266

132

0

2259,1

18,6

8,8

76,1

3497

649

100

2615,1

1,8

61,4

194

9272

168

99,8

9925,4

93,9

181,2

23,2

156

146

86,5

6110,6

9,4

3

99,1

884

83

36,8

1411,1

12,2

12,2

88,7

2566

313

51,5

2882,1

6

41,9

143

12713

758

55,6

675

1,4

31,2

24,8

5172

70

67,1

1980,4

17,6

9,6

133,6

5420

956

43,2

2701,5

1,2

75,8

210,3

16416

191

37,6

1157,7

6,2

9,7

118,6

4875

301

45,6

1713,4

3

31,4

53,8

5594

169

54,4

2736,1

13,7

2

169,7

7065

966

52,4

1255,2

3,8

16,8

86,2

5120

195

29,7

2599,1

3,9

0

2686,1

1646

65

0

1816,9

7,2

30,2

82,8

4698

338

53,7

2118,3

9

27,6

117,2

7530

675

35,2

2961,7

7,9

116

96,3

4608

364

56

1919,6

37,3

0

0

648

242

69

1227,6

2,3

0

70,2

3764

87

100

401,1

4,5

0

60,8

1859

83

67,7

2428

5,9

18,5

216

5253

312

100

887,7

1,8

15,5

64

9582

169

0

1458,3

10,2

12,8

46

4420

451

66,9

1757,3

3,7

27,3

132,2

3587

134

76,1

2370,8

1,9

55,8

122,8

19823

367

32,8

1234,3

9

7,2

66,5

10042

903

54,1

Копируем данные из EXCEL в SPSS, вводим обозначения переменных.

Анализ→Регрессия→Линейно…→ добавляем в модель у (зависимая переменная) и х1…х6 (независимые переменные). Способ отбора (Назад) → ОК




^ Табл. 1. Включенные/исключенные переменные(b)


Модель

Включенные переменные

Исключенные переменные

Метод

1

х6, х5, х2, х3, х4, х1(a)

.

Принудительное включение

2

.

х6

Исключение (критерий: вероятность F-исключения >= ,100).

3

.

х4

Исключение (критерий: вероятность F-исключения >= ,100).

4

.

х5

Исключение (критерий: вероятность F-исключения >= ,100).

5

.

х3

Исключение (критерий: вероятность F-исключения >= ,100).

a Включены все запрошенные переменные

b Зависимая переменная: у


Табл. 2. Сводка для модели



Модель

R

R квадрат

Скорректированный R квадрат

Стд. ошибка оценки

1

,841(a)

,708

,628

1106,4800

2

,841(b)

,708

,644

1082,1642

3

,841(c)

,708

,659

1059,4393

4

,841(d)

,708

,673

1038,1145

5

,828(e)

,685

,661

1057,0376

a Предикторы: (константа) х6, х5, х2, х3, х4, х1

b Предикторы: (константа) х5, х2, х3, х4, х1

c Предикторы: (константа) х5, х2, х3, х1

d Предикторы: (константа) х2, х3, х1

e Предикторы: (константа) х2, х1


В основе формирования уравнения регрессии лежит метод пошагового удаления переменных. В выходной таблице 1 из исходного уравнения регрессии, состоящей из 6 переменных, постепенно на каждом последующем шаге исключали по одной переменной. В итоге получили пять моделей с различным набором переменных (также см. примечание табл. 2.)

Считается, что фактор (переменную) можно включать в уравнение множественной регрессии, если R2 возрастает с включением дополнительный переменной, которая дает не менее 3-5% полной дисперсии признака. По таблице 2 можно сказать, что в пятой модели первый и второй факторы объясняют 68,5% общей дисперсии результата, дополнительно включенный третий фактор дает прибавку 2,3% (можно его и не включать), включение дополнительных факторов не дает прибавки R2.


^ Табл. 3. Дисперсионный анализ(f)


Модель



Сумма квадратов

ст.св.

Средний квадрат

F

Знч.

1

Регрессия

65234350,115

6

10872391,686

8,881

,000(a)



Остаток

26934555,726

22

1224297,988







Итого

92168905,841

28







2

Регрессия

65234082,983

5

13046816,597

11,141

,000(b)



Остаток

26934822,859

23

1171079,255







Итого

92168905,841

28







3

Регрессия

65231028,615

4

16307757,154

14,529

,000(c)



Остаток

26937877,227

24

1122411,551







Итого

92168905,841

28







4

Регрессия

65226860,502

3

21742286,834

20,175

,000(d)



Остаток

26942045,339

25

1077681,814







Итого

92168905,841

28







5

Регрессия

63118364,595

2

31559182,297

28,245

,000(e)



Остаток

29050541,247

26

1117328,509







Итого

92168905,841

28







a Предикторы: (константа) х6, х5, х2, х3, х4, х1

b Предикторы: (константа) х5, х2, х3, х4, х1

c Предикторы: (константа) х5, х2, х3, х1

d Предикторы: (константа) х2, х3, х1

e Предикторы: (константа) х2, х1

f Зависимая переменная: у


Таблица 3 показывает, что каждая модель регрессии является значимой.


^ Табл. 4. Коэффициенты(a)


Модель



Нестандартизованные коэффициенты

Стандартизованные коэффициенты

t

Знч.



B

Стд. ошибка

Бета

1

(Константа)

1023,098

743,784



1,376

,183



х1

58,941

20,032

,573

2,942

,008



х2

17,052

8,397

,371

2,031

,055



х3

,573

,483

,153

1,187

,248



х4

,004

,069

,009

,052

,959



х5

-,068

,897

-,010

-,076

,940



х6

,126

8,520

,002

,015

,988

2

(Константа)

1031,320

482,516



2,137

,043



х1

58,938

19,591

,573

3,008

,006



х2

17,069

8,138

,372

2,097

,047



х3

,571

,436

,152

1,308

,204



х4

,003

,065

,008

,051

,960



х5

-,067

,874

-,010

-,077

,940

3

(Константа)

1044,968

393,307



2,657

,014



х1

58,272

14,311

,567

4,072

,000



х2

17,309

6,499

,377

2,663

,014



х3

,569

,425

,152

1,337

,194



х5

-,046

,757

-,007

-,061

,952

4

(Константа)

1027,344

261,176



3,934

,001



х1

58,144

13,870

,566

4,192

,000



х2

17,394

6,219

,379

2,797

,010



х3

,573

,410

,153

1,399

,174

5

(Константа)

1164,605

246,452



4,725

,000



х1

57,419

14,113

,559

4,069

,000



х2

16,628

6,308

,362

2,636

,014

a Зависимая переменная: у


Можно оценить значимость включенных в модель факторов. Так, например, только в последней модели все входящие в нее переменные значимы.

Таким образом, анализ выходных таблиц показывает, что их шести перечисленных в исходных данных факторов в модель множественной регрессии целесообразно включить численность работников на 100 га сельхозугодий и плотность поголовья, как факторы, на 68,5% объясняющих вариацию стоимости валовой продукции в расчете на 100 га сельхозугодий.


^ Факторный анализ методом главных компонент

Имеются: данные по предприятиям области.

Требуется: провести факторный анализ.

Ход решения.

Построение корреляционно-регрессионной модели с включением всех переменных не представляется возможным, поскольку на каждый фактор приходится менее 5-ти наблюдений. К тому же некоторые факторы можно объединить, поскольку содержание их похоже. Применение факторного анализа позволит объединить переменные в отдельные гипотетические факторы. выделенные факторы должны отражать содержание исходных данных. Однако часто полученные факторы сложно интерпретировать. Поэтому целью анализа является нахождение таких факторов, которые легко интерпретируются по исходным признакам.

Анализ→ Обработка данных→Фактор…→Добавляем переменные




Кнопка «Описание…»



Кнопка «Извлечение…»



Кнопка «Вращение…»



Кнопка «Очки…»



Кнопка «Установки…»



ОК.


Табл. 1. Полная объясненная дисперсия


Компонента

Начальные собственные значения

Суммы квадратов нагрузок извлечения

Суммы квадратов нагрузок вращения



Всего

% дисперсии

Кумулятивный %

Всего

% дисперсии

Кумулятивный %

Всего

% дисперсии

Кумулятивный %

1

1,911

31,855

31,855

1,911

31,855

31,855

1,583

26,386

26,386

2

1,426

23,763

55,618

1,426

23,763

55,618

1,429

23,811

50,197

3

1,095

18,249

73,867

1,095

18,249

73,867

1,420

23,671

73,867

4

,872

14,533

88,401














5

,538

8,963

97,364













6

,158

2,636

100,000













Метод выделения: Анализ главных компонент.


Таблица 1 позволяет судить о значении исходных факторов в объяснение общей дисперсии, а также удельном весе выделенных компонент в общей дисперсии (выделено желтым).

^ Табл. 2. Матрица повернутых компонент(a)




Компонента

1

2

3

х1

,793

,247

-,306

х2

,952

,005

,120

х3

-,093

-,761

-,289

х4

,004

-,160

,918

х5

-,134

,358

,569

х6

,148

,797

-,249

Метод выделения: Анализ методом главных компонент.

Метод вращения: Варимакс с нормализацией Кайзера.

a Вращение сошлось за 4 итераций.


По результатам матрицы повернутых компонент можно определить какие факторы входят в выделенные SPSS три компоненты. Определить можно по величине максимальных нагрузок. Так, в первую компоненту вошли х1 и х2 переменные, во вторую – х3 и х6, в третью – х4, х5.

Дальнейший анализ сводится к интерпретации получившихся компонент. Первую компоненту можно обозначить как показатель уровня интенсификации производства, вторую – показатель уровня развития растениеводства на предприятиях области, третью – показатель размеров предприятия.

Таким образом, мы получили множественную модель регрессии с тремя новыми факторами, с использованием которых не сложно получить уравнение регрессии и оценить его достоверность.


Скачать файл (620.7 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации
Рейтинг@Mail.ru