Logo GenDocs.ru

Поиск по сайту:  

Загрузка...

Конспект лекция профессора ОГУ по статистике [doc] - файл Лекция 10_Статистическое изучение структуры.doc


Конспект лекция профессора ОГУ по статистике [doc]
скачать (1097.7 kb.)

Доступные файлы (11):

Лекция 10_Статистическое изучение структуры.doc605kb.26.06.2009 19:58скачать
Лекция 11 Статистические методы прогнозиования.doc166kb.26.06.2009 19:58скачать
Лекция 1_Предмет и метод.doc250kb.26.06.2009 19:54скачать
Лекция 2_Теория статистического наблюдения.doc97kb.26.06.2009 19:54скачать
Лекция 3_СводкаГруппировка.doc142kb.26.06.2009 19:56скачать
Лекция 4_АбсолютныеОтноситСредние.doc706kb.26.06.2009 19:56скачать
Лекция 5_Вариация.doc347kb.26.06.2009 19:56скачать
Лекция 6_Корреляция.doc1095kb.26.06.2009 19:57скачать
Лекция 7_Анализ временных рядов.doc587kb.26.06.2009 19:57скачать
Лекция 8_ВыборочноеНаблюдени.doc800kb.26.06.2009 19:57скачать
Лекция 9_Индексы.doc377kb.26.06.2009 19:58скачать

содержание

Лекция 10_Статистическое изучение структуры.doc

Статистическое изучение структуры совокупности и ее изменений

  1. Понятие структуры явления и ее виды

  2. Графический сравнительный анализ структуры

  3. Показатели структурных сдвигов и различий

  4. Непараметрические методы анализа структуры

  5. Изучение интенсивности изменения структуры с помощью индексов


Понятие структуры явления и ее виды

Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов этой системы, но также и в изменении ее структуры.

Понятие структуры очень тесно переплетается с понятием группировка и классификация.

Структура это строение, форма организации системы, состоящей из отдельных элементов и связей между ними.



^ Иерархической (древовидной) структурой называется сложная структура, образуемая при последовательном дроб­лении системы на все более однородные группы элементов. Она состоит из нескольких уровней («шагов» дробления).



Основное преимущество иерархической структуры заключается в ее большой информационной емкости (класс, подкласс, группа, подгруппа, вид, (разновидности), традиционности и привычности применения, хорошей приспособленности для различной обработки информации, а также возможности для создания при кодировании объектов классификации кодов, несущих смысловую нагрузку.

Недостатком является слабая гибкость ее структуры и заранее установленный порядок ступеней распределения, не допускающий включения при отсутствии резервной емкости новых объектов классификационных группировок и признаков. Вследствие этого изменение хотя бы одного признака ведет к перераспределению многих классификационных группировок.

Иерархическая структура характеризуется не только доля­ми объема признака, но и дополнительными показателями.

1. Характеристикой степени сложности структуры, а именно числом уровней дробления («порядок» структуры).

2. Средним порядком структуры, т.е. средним номером уровня, взвешенным по долям объема признака, дробление которых завершилось на данном уровне. Эта величина характеризует среднее число дроблений объ­ема признака.

3. Общим числом конечных (т.е. не дробящихся далее) вет­вей структуры.

4. Средним числом конечных ветвей, приходящихся на один уровень.
Баланс (фр. balance — буквально весы, равновесие) — это особая форма сопоставления структуры одной и той же вели­чины признака, характеризуемой с двух разных сторон или в двух различных аспектах.

В наиболее общей форме динамический баланс со­стоит из четырех составляющих: запас на начало периода, приход за период, расход за период, запас на конец периода.

Запас на начало + приход = расход + запас на конец периода.

Для аналитических целей каждая из четырех составляющих делится по различным классификационным признакам на части, группы или подгруппы.
Если общий объем признака подразделен по одному группировочному признаку, а затем каждый групповой и общий объемы снова подразделены по другому группировочному признаку, то образуется многомерная, в простейшем случае — двухмерная структура с пересекающимися признаками.

Двухмерная пересекающаяся структура позволяет рассчитать пять видов структурных показателей (долей). При трех пересекающихся признаках группировки число разных видов структур достигает 19. В общем виде при n взаимопересекающихся признаках структура содержит (n3 - n2 + 1) ви­дов долей.
Фасетный метод классификации - это метод, при котором заданное множество делится на группировки независимо, по различным признакам. Она не имеет жесткой структуры и заранее построенных конечных группировок. При ней множество объектов, характеризующихся некоторым набором одинаковых для всех объектов признаков (фасет), может делиться многократно и независимо. В классификаторах фасеты чаще всего располагаются в виде простого перечисления и имеют код.

Основное преимущество фасетной классификации - гибкость структуры ее построения, так как изменения в любом из фасетов не оказывает влияния на остальные. Фасетный метод классификации позволяет не только образовывать новые классификационные группировки из имеющихся фасетов, но и включать в классификатор без переделки новые и исключать старые фасеты.

Недостатком фасетной классификации следует считать недостаточно полное использование емкости вследствие отсутствия практически лишних из возможных сочетаний фасетов, непривычность применения, а также сложность использования этого метода для ручной обработки информации.
Для цели анализа структуры, а также сравнения двух (или более) структур в динамике используется большое количество статистических методов и подходов которые можно представить в виде следующей схемы:


^ Графический сравнительный анализ структуры

В социально-экономических исследованиях часто возникает ситуации, в которых необходимо анализировать структуры явлений или процессов за ряд периодов. Одним из способов анализа в данном случае является рассмотрение структурных диаграмм.

Самой распространенной структурной диаграммой является секторная или круговая



Рисунок - Состав и структура безработных по образованию в 2003г., %

Данный вид диаграмм удобнее всего использовать при иллюстрации структуры явления за один, два или три периода, но на практике может возникнуть ситуация когда необходимо сравнивать структуру за 5 и более периодов. В данном случае необходимо использовать кольцевую диаграмму.



Рисунок - Состав и структура безработных по образованию в 1992г. и 2003г., %

Данный вид структурной диаграммы рекомендуется использовать если необходимо проиллюстрировать данные за 2-3 периода, если периодов более 3 то необходимо использовать особый вид столбиковых диаграмм – нормированную гистограмму.



Рисунок - Состав и структура безработных по образованию в 1992г., 1998г., 2002-2003гг., %
^ Показатели структурных сдвигов и различий

Для оценки изменения структуры совокупности во времени и определения в структурах отдельных групп применяют показатели струк­турных различий и сдвигов. Простейшими показателями структурных различий являются [стр 37, Тимофеева]:

Линейный коэффициент структурных различий (сдвигов) или индекс Рэ:



где d1, dо - структура отчетного и базисного периодов, %

п – количество строк.

Показывает насколько в среднем структура отчетного периода не соответствует структуре базисного периода. В качестве недостатка показателя можно назвать тот факт, что его величина зависит от n. Если n мало, то индекс принимает маленькие значения и наоборот.

Квадратический коэффициент структурных сдвигов:



0  d  100 или 0   100 (если данные измерены в %).

Чем ближе значение показателей к 0, тем меньше различия в струк­турах изучаемых совокупностей; либо тем меньше изменения, произо­шедшие в структуре совокупности в динамике.

Линейный и квадратический коэффициенты применяются в основ­ном для изучения динамики показателей структуры, т.к. наглядно по­зволяют сделать выводы об интенсивности изменения структур в те или иные промежутки времени.

^ Индекс Гатева (Gatev index) различает структуры с равными суммами квадратов от­клонений.



Индекс Рябцева (Ryabtsev index) незначительно отличается от индекса Гатева, принимает более низ­кие значения:



^ Индекс Салаи (Szalai index) был введен при исследовании различий в структуре ис­пользования бюджета времени у различных групп населения:



Индекс Салаи отличается от всех рассмотренных выше индексов дан­ной группы. Он принимает близкие к единице значения, когда в сумме большое ко­личество единиц.

Приведенные индексы принимает значения в интервале от 0 до 1. Если тот или иной индекс равен нулю, то наблюдается полное сходство структур, если единице –полное различие. Если более 0,5, то различия структуры отчетного и текущего периодов считаются существенными.
^ Непараметрические методы анализа структуры

Наряду с рассмотренным показателем для учета различия (подобия) структур возможно использование показателей корреляции. Но как правило воспользоваться обычными мерами измерения взаимосвязей (коэффициент корреляции Пирсона) невозможно, так как их применение предъявляет к анализируемым данным требование о нормальности. Выходом из положения является применение к имеющимся данным непараметрических методов, не предъявляющих требования о нормальности и большого числа единиц совокупности. В качестве непараметрических мер корреляции можно назвать коэффициент Спирмена, Гамма коэффициент, коэффициент Кендала-Тау и другие.

^ Коэффициент корреляции рангов Спирмена носит имя английского психолога разработавшего данный коэффициент Ч.Спирмена (1863-1945).

Вначале определяют величину:



Далее определяют само значение коэффициента по формуле:



Приведенная формула пригодна в случае отсутствия объединенных ран­гов. Для распространения этой формулы на случай присутствия объ­единенных рангов необходимо определить для каждой ранжировки величину:



где т - число групп совпадающих рангов, nk — число совпадающих рангов в k-ой группе (при отсутствии объединенных рангов m=n, n1=n2=...=nn=1 и соответственно Т = 0).

С учетом последнего замечания ранговый коэффициент Спирмена между ранжировками Rx и Ry вычисляется по формуле:



Если ТX и ТY являются небольшими относительно 1/6(n3-n), то можно воспользоваться приближенным значением:



Коэффициент корреляции Спирмена может принимать значения в интервале от -1 до +1. Чем ближе данный показатель приближается к единице, тем более непохожи структуры отчетного и базисного периода.

Значимость  оценивается с помощью t-статистики.



имеющей нормальное распределение при достаточно большом n (n 10).

Нулевая гипотеза H0 состоит в том, что прямой корреляционной связи между структурой отчетного и базисного периодов не наблюдается. Следова­тельно, можно применить односторонний критерий при n-2 степенях свободы.

^ Коэффициент Кендэла. Для расчета данного коэффициента необходимо значения рангов Rx расположить в порядке возрастания. В соответствии с этим порядком располагаются и ранги Ry. Затем рассчитываются величины Р и Т.

Если для каждого ранга Ry определить число следующих за ним значений рангов, превышающих его величину, то сумму таких превышений обозначают через Р.

Если для каждого ранга Ry определить число предшествующих ему значений рангов, превышающих его величину, то сумму таких пре­вышений обозначают через Т. Далее определяем величину S = Р - Т.

Коэффициент Кепдэла рассчитывается по формуле:



При достаточно больших п значения  и  приблизительно связаны следующим соотношением,  = 1,5.

При наличии объединенных рангов коэффициент Кендэла опре­деляется по формуле:



где U - поправочные коэффициенты, который вычисляются по формуле:



где m - число групп совпадающих рангов, nk - число совпадающих рангов в k-ой группе (при отсутствии объединенных рангов m=n, n1=n2=...=nn=1 и соответственно U = 0)

Значимость коэффициента  оценивается с помощью u-статистики:



имеющей нормальное распределение при достаточно большом n (n 10).

Нулевая гипотеза H0 состоит в том, что прямой корреляционной связи между структурой отчетного и базисного периодов не наблюдается. Следова­тельно, можно применить односторонний критерий при n-2 степенях свободы.

Подсчет чисел Р и Т

• для RY = 1 число рангов RY, предшествующих 1 и больше, рав­но 0, а последующих за 1 и больше, равно 9,

• для RY = 2 число рангов RY, предшествующих 2 и больше, равно 0, а последующих за 2 и больше, равно 8;

• для RY = 7 число рангов RY, предшествующих 7 и больше, равно 0, а последующих за 7 и больше, равно 3;

• для RY = 5,5 число рангов RY, предшествующих 5,5 и больше, равно 1 (со знаком «-») (это RY = 7), а число рангов RY, последую­щих за 5,5 и больше, равно 3 и т. д.

RX

RY

Р

Т

Итого

1

1

9

0

9

2

2

8

0

8

3

7

3

0

3

4

5

4

-1

3

5

3

5

-2

3

6

4

4

-2

2

7

6

3

-1

2

8

9

1

0

1

9

8

1

-1

0

10

10

0

0

0

Итого

К

37

-7

S = 31

Из таблицы следует, что коэффициент Кендэла равен 231/109 = 0,689
^ Изучение интенсивности изменения структуры с помощью индексов

Специфической задачей индексного анализа является оценка влияния структурных сдвигов на изменение общих объемов явлений и средних уровней качественных показателей.

Вариант №1. Вначале индекс общего объема явления раскладывается:

Iобщего объема = Iобъема и структурыIкачественного показателя



Далее раскладывается индекс объема и структуры:

Iобъема и структуры = Iобъема Iструктуры



Конечный вид разложения индекса общего объема следующий:

Iобщего объема = Iобъема Iструктуры Iкачественного показателя

^ Вариант №2. На первом этапе индекс общего объема явления рассматривается как произведение индексов объема совокупности и среднего уровня качественного показателя:

Iобъема и структуры = Iобъема Iсреднего уровня качественного показателя



Поскольку уровень средней величины формируется под влиянием размера признака отдельных единиц структуры совокупности, на изменение среднего значения показателя оказывает влияние как изменение величины признака по отдельным единицам, так и изменение структуры совокупности. Соответственно на втором этапе индекс среднего уровня раскладывается на индекс размера признака и индекс структуры:

Iсреднего уровня качественного показателя = Iкачественного показателя Iструктуры



В конечном итоге индекс общего объема раскладываться по схеме:

Iобщего объема = IобъемаIкачественного показателя  Iструктуры


Скачать файл (1097.7 kb.)

Поиск по сайту:  

© gendocs.ru
При копировании укажите ссылку.
обратиться к администрации