Основы математической статистики
скачать (302 kb.)
Доступные файлы (1):
1.doc | 302kb. | 08.12.2011 18:53 | ![]() |
содержание
- Смотрите также:
- Задачи по математической статистике (примеры решения) [ документ ]
- Ответы на экзаменационные вопросы [ документ ]
- Основные понятия, методы и приемы математической статистики [ документ ]
- Задачи по математической статистике (примеры решения 30 задач) [ документ ]
- Маталыцкий М.А., Русилко Т.В. Теория вероятностей в примерах и задачах [ документ ]
- Методика математического планирования эксперимента РМИМ 106-72 1973 [ документ ]
- Карташова Т.М. Лекции по математической статистике [ документ ]
- Загорюев А.Л. Основы статистической обработки результатов психодиагностических измерений [ документ ]
- Мятлев В.Д. Теория вероятностей и математическая статистика, математические модели [ документ ]
- История использования статистики в медицине [ реферат ]
- Основы технологии машиностроения [ документ ]
- Шпаргалка - Математическая статистика [ документ ]
1.doc
ПланВведение
Предмет математической статистики
Вариационный ряд и его характеристики
Выборочный метод и статистическое оценивание
Понятие о проверке статистических гипотез
Заключение
Список использованной литературы
Введение
Явления, происходящие в природе, в обществе, в человеке, очень сложны и разнообразны. Ученые изучают разные стороны этих явлений, причем каждая наука вырабатывает свои специфические методы исследования. Например, таким важным социальным явлением, как преступность, занимаются не только юристы, но и социологи, психологи, медики и иные специалисты. Есть тут серьезная работа и для математиков. Их задача состоит в том, чтобы подвергнуть математической статистике огромный статистический материал: отчеты органов внутренних дел и другие документы, содержащие различные числовые данные. Цель этой работы – выделить наиболее существенные сведения об интересующем нас явлении.
1. Предмет математической статистики
Термин статистика употребляется чаще всего для обозначения двух понятий. Во-первых, статистикой называют набор количественных данных о некотором явлении, совокупности объектов и т.п. Эти данные называют статистическими.
Во-вторых, термином статистика объединяют совокупность методов исследования, основанных на анализе статистических данных.
В каждой области деятельности разработаны свои специфические статистические методы. Существует много разных статистик: социально-экономическая, демографическая, медицинская, юридическая, звёздная и ряд других. Поскольку всякая статистика оперирует с числами, то основой всех статистических методов является математика. Совокупность математических методов обработки, систематизации, анализа и использования статистических данных составляет предмет специальной науки – математической статистики. Именно математические методы в силу их объективности позволяют получать наиболее значимые результаты при обработке статистических данных. Глубина и достоверность этих результатов зависит как от мощности применяемых математических методов, так и от правильности их применения. Разумеется, достоверность результатов зависит также от доброкачественнности статистического материала, который подвергается обработке.
Математическая статистика – раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления существующих закономерностей.
Математическая статистика тесно связана с теорией вероятностей. Обе эти математические дисциплины изучают массовые случайные явления. Связующим звеном между ними являются предельные теоремы теории вероятностей. При этом теория вероятностей выводит из математической модели свойства реального процесса, а математическая статистика устанавливает свойства математической модели, исходя из данных наблюдений (говорят "из статистических данных").
Предметом математической статистики является изучение случайных величин (или случайных событий, процессов) по результатам наблюдений. Полученные в результате наблюдения (опыта, эксперимента) данные сначала надо каким-либо образом обработать: упорядочить, представить в удобном для обозрения и анализа виде. Это первая задача.
Затем, это уже вторая задача, оценить, хотя бы приблизительно, интересующие нас характеристики наблюдаемой случайной величины. Например, дать оценку неизвестной вероятности события, оценку неизвестной функции распределения, оценку математического ожидания, оценку дисперсии случайной величины, оценку параметров распределения, вид которого неизвестен, и т.д.
Следующей, назовем ее условно третьей, задачей является проверка статистических гипотез, т.е. решение вопроса согласования результатов оценивания с опытными данными.
Одной из важнейших задач математической статистики является разработка методов, позволяющих по результатам обследования выборки делать обоснованные выводы о распределении признака изучаемых объектов по всей совокупности.
2. Вариационный ряд и его характеристики
Ряды распределения – это ряды абсолютных и относительных чисел, которые характеризуют распределение единиц совокупности по качественному (атрибутивному) или количественному признаку. Примером распределения совокупности по качественному признаку может быть распределение сотрудников милиции (офицеров) по специальному званию: полковников – 1, подполковников – 3, майоров – 8 … всего – 50 человек. Эта же совокупность может быть распределена по количественному признаку, скажем, по возрасту: моложе 20 лет – 2, 20-24 года – 18, 25-29 лет – 10 и т.д. В обоих примерах ряды распределения выражены в абсолютных числах. Последние в подобных случаях называются частотами ряда распределения. Они указывают, насколько части повторяется та или иная варианта (признак). Варианта "майор" имеет частоту 8, а варианта "20-24 года" – 18.
Если значения качественных или количественных признаков выражены в относительных числах (например, в процентах к общему числу), то эти значения именуются частостями. В этом случае наши примеры выглядят так: полковников – 2 %, подполковников – 6, майоров – 16 … всего 100 %; моложе 20 лет – 4 %, 20-24 года – 18, 25-29 лет – 10 … всего 100 %.
Ряды распределения в таблицах, как правило, имеют и частоты, и частости (табл. 1).
Таблица 1
Распределение сотрудников милиции по званию и возрасту
Звание | Абсолютное число | В % к итогу | Возраст, лет | Абсолютное число | В % к итогу |
Полковник | 1 | 2 | До 20 | 2 | 4 |
Подполковник | 3 | 6 | 20-24 | 18 | 36 |
Майор | 8 | 16 | 25-29 | 10 | 20 |
Капитан | 12 | 24 | 30-34 | 10 | 20 |
Ст. лейтенант | 15 | 30 | 35-39 | 5 | 10 |
Лейтенант | 10 | 20 | 40-49 | 3 | 6 |
Мл. лейтенант | 1 | 2 | 50 и старше | 2 | 4 |
Итого | 50 | 100 | Итого | 50 | 100 |
Ряды распределения, построенные по количественному признаку (возраст, стаж, сроки расследования или рассмотре

Вариация признаков может быть дискретной, или прерывной (20, 21, 22, 23, 24, 25 лет и т.д.), либо непрерывной (до 20 лет, 20-25, 25-30 лет и т.д.). При дискретной вариации величина количественного признака (варианты) может принимать вполне определенные значения, отличающиеся в нашем примере на 1 год (20,21,22 и т.д.). При непрерывной вариации величина количественного признака у единиц совокупности в определенном численном промежутке (интервале) может принимать любые значения, хоть сколько-нибудь отличающиеся друг от друга. Например, в интервале 20-25 лет возраст конкретных сотрудников может быть 20 лет и 2 дня, 21 год и 10 месяцев и т.д.
Вариационные ряды, построенные по дискретно варьирующим признакам, именуют дискретными вариационными рядами, а построенные по непрерывно варьирующим признакам (интервалам) – интервальными вариационными рядами. Вариационный ряд всегда состоит из двух основных граф (колонок) цифр.
В первой колонке указываются значения количественного признака в порядке возрастания. В нашем примере интервального вариационного ряда: до 20 лет, 20-24 года, 25-29 лет и т.д. При дискретной вариации 20, 21, 22, 23, 24, 25 лет. Эти значения количественного признака и называют вариантами. В статистической литературе этот термин иногда употребляется как существительное мужского рода (вариант, варианты), а иногда – как существительное женского рода (варианта, варианты).
Во второй колонке указываются числа единиц, которые свойственны той или иной варианте. Их называют частотами, если они выражены в абсолютных числах, т.е. сколько раз в изучаемой совокупности встречается та или иная варианта, или частостями, если они выражены в удельных весах или долях, т.е. в процентах или коэффициентах к итогу.
Интервальный вариационный ряд иногда строится с равными интервалами (20-24, 25-29 лет), а иногда с неравными (14-15, 16-18, 19-20, 21-25 лет) интервалами. В первом случае оба интервала равны 5 годам, а во втором случае – 2, 3, 5 годам. При построении интервального ряда с непрерывной вариацией верхняя граница каждого интервала обычно является нижней границей последующего (20-25, 25-30, 30-35 и т.д.), а в построении интервального ряда по дискретному признаку границы смежных интервалов не повторяются (1-5 дней, 6-10 дней, 11-15 дней и т.д.)
Статистический анализ вариационных рядов требует не только наличия единичных частот (частостей), но и накопленных частот (частостей). Накопленная частота для той или иной варианты представляет собой
сумму частот всех предшествующих вариант (интервалов). В нашем примере (табл. 1) для интервала 20-24 года накопленная частота будет равна:
2 + 18 = 20 человек, а накопленная частость 4 + 36 = 40 %, а для интервала 25-29 лет соответственно: 2 + 18 + 10 = 30 человек, или 4 + 36 + 20 = 60 %. Таким образом, от варианты к варианте (от интервала к интервалу) идет накопление (кумуляция) частот и частостей.
Вариационные ряды легко изображаются графически в виде полигона или гистограммы. Графическое изображение накопленных частот (частостей) воспроизводится в системе прямоугольных координат в виде кумуляты, или кумулятивной кривой. По оси ординат откладывается величина накопленных частот, а по оси абсцисс – возрастающие значения количественного признака. Накопленные частоты и кумулята – это интегральные показатели плотности распределения в вариационном ряду.
3. Выборочный метод и статистическое оценивание
Основной формой сбора криминологической и социально-правовой информации является статистическая отчетность правоохранительных и других юридических учреждений. Но их отчеты, отражая важнейшие показатели, ограничены по объему. Юридическая наука и практика систематически нуждаются в такой информации, которая бы адекватно отражала возникающие вопросы в меняющейся действительности. Поэтому по актуальным вопросам, которые не отражены в официальной отчетности, следует проводить специально организованные изучения, применяя такое несплошное наблюдение, которое дает относительно надежные и достоверные данные. Это достигается при выборочном наблюдении.
Методика выборочного наблюдения досконально разработана математической статистикой. Оно получило самое широкое признание и распространение в различных отраслях науки и практики как метод, во многих случаях замещающий сплошное изучение тех или иных явлений и процессов. Выборочный метод относительно прост, экономичен, оперативен, надежен и имеет вполне определимую точность.
Выборочные данные достаточно полно отражают особенности всей, или, как говорят статистики, генеральной, совокупности изучаемых явлений.
Теория выборочного наблюдения базируется на статистических закономерностях, которые формируются и обнаруживаются в массовых явлениях и процессах. Это свойство закономерностей получило название закона больших чисел. Математической основой закона больших чисел, да и статистической науки в целом, служит теория вероятностей.
Приведем экспериментальный пример распределения случайных величин, заимствованный из статистической литературы и приближенный к нашим проблемам.
Были взяты 10 пачек по 10 карточек, пронумерованных от 1 до 10. Каждую пачку тщательно перемешали. После этого из каждой пачки по жребию было извлечено по одной карточке. Сумма номеров вынутых карточек составила 52. Карточки были возвращены в свои пачки, которые вновь перемешивались. При втором извлечении сумма номеров вынутых карточек составила 46. Подобные операции были проделаны 30 раз. Полученные данные: 52, 46, 72 и т.д. (табл. 2).
Таблица 2
Индивидуальные суммы при 30 извлечениях
52 56 58 | 46 65 42 | 72 48 58 | 53 54 46 | 36 62 63 | 55 65 61 | 42 48 68 | 56 65 53 | 61 61 54 | 53 60 43 |
На втором этапе эксперимент усложнялся: было сделано не по одному извлечению карточек из каждой пачки, а последовательно по 10 извлечений 30 раз, или 30 выборок. Сделав 10 извлечений по одной карточке из каждой пачки (извлекалась одна карта, возвращалась в пачку, пачка перемешивалась, и т.д.), подсчитав общую сумму номеров вынутых карточек (526) и разделив на 10, получили среднюю сумму 52,6. Так повторили 30 раз (табл. 3).
Таблица 3
Средние суммы из 10 извлечений в 30 выборках
52,6 53,4 56,7 | 58,4 59,4 55,2 | 54,6 55,0 56,3 | 52,6 56,2 52,3 | 48,6 61,6 53,8 | 54,0 53,6 57,8 | 52,8 54,2 55,9 | 50,8 56,8 61,8 | 46,0 52,3 58,6 | 55,8 54,0 49,2 |
При проведении третьего этапа эксперимента в каждую из таких 30 случайных выборок входило уже по 40 извлечений. Среднее число из первых 40 извлечений составило 54,6, из вторых – 51,6 и т.д. (табл. 4).
Таблица 4
Средние суммы из 40 извлечений в 30 выборках
54,6 55,3 54,3 | 51,6 54,1 57,2 | 53,6 55,8 53,2 | 56,6 55,4 56,0 | 54,3 56,0 54,5 | 55,1 53,2 51,5 | 57,3 55,1 53,7 | 54,4 54,3 56,0 | 56,0 54,8 54,8 | 55,4 54,2 53,4 |
Полученные эмпирические вероятности сравнивались с теоретической вероятностью. Последняя в данном примере равна средней сумме номеров десяти карточек в пачке, которая представляет собой как бы среднюю в исходной совокупности. Она равняется:

Размах колебаний индивидуальных сумм (указанных в табл. 2) был самым большим и равнялся 36. Это не что иное, как разность между максимальной и минимальной суммой (они в таблицах выделены и подчеркнуты). В табл. 2 максимальная сумма равнялась 72, минимальная 36



При выборках, состоящих каждая из 10 извлечений (см. табл. 3), размах колебаний уменьшился более чем вдвое, до 15,8



В выборках, состоящих каждая из 40 извлечений, размах колебаний по сравнению с результатами первой части эксперимента уменьшился более чем в 6 раз, составив только 5,8



Р

Рис. 1
аспределение выборочных сумм отражено на графике рис. 1, на оси абсцисс которого отложены суммы выборки с указанием средней (55) в исходной совокупности, а на оси ординат – этапы эксперимента.
Результаты эксперимента показывают, что чем больше извлечений, тем их усредненные показатели плотнее группируются вокруг средней (теоретической вероятности) в исходной совокупности. То есть чем больше явлений изучено, тем надежнее полученные данные, тем точнее выявленные закономерности. Данный вывод – краеугольный камень всех статистических выборочных исследований.
Теоретические основы выборочного метода были бы неполными, если бы мы не коснулись законов распределения случайных величин, к которым подвел нас проведенный эксперимент.
Поскольку за внешними случайными явлениями стоят скрытые законы, то данные, характеризующие эти явления, должны распределяться определенным образом. Исходя из закона больших чисел, чем больше изученная совокупность случайных явлений, тем должно быть более упорядоченным распределение полученных данных. Обратимся к результатам различных этапов эксперимента. Из табл. 2-4 и рис. 1 видно, что на первом этапе эксперимента при 30 индивидуальных извлечениях числовые значения вынутых карточек, имея большое рассеяние, все же группировались вокруг средней суммы, равной 55. На втором этапе при 30 выборках по 10 извлечений эта тенденция стала более явной, а на третьем этапе при 30 выборках по 40 извлечений – очевидной.
Представим данные табл. 4 в виде вариационного ряда, ранжировав их от меньшего к большему по значению извлеченных карточек (табл. 5). Данные для простоты исчисления округлены до целых чисел.
Таблица 5
Усредненные суммы значений карточек (х) | Частоты извлечения карточек (f) | Произведения карточек (xf) |
51 52 53 54 55 56 57 | 1 2 3 8 8 5 3 | 51 104 159 432 440 280 171 |
| Сумма ![]() | Сумма ![]() |
Из табл. 5 видно, что с увеличением варьирующего признака (усредненной суммы значения карточек) частота извлечения этих сумм в

Рис. 2
начале увеличивается, а затем, после достижения максимального значения (

Гистограмма, или полигон распределения, представляет собой ломаную кривую, характеризующую фактическое распределение полученных данных. Она позволяет выявить лишь приближенную картину распределения всей (генеральной) совокупности. Чем больше выборочное изучение, тем в большей мере будут сглаживаться влияние случайных причин и явственнее будет проступать действительная закономерность распределения. В этом случае кривая распределения фактических данных будет приближаться к теоретической кривой распределения.
В

Рис. 3
математической статистике теоретическую кривую распределения обычно называют кривой Лапласа – Гаусса, или нормальным распределением (рис. 3).
Нормальное распределение в чистом виде при выборочных исследованиях в юридических или других социальных науках встречается нечасто. Тем не менее большинство распределений близки к нормальному. Фактическое распределение выборочных показателей отличается от теоретического, главным образом, нарушением симметрии, т.е. если в нормальном распределении частоты анализируемого признака убывают по обе стороны от вершины кривой равномерно, то в фактическом распределении вершина кривой может быть смещена влево или вправо от теоретической средней, быть крутой с одной стороны и пологой – с другой (см. рис. 2). Причина таких смещений – ошибки наблюдения и сбора данных.
Распределение показателей характеризуется размахом вариации и отклонением от средней.
Размах вариации (колебаний) – наиболее простой параметр измерения разброса значений варьирующего признака. Он исчисляется по формуле

Наиболее полная характеристика распределения раскрывается через значение отклонения всех вариант от средней или значение отклонения эмпирических вариант от теоретических. Причем важно не столько отклонение каждой варианты от средней, сколько среднее отклонение всех вариант от средней, или дисперсия (колеблемость, пестрота) изучаемого признака. Упрощенно мы ее тоже рассчитывали. На первом этапе эксперимента значение отклонения от среднего находилось в диапазоне от +17 до –19, на втором – от +6,8 до –9, на третьем – от +2,3 до –3,5.
Средние величины – наиболее распространенные показатели в статистике. Это объясняется тем, что только с помощью средней можно охарактеризовать совокупность по количественно варьирующему признаку.
Средняя величина может раскрыть лишь общую тенденцию изучаемого явления и только тогда, когда она выведена из большого числа фактов и при изучении однородной совокупности. При несоблюдении этих условий средние показатели лишь введут в заблуждение. Примером может служить средняя заработная плата в нашей стране, когда в одну совокупность зачисляют и богатых, и бедных, разрыв в уровне обеспечения которых в 1997 г., например, составил соответственно 24: 1.
В статистике разработано множество средних величин: степенные (средняя арифметическая, средняя гармоническая, средняя геометрическая и др.), мода и медиана. Каждая из средних выполняет свои аналитические функции. Для расчета дисперсии и других показателей выборочного наблюдения нам необходима лишь средняя арифметическая.
Средний арифметический показатель – наиболее распространенный вид средних. Он используется в качестве центрального значения в рядах распределения и выполняет функцию теоретической вероятности. Все другие варианты расцениваются как случайные отклонения от него. Чем больше отклоняется какое-либо значение признака от среднего арифметического, тем более случайным оно является.
Средняя арифметическая простая, известная из школьных учебников по математике, рассчитывается по формуле

где




При изучении больших совокупностей некоторые варианты имеют большие частоты повторения. Из табл. 5, например, видно, что варианта 52 повторяется дважды, 53 – трижды, 54 – восемь раз и т.д. В этом случае целесообразнее вначале каждую варианту умножить на частоту ее встречаемости, как это показано в графе (xf) упомянутой таблицы. Такое умножение в статистике называют взвешиванием. Средняя арифметическая в данном случае именуется взвешенной и рассчитывается по формуле

Средняя арифметическая лежит в основе расчета дисперсии (колеблемости), которая представляет собой не что иное, как значение отклонения всех вариант от средней. Значение дисперсии и предопределяет объем выборочной совокупности. Чем больше дисперсия, тем больше разброс показателей от средней, а, следовательно, нужен больший объем выборки, чтобы она была достаточно репрезентативной. Репрезентативность (представительность) объема выборки практически не зависит от объема генеральной совокупности.
Расчет дисперсии качественных и количественных признаков неодинаков. Определение объема и представительности выборочной совокупности, а, следовательно, и дисперсии производится применительно не к преступности, административной правонарушаемости или другим социально-правовым явлениям вообще, а лишь к их конкретным показателям. Последние могут быть качественными, или атрибутивными (вид преступления, содержание мотива, свойства личности и т.д.), и количественными (возраст правонарушителей, уровень образования, повторность совершения преступления, сроки рассмотрения гражданских дел и т.п.). Каждый признак имеет свою дисперсию, а, следовательно, и необходимый объем выборки для надежного изучения. Это значит, что при выборочном изучении многих признаков, чтобы выявить совокупные отклонения, дисперсию надо рассчитывать по каждому из них. Иногда эти признаки исчисляются десятками и даже сотнями. Чтобы избежать множества расчетов, можно ограничить их только в отношении тех признаков, на базе которых делаются основные выводы. Общая численность выборки или ее общая репрезентативность определяются по совокупной представительности всех параметров.
Дисперсия – это средний квадрат отклонения изучаемого признака от теоретического (среднего) показателя. Она характеризует уровень однородности исследуемой совокупности и обозначается символом

Колеблемость качественного признака двухвариантна: совершено преступление против собственности или иное, в состоянии опьянения правонарушителя или трезвым субъектом, по мотиву мести или иным побуждениям, лицом, воспитанным в неполной или полной семье, интровертом или экстравертом и т.д. Указанная двухвариантность отражается в таких относительных показателях, как удельный вес или доля признака в общей структуре изученных явлений, в данном случае преступлений, причин, лиц, мер.
Удельные веса многих качественных признаков могут быть взяты из официальной статистической отчетности правоохранительных и других юридических органов, которая основывается на сплошном текущем учете, из предыдущих исследований, достоверность результатов которых не вызывает сомнений, или других источников. Они могут быть специально получены на основе предварительного (пилотажного) изучения. Если удельный вес какого-то признака неизвестен и нет возможности получить его при предварительном изучении, то исследуемая совокупность по этому признаку условно принимается максимально неоднородной. В этом случае искомый удельный вес берется, равным 50% (или 0,5).
При наличии удельного веса качественного признака его дисперсия рассчитывается по следующей формуле:


Дисперсия количественного признака многовариантна. Она рассчитывается с применением средней арифметической взвешенной (ее расчет приводился выше) по формуле

где


Второй общепринятой мерой вариации признака является среднее квадратическое отклонение. Оно обозначается символом


Извлекая корень квадратный из дисперсии, получаем среднее квадратическое отклонение:


Среднее квадратическое отклонение всегда выражается в тех именованных числах, в которых выражены варианта и средняя.
Очертания симметричной кривой нормального распределения полностью определяются двумя показателями – средней арифметической (х) и средним квадратическим отклонением (


На рис. 4 средняя арифметическая







Рис. 6
Следующее свойство среднего квадратического отклонения позволяет правильно оценить надежность выборочных показателей. Если площадь, ограниченную кривой нормального распределения, принять за 1 или 100 %, то площадь, заключенная в пределах 1



Площадь, заключенная в пределах 2




При проведении выборочных исследований параметры


4. Понятие о проверке статистических гипотез
Одна из часто встречающихся на практике задач, связанных с применением статистических методов, состоит в решении вопроса о том, должно ли на основании данной выборки быть принято или, напротив, отвергнуто некоторое предположение (гипотеза) относительно генеральной совокупности (случайной величины).
Процедура сопоставления высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотез.
Задачи статистической проверки гипотез ставятся в следующем
виде: относительно некоторой генеральной совокупности высказывается та или иная гипотеза Н. Из этой генеральной совокупности извлекается выборка. Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонить гипотезу Н или принять ее.
Следует отметить, что статистическими методами гипотезу можно только опровергнуть или не опровергнуть, но не доказать. Например, для проверки утверждения (гипотеза Н) автора, что "в рукописи нет ошибок", рецензент прочел (изучил) несколько страниц рукописи.
Если он обнаружил хотя бы одну ошибку, то гипотеза Н отвергается, в противном случае – не отвергается, говорят, что "результат проверки с гипотезой согласуется".
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки.
Под статистической гипотезой (или просто гипотезой) понимают всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.
Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (это так называемые параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).
Одну из гипотез выделяют в качестве основной (или нулевой) и обозначают




Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой (в ней идет речь об одном значении параметра), в противном случае – сложной.
Имея две гипотезы





Правило, по которому принимается решение принять или отклонить гипотезу



Проверку гипотез осуществляют на основании результатов выборки


Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия










При проверке гипотезы может быть принято неправильное решение, т.е. могут быть допущены ошибки двух родов.
Ошибка первого рода состоит в том, что отвергается нулевая гипотеза

Ошибка второго рода состоит в том, что отвергается альтернативная гипотеза

Вероятность ошибки 1-го рода (обозначается через

Очевидно,


В одних случаях считается возможным пренебречь событиями, вероятность которых меньше 0,05 (

Обычно для


Вероятность ошибки 2-го рода обозначается через


Величину



Очевидно,

Чем больше мощность критерия, тем вероятность ошибки 2-го рода меньше, что, конечно, желательно (как и уменьшение

Последствия ошибок 1-го, 2-го рода могут быть совершенно различными: в одних случаях надо минимизировать


Отметим, что одновременное уменьшение ошибок 1-го и 2-го рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимости


Методика проверки гипотез сводится к следующему:
Располагая выборкой, формируют нулевую гипотезу
и альтернативную
.
В каждом конкретном случае подбирают статистику критерия.
По статистике критерияи уровню значимости
определяют критическую область S (и
). Для ее отыскания достаточно найти критическую точку
, т.е. границу (или квантиль), отделяющую область S от
.
Границы областей определяются, соответственно, из соотношений:



Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую приведенным выше соотношениям.
Для полученной реализации выборкиподсчитывают значение критерия, т.е.
.
Если(например,
для правосторонней области S), то нулевую гипотезу
отвергают; если же
(
), то нет оснований, чтобы отвергнуть гипотезу
.
Заключение
При изучении причин преступности, отдельных преступлений, административных правонарушений и других нарушений действующего законодательства очевидно, что они, как правило, обусловлены совокупностью взаимосвязанных явлений и что связь между ними и изучаемыми нарушениями не однозначна, а многозначна, не фатальна, а вероятностна. Она улавливается лишь при изучении большого числа нарушений и отражается в форме статистических устойчивостей, тенденций или закономерностей, которые формируются и обнаруживаются в массовых явлениях и процессах, с чем имеет дело юридическая статистика.
Свойство статистических закономерностей формироваться и отчетливо отражаться лишь в массовом процессе и при достаточно большом числе единиц совокупности получило название закона больших чисел. Структура и динамика преступности, ее причины, мотивы преступного поведения, эффективность уголовно-правовых мер, результаты деятельности судов, прокуратуры, милиции и тому подобное могут быть правильно установлены и поняты лишь на основе закона больших чисел целого ряда показателей.
Математической основой закона больших чисел служит теория вероятностей. Она представляет собой раздел математики, изучающий закономерности, возникающие при взаимодействии большого числа случайных явлений.
Вероятность (частость) может быть теоретической и эмпирической. Теоретическая, или математическая, вероятность представляет собой отношение количества шансов, способствующих появлению изучаемого события, к количеству всех шансов. Отношение числа фактически наступивших явлений к общему числу возможных называется частостью или опытной (эмпирической) вероятностью.
Список использованной литературы
Лунев В.В. Юридическая статистика. – М.: Юристъ, 2007.
Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. – М.: Айрис-пресс, 2004.
Роганов Е.А., Тихомиров Н.Б., Шелехов А.М. Математика и информатика для юристов. – М.: МГИУ, 2005.
Скачать файл (302 kb.)