Проверка статистических гипотез - Основы научных исследований

Для проверки статистических гипотез используются статистики, называемые статистическими критериями или иначе - критериями значимости. В частности, для проверки гипотез о математическом ожидании применяется критерий Стьюдента, о дисперсии - критерий ч2, а для сравнения дисперсий - критерий Фишера.

Идею проверки рассмотрим на примере. Пусть требуется проверить гипотезу:

Н0: м(х) = 0

Н1: м(х) > 0

По выборочным данным. Это еще не опровергает Н0, т. к. выборочное значение статистики является всего лишь одним из возможных значений случайной величины, порождаемой различными выборками. Возникает вопрос: насколько сильно должно отличаться от, чтобы можно было принять Н1(и т. о. отбросить Н0)?

Поскольку речь идет о выборочном среднем, то при рассмотрении этого вопроса нужно использовать распределение Стьюдента.

Зная объем выборки N, следовательно ЧСС, можно построить распределение Стьюдента для данного Н (рис.11.1):

критическая область t-распределения

Рисунок 11.1 Критическая область t-распределения

При этом следует помнить, что t-распределение справедливо только при нормальном распределении случайной величины Х, выборки из генеральной совокупности которой образовали это распределение.

По распределению можно судить о том, какова вероятность того, что значение среднего будет иметь ту или иную величину. Для этого следует вычислить теоретическое значение T-критерия

.

Затем можно вычислить вероятность того, что случайная величина может принять значение, большее

.

Если эта вероятность больше некоторого достаточно малого числа Q, называемого уровнем значимости, то есть основания сомневаться в справедливости нулевой гипотезы.

На практике решается обратная задача: по заданной доверительной вероятности Р определяется то теоретическое значение, за пределы которого с заданной вероятностью не может выйти любой выборки. Теоретические значения t-критерия при заданных Н и Р затабулированы и поэтому называются табличными. Затем вычисляется эмпирическое значение T-критерия по выборочным данным

=.

Оно сравнивается с табличным значением, делящим T-распределение на две области: область принятия Н0 (если < ) и критическую область (если > ). Если < , то принимается Н0.

Критическая область состоит из всех тех значений статистики, при которых принимается решение отвергнуть Н0 как ложную. Поскольку такие решения базируются на статистиках, найденных по выборкам ограниченного объема, то всегда есть вероятность совершить ошибку одного из следующих типов:

Проверяемая гипотеза

Объективно верна

Объективно неверна

Н0 принимается

Правильное решение

Ошибка ІІ-го рода

Н0 Отвергается

Ошибка І-го рода

Правильное решение

Вероятность совершить ошибку первого рода называется уровнем значимости критерия q.

Вероятность совершить ошибку ІІ-го рода обозначается В. Она зависит от мощности критерия, представляющей вероятность отбрасывания неверной гипотезы и равной 1-В. При построении статистических критериев стараются минимизировать суммарную ошибку обоих родов. При любом постоянном объеме выборки вероятность ошибки І-го рода можно уменьшить, уменьшая уровень значимости Q. Однако при этом растет вероятность допустить ошибку ІІ-го рода, т. е. падает мощность критерия. Единственный выход из этой противоречивой ситуации, позволяющий одновременно уменьшить Q и В - увеличить N.

Выбор уровня значимости Q при проверке гипотез производится из тех же соображений, что и выбор доверительной вероятности Р при интервальном оценивании, т. к. Q = 1. Поэтому Q: 0,1(10%); 0,05, (5%); 0,01(1%) и т. д.

Вид критической области полностью зависит от вида Н1. Если Н0: = m0 противостоит Н1: ? m0, то критерий для проверки Н0 Будет двухсторонним. Его критическая область состоит из двух частей. Например, для t-критерия (рис.11.2):

Рисунок 11.2 Двухсторонняя критическая область

Границы критической области обычно выбирают так, чтобы вероятность попадания в левую и правую части были одинаковыми и равными Q/2. Поэтому уровень значимости уменьшается вдвое.

Если же Н0: = m0 противостоит Н1: > m0 (или Н1: < m0), то соответствующий критерий для проверки будет односторонним и его критическая область будет состоять из одной части (рис.11.1).

Двухсторонний критерий всегда имеет меньшую мощность, чем односторонний. Поэтому нужно всегда, если есть такая возможность, отдавать предпочтение односторонним критериям.

Похожие статьи




Проверка статистических гипотез - Основы научных исследований

Предыдущая | Следующая