Критерии согласия - Измерения параметров сигнала

В предыдущих случаях при синтезе алгоритмов оценок параметров, алгоритмов обнаружения или различения сигналов предполагалось наличие априорной информации относительно распределения сигналов или помех. Однако в большинстве практических ситуаций при выполнении перечисленных операций плотность вероятности неизвестна. Можно лишь делать разного рода предположения. В такой ситуации необходимо, располагая выборочными значениями, сделать статистический вывод относительно вида функции распределения, из которого извлечена выборка. Представляет интерес ввести количественную меру соответствия гипотетического и эмпирического распределений, или, как говорят, критерий согласия. Этот критерий представляет число, которое является функционалом от эмпирического и гипотетического F1 распределений.

Сформулированная задача решается в следующей последовательности. По выборочным значениям X строится эмпирическая функция распределения по формуле, где - единичный скачок. На основании этого эмпирического распределения, но, может быть, и из других соображений, выдвигается гипотеза о том, что выборка извлечена их совокупности с распределением F1(X). По принятому заранее критерию согласия необходимо вычислить и вероятность того, что указанная величина превосходит некоторое пороговое значение. Для этого необходимо знать распределение величины. Определить такое распределение в простой форме удается, как правило, лишь при больших размерах выборки (точнее, определить лишь асимптотическое распределение при ). Если распределение величины известно, то, задаваясь вероятностью (уровнем значимости критерия) того, что, находим пороговое значение. При достаточно малом получаем приемлемое для практики правило проверки гипотезы об истинности гипотетического распределения F1(X): если для данной выборки, то гипотеза отвергается, в противоположном случае - принимается. При этом вероятность отвергнуть правильную гипотезу будет равна уровню значимости.

Отметим, что распределение величины, определяемое при условии, что выборочные значения X, по которым построена, извлечены из совокупности с распределением F1, зависит от F1. Было бы желательно иметь такие критерии согласия, распределения которых не зависели бы от вида F1. Такие критерии называются непараметрическими. Ниже рассмотрим критерии, которые при являются непараметрическими (асимптотически).

Следует также иметь в виду, что такие критерии согласия дают при достаточно малом достаточно эффективное решающее правило, позволяющее отвергнуть неверную гипотезу. При этом, однако, остается неизвестной вероятность ошибок второго рода - принятие неверной гипотезы. Если для данной выборки, то, хотя принятое правило предписывает утверждать истинность выдвинутой гипотезы, следует к такому утверждению отнестись более осторожно, так как с учетом заданного критерия согласия нет оснований считать, что выборка X не согласуется с гипотетическим распределением.

Недостатком критериев согласия является произвольность выбора самого критерия и уровня значимости, а также трудности, связанные с определением их распределений для малых N. Другой путь состоит в непосредственном построении неизвестной функции F1 по выборочным значениям без выдвижения гипотезы о виде этой функции.

5.1. Критерий - Пирсона. Этот критерий является одним из самых распространенных в приложениях к теории статистических оценок.

Разобьем область, где определена гипотетическая функция распределения F1(X) случайной величины X, на конечное число неперекрывающихся интервалов. Обозначим вероятность попадания единичного измерения в I-й интервал. Пусть в выборке X число выборочных значений, попадающих в интервал, равно. Ясно, что

.

Используем в качестве критерия согласия величину

.

Как доказал Пирсон, если проверяемая гипотеза об истинности распределения F1(X) верна, то при распределение асимптотически приближается к - распределению с степенями свободы, Не зависящему от вида гипотетического распределения F1(X).

Итак, пусть - процентное отклонение случайной величины, имеющей - распределение с степенями свободы, т. е. . При достаточно малом и большом N величина, вычисленная согласно критерию - Пирсона, практически никогда не будет превосходить порогового значения, если только гипотеза о виде распределения верна. Таким образом, выбирается следующее правило проверки гипотезы: гипотеза отклоняется, если, и принимается, если. Вероятность отклонить верную гипотезу равна.

5.2. Критерий Колмогорова. Согласно этому критерию количественной мерой соответствия служит для заданного размера n выборки максимум по всем значениям x модуля отклонения эмпирического распределения от гипотетического, т. е. . Как доказал А. Н. Кол-могоров, если проверяемая гипотеза истинности F1(x) верна, то при и дополнительном предположении непрерывности F1(x) функция распределения величины асимптотически приближается к

.

Если - заданный уровень значимости, то можно записать после некоторых преобразований:

.

Этот ряд быстро сходится и в качестве первого приближения можно ограничиться только первым его членом, т. е.

или

Следовательно, правило проверки гипотезы таково: если для наблюдаемой выборки, то гипотеза о том, что выборка извлечена из совокупности, имеющей гипотетическое распределение, отвергается; если имеет место противоположное неравенство, то гипотеза принимается. Таблицы значений функции приведены в [1]. Как и критерий - Пирсона, критерий Колмогорова используется при очень больших размерах N выборки. Однако при использовании этого критерия нет необходимости в предварительном распределении выборочных значений на интервалы и группировании, как это делается при использовании критерия - Пирсона.

5.3. Критерий Мизеса. Согласно этому критерию количественной мерой соответствия гипотетического и эмпирического распределений для заданного размера n выборки служит среднее значение квадрата отклонения указанных распределений

,

Где - гипотетическая плотность вероятности случайной величины X. Представив выражение для через сумму ступенчатых функций с весом, зависящим от N, и интегрируя полученное выражение, придем к следующей формуле:

Математическое ожидание такой случайной величины есть, второй центральный момент имеет вид. Выражение для точного распределения величины очень сложное, но при оно близко к предыдущему. Как и критерий Колмогорова, критерий Мизеса в отличие от - Пирсона не связан с группированием выборочных данных, и его распределение достаточно быстро при увеличении N стремится к предельному распределению. Процентные точки предельного распределения имеют значения, представленные в табл. 2.

Таблица 2

0,5

0,4

0,3

0,2

0,1

0,05

0,03

0,02

0,01

0,001

0,12

0,15

0,18

0,24

0,35

0,46

0,55

0,62

0,744

1,17

5.4. Оценка принадлежности двух выборок одному и тому же распределению. Пусть имеются выборки X и Y, полученные в результате независимых единичных измерений, каждая из которых принадлежит некоторому распределению. Необходимо проверить гипотезу о том, что обе эти выборки принадлежат одному и тому же распределению. Пусть и - эмпирические функции распределения, построенные по двум выборкам X и Y (размер выборки X есть n, а выборки Y - m). В качестве критерия согласия примем величину

Как доказал Н. В. Смирнов, при вероятность

,

Где - функция, аналогичная функции, используемой в критерии Колмогорова. Если задан уровень значимости, то можно, как и в критерии Колмогорова, определить пороговое значение, с которым необходимо сравнивать рассчитанное :

.

Таким образом, если, то выборки X и Y принадлежат одному и тому же распределению.

Другой критерий, предложенный Вилкоксоном, основан на подсчете числа инверсий. Для этого обе выборки располагают в виде порядковой статистики по возрастанию значений, например, Если в этой последовательности заданному X предшествуют S элементов выборки Y, то имеет место S инверсий. Общее число инверсий U равно сумме инверсий, образуемых всеми первыми элементами с элементами второй. Правило проверки гипотезы по критерию Вилкоксоном состоит в сравнении общего числа инверсий с пороговым числом, определяемым уровнем значимости.

Доказано, что при и с хорошим приближением можно считать распределение общего числа инверсий нормальным с параметрами ; . Тогда пороговое значение U числа инверсий для заданного уровня значимости может быть определено по формуле

,

Где - процентное отклонение нормальной случайной величины. Если вычисленное по заданным двум выборкам значение U превосходит U, то гипотеза о том, что эти выборки принадлежат одному и тому же распределению, отклоняются.

Похожие статьи




Критерии согласия - Измерения параметров сигнала

Предыдущая | Следующая