Признак, частота признака, кумулятивная частота - Математическая статистика

Основной величиной в статистических измерениях является единица статистической совокупности. Единица статистической совокупности характеризуется набором признаков или параметров. Значения каждого параметра или признака могут быть различными и в целом образовывать ряд случайных значений x1, х2, ..., хn. Данные - тот критерий, который получаем в ходе исследования, это сведения о том, какие значения принял интересующий аналитика признак. Большинство данных можно отнести к одной из 2 групп:

    - Числовые данные, которые имеют смысл в качестве единицы измерения, например, рост человека, IQ, артериальное давление, количество зубов у него, т. е. все, что можно посчитать (статистики называют числовые данные также Количественными данными или Данными измерений). - Категорийные данные представляют собой характеристики, например, пол человека, мнение, раса, т. е. то, что нельзя выразить цифрами и что не имеет конкретного значения (в статистике такие данные еще называют дискретными данными).

Полученная в результате статистического наблюдения Выборка из N значений (Вариант) изучаемого количественного Признака X образует Вариационный ряд. Ранжированный вариационный ряд получают, расположив варианты XJ , где, в порядке возрастания значений, то есть . Изучаемый Признак X может быть Дискретным, то есть его значения отличаются на конечную, заранее известную величину (год рождения, тарифный разряд, число людей), или Непрерывным, то есть его значения отличаются на сколь угодно малую величину (время, вес, объем, стоимость).

Частотой MI В случае Дискретного признака X называют число одинаковых вариант XI , содержащихся в выборке. В ранжированном вариационном ряду одинаковые варианты очевидно расположены подряд:

Вариационный ряд для Дискретного признака X принято наглядно и компактно представлять в виде таблицы, в первой строке которой указаны K различных значений XI изучаемого признака, а во второй строке - соответствующие этим значениям частоты MI , где. Такую таблицу называют Статистическим (выборочным) распределением.

Переход от исходного вариационного ряда дискретного признака X к соответствующему статистическому распределению можно пояснить на простом примере:

Вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) - 7, 17, 14, 17, 10, 7, 7, 14, 7, 14;

Ранжированный вариационный ряд -

Xj : , где, n = 10;

Соответствующее статистическое распределение (, K = 4):

XI

7

10

14

17

MI

4

1

3

2.

Статистическое распределение для Непрерывного признака X принято представлять Интервальным рядом - таблицей, в первой строке которой указаны K интервалов значений изучаемого признака X Вида (XI-1 - xI ), а во второй строке - соответствующие этим интервалам частоты MI , где. Обозначение (XI-1 - xI ) - указывает не разности, а все значения признака X От XI-1 до XI , кроме правой границы интервала XI .

Для Непрерывного признака X Частота MI - число различных XJ , попавших в соответствующий интервал: XJ[XI-1 ; XI ):

Переход от исходного вариационного ряда непрерывного признака X к соответствующему статистическому распределению можно пояснить на простом примере:

Вариационный ряд, полученный в результате статистического наблюдения (единицы измерения опускаем) -3,14; 1,41; 2,87; 3,62; 2,71; 3,95;

Ранжированный вариационный ряд -

XJ : 1,41; 2,71; 2,87; 3,14; 3,62; 3,95; где, N = 6;

Соответствующее статистическое распределение (, K = 3):

XI

1-2

2-3

3-4

MI

1

2

3.

Если число различных значений дискретного признака очень велико, то для удобства дальнейших вычислений и наглядности статистическое распределение такого дискретного признака также может быть представлено в виде интервального ряда.

Вместо частот MI во второй строке могут быть указаны Относительные частоты (Частости). Очевидно, что сумма частот равна объему выборки (выборочной совокупности) N , а сумма относительных частот (частостей) равна единице:

.

Далее показаны четыре возможных формы представления статистических распределений с соответствующими краткими названиями:

Дискретный ряд частот

Интервальный ряд частот

XI

X1

X2

XK

XI-1-XI

X0-X1

X1-X2

XK-1-XK

MI

M1

M2

MK ,

MI

M1

M2

MK ,

Дискретный ряд частостей

Интервальный ряд частостей

XI

X1

X2

XK

XI-1-XI

X0-X1

X1-X2

XK-1-XK

WI

W1

W2

WK ,

WI

W1

W2

WK .

Если в статистическом распределении вместо частот (Относительных частот) указать накопленные частоты (Относительные накопленные частоты), то такой ряд распределения называют Кумулятивным.

Накопленной частотой называется число значений признака Х, меньших заданного значения X : H(X) = M(Х X), то есть, число вариант XJ в выборке, отвечающих условию XJ < X.

Переход от дискретного ряда частот к кумулятивному ряду - дискретному ряду накопленных частот задается соотношениями:

Или в табличной форме:

XI

X1

X2

X3

XI

XK

XK+1

H(XI)

0

M1

M1+M2

H(XI-1) + MI-1

H(XK-1) + MK-1

H(XK) + MK= N.

Переход от интервального ряда частот к кумулятивному ряду - интервальному ряду накопленных частот задается соотношениями:

Или в табличной форме:

XI-1-XI

--X0

X0-X1

X1-X2

XI-1-XI

XK-1-XK

H(XI)

0

M1

M1+M2

H(XI-1) + MI

H(XK-1) + MK= N.

Накопленной относительной частотой (Накопленной частостью) называется отношение числа значений признака Х, меньших заданного значения X , к объему выборки N : , то есть, доля вариант XJ в выборке, отвечающих условию XJ < X.

Похожие статьи




Признак, частота признака, кумулятивная частота - Математическая статистика

Предыдущая | Следующая