Виды дисперсий и правило их сложения - Основы статистики

Большинство показателей вариации (колеблемости, рассеивания) исчисляется на основе отклонений признака у отдельных единиц совокупности от средней арифметической, т. к. средняя арифметическая является обобщающей характеристикой свойств ряда (совокупности).

Более объективно меру вариации признака отражает показатель дисперсии (или средний квадрат отклонений). Поэтому на практике наиболее часто используется для характеристики меры вариации этот показатель или показатель, базирующийся на дисперсии (среднее квадратическое отношение, коэффициент вариации). Поэтому условно назовем эту группу показателей вариации как группу основных показателей вариации.

Дисперсия (и соответственно ) используется при организации выборочного наблюдения, при оценке полученных на основе выборки статистических показателей. Дисперсия может использоваться для построения показателей тесноты корреляционной связи, анализа влияния различных факторов (сложение дисперсий).

Дисперсия (средний квадрат отклонений) исчисляется средняя из отклонений, возведенных в квадрат:

или (7)

Итак, чтобы вычислить дисперсию нужно проделать следующие операции [6, c. 156]:

    - найти отклонения каждой варианты ряда от средней арифметической ; - возвести эти отклонения в квадрат; - умножить квадрат отклонения на соответствующую частоту и суммировать;

- полученную сумму нужно разделить на сумму частот.

Дисперсия (средний квадрат отклонений) имеет ряд математических свойств (доказываемых в математической статистике), которые позволяют упростить технику ее расчета:

- если из всех значений вариант отнять какое-то постоянное число А, то средний квадрат отклонений от этого не изменится:

; (8)

- если все значения вариант умножить или разделить на какое-то постоянное число А, то дисперсия увеличится или уменьшится от этого в раз:

или (9)

Другими словами, постоянный множитель вариант выносится за знак дисперсии возведенным в квадрат; если исчислить дисперсию от любой величины признака, которая в той или ной степени отличается от средней арифметической, то он всегда будет больше дисперсии, исчисленной от средней арифметической [7, c. 211]:

(10)

Это свойство носит название свойство минимальности. При этом больше на определенную величины - на квадрат разности между средней и этой условно взятой величиной:

(11)

Использование указанных свойств дисперсии позволяет упростить ее расчет, особенно в тех случаях, когда вариационный ряд составляет арифметическую прогрессию или имеет равные интервалы.

Например, пусть. Тогда по 3-му свойству имеем:

(12)

Отсюда: средний квадрат отклонений равен среднему квадрату индивидуальных значений признака минус квадрат среднего значения признака.

Изложенный способ расчета дисперсии называется способом моментов или способом отсчета от условного нуля [1, c. 278].

Корень квадратный из дисперсии (среднего квадрата отклонения) представляет собой наиболее широко применяемый в статистических исследованиях показатель вариации - среднее квадратическое отклонение (иногда называют стандартное отклонение).

(13)

Среднее квадратическое отношение является мерилом надежности средней. Чем меньше, чем лучше среднее арифметическое отражает собой всю изучаемую совокупность.

Исходя из сказанного, по своему абсолютному значению среднее квадратическое отклонение () зависит не только от степени вариации признака, но и от абсолютных уровней (или значений) вариаций и средней. Поэтому сравнивать средние квадратические отклонения вариационных рядов с разными уровнями непосредственно нельзя. Для этих целей исчисляются показатели колеблемости в относительных величинах. Они позволяют сравнивать характер рассеивания в различных распределениях (различные единицы совокупности одного и того же признака в двух совокупностях, при различных значениях средних, при сравнении разноименных совокупностей).

Для этой цели в статистических исследованиях широко применяется коэффициент вариации, т. к. средняя величина () отражает тенденцию развития (т. е. действие главных факторов), а среднеквадратическое отклонение () дает обобщенную характеристику колеблемости всех вариантов совокупности (измеряет силу воздействия прочих факторов).

Итак, коэффициент вариации является наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин. При этом считается, что если н больше 40%, то имеет место большая колеблемость изучаемого признака.

Дисперсию и среднюю альтернативного признака можно определить по формулам:

и (14)

Где p - доля единиц, обладающих признаком;

G - доля единиц, не обладающих признаком;

Притом p+g=1, g=1-p.

Среднеквадратическое отклонение:

.

Итак:

    - по всей совокупности мы можем рассчитать общую среднюю для всей совокупности; - по отдельным группам соответственно можно рассчитать групповые или частные средние.

Тогда можно вычислить три показателя дисперсии [2, c. 198]:

    - общую дисперсию; - среднюю из внутригрупповых дисперсий; - дисперсию групповых средних (или межгрупповую дисперсию).

Величина общей дисперсии () характеризует вариацию признака под влиянием всех условий, вызывающих эту вариацию. Общая дисперсия, как познакомились выше, вычисляется по формуле:

(15)

Изменчивость индивидуальных значений (вариант) признака внутри групп происходит под влиянием других, не учитываемых факторов и не зависит от признака - фактора, положенного в основу группировки. Внутригрупповая дисперсия определяется как взвешенная средняя из дисперсий по отдельным группам, т. е. по формуле:

(16)

Межгрупповая дисперсия (дисперсия средних) отражает различия в величине изучаемого признака в "чистом виде", т. к. влияние других факторов, специфических для каждой группы, нивелированы в групповых средних и определяется по формуле:

(17)

Дисперсии взаимосвязаны между собой следующим равенством: величина общей дисперсии равна сумме величин межгрупповой дисперсии (дисперсии групповых средних) и средней из внутригрупповых дисперсий, т. е.:

(18)

Это тождество получило название закона (правила) сложения дисперсий.

Опираясь на это правило можно определить, которая часть общей дисперсии формируется под влиянием изучаемого фактора, положенного в основу группировки (отражает так называемую систематическую вариацию) и какая часть - за счет неучтенных факторов.

Средняя из групповых дисперсий () дает обобщенную характеристику случайной вариации изучаемого признака, возникающего под влиянием неучтенных факторов.

Теоретический и практический интерес правила сложения дисперсий заключается в следующем [8, c. 167]:

    - зная две дисперсии можно всегда определить третий вид дисперсии; - зная дисперсию групповых средних (межгрупповую дисперсию) и общую дисперсию можно судить о силе влияния группировочного признака на изучаемое явление.

Например, изучаем влияние на общую урожайность внесения удобрений. Очевидно, чем ближе будет дисперсия групповых средних (когда все земельные участки сгруппированы на удобренные и неудобренные) к общей дисперсии, тем больше будет влияние внесения удобрений на общую урожайность.

В математической статистике для оценки тесноты связи с использованием этого правила обоснована формула корреляционного отношения:

, где (19)

Благодаря правилу сложения дисперсий можно определить, какая часть общей дисперсии находится под влиянием признака-фактора, положенного в основу группировки.

Похожие статьи




Виды дисперсий и правило их сложения - Основы статистики

Предыдущая | Следующая