Интервал (i), число групп (n), Средняя арифметическая простая равна сумме значений признака, деленной на их число: - Статистический анализ влияния численности населения на объем товарооборота
Величина равного интервала рассчитывается по формуле:
I=(105-45) / 4=15
Таблица 1. Группировка городов по численности населения
№ группы |
Группировка городов по численности населения |
№ города |
Товарооборот млн. руб. |
I |
45-60 |
|
|
II |
60-75 |
|
|
III |
75-90 |
|
|
IV |
90-105 |
|
|
Средняя арифметическая простая равна сумме значений признака, деленной на их число:
,
Где - значение признака (вариант);
-число единиц признака.
X = =
76,7333
Среднее квадратическое отклонение () представляет собой корень квадратный из дисперсии и равно:
- невзвешенная;
У=
=
Коэффициент вариации:
U =
Конкретное значение моды для интервального ряда рассчитывается по формуле:
Мо= Хмо+h*(fМо-fМо-1)/(( fМо-fМо-1)+(fМо-fМо+1),
Где хМo - нижняя граница модального интервала,
H - величина модального интервала,
FMo - частота модального интервала,
FMo-1 - частота интервала, предшествующего модальному,
FMo+1 - частота интервала, следующего за модальным
Мо = 75 +15.(12-3)/(12-3)+(12-5)=83,44 тыс. чел
Конкретное значение медианы для интервального ряда рассчитывается по формуле
МЕ = ХМе + h * (?f/2 - SМе-1 )/fМе
Где хМе - нижняя граница медианного интервала,
H - величина медианного интервала,
?f - сумма всех частот,
FМе - частота медианного интервала,
SMе-1 - кумулятивная (накопленная) частота интервала, предшествующего медианному
Ме=75+15.(15-6)/12=86,25 чел.
Выводы.
Средняя величина численности населения в городах составляет 76,7333 тыс. человек.
Среднеквадратическое отклонение показывает, что значение признака в совокупности отклоняется от средней величины в ту или иную сторону в среднем 0,2318 тыс. человек
Велечина рассчитанного нами коэффициента вариации свидетельствует о том, что колеблемость численности населения составляет 0,003 %, является незначительной
Задание 2
По исходным данным:
- 1. Установите наличие и характер корреляционной связи между признаками численность населения и товарооборот методом аналитической группировки, образовав по факторному признаку заданное число групп с равными интервалами. 2. Измерьте тесноту корреляционной связи между названными признаками с использованием коэффициента детерминации и эмпирического корреляционного отношения.
Сделайте выводы по результатам выполнения задания.
Распределение предприятий по среднесписочной численности населения
№ гр. |
Группы по численности населения тыс. чел. |
№ города |
Среднесписочная численность населения, тыс. чел. |
Товарооборот, млрд. руб., у |
1 |
45-60 |
1 |
50 |
4 |
2 |
60 |
4,2 | ||
5 |
60 |
4,15 | ||
6 |
45 |
2 | ||
7 |
60 |
4,05 | ||
9 |
60 |
4 | ||
11 |
60 |
4 | ||
17 |
45 |
2 | ||
28 |
50 |
3,9 | ||
29 |
45 |
2,1 | ||
Итого |
10 |
535 | ||
2 |
60-75 |
10 |
70 |
5 |
14 |
70 |
6 | ||
20 |
70 |
5,3 | ||
Итого |
3 |
210 | ||
3 |
75-90 |
3 |
89 |
7,9 |
4 |
88 |
7,8 | ||
8 |
87 |
7,8 | ||
13 |
89 |
7,95 | ||
15 |
89 |
7,9 | ||
16 |
86 |
7,7 | ||
18 |
80 |
7 | ||
19 |
89 |
7,9 | ||
20 |
85 |
7,6 | ||
21 |
86 |
7 | ||
23 |
89 |
7,95 | ||
24 |
80 |
6,3 | ||
Итого |
12 |
1037 | ||
4 |
90-105 |
12 |
105 |
10 |
25 |
105 |
9,8 | ||
26 |
100 |
9,05 | ||
27 |
105 |
9,6 | ||
30 |
105 |
9,7 | ||
Итого |
5 |
520 | ||
Всего |
30 |
2302 |
189,65 |
Вывод
Анализ данных таблицы показывает, что с ростом величины численности населения от групп к группе товарооборот по каждому городу увеличивается. Следовательно, между исследуемыми признаками существует прямая корреляционная связь.
Построим теперь аналитическую группировку:
№ группы |
Численность населения тыс. чел. |
Число городов |
Среднесписочная численность населения, чел | |
Всего по группе |
В среднем на один город | |||
1 |
45-60 |
10 |
535 |
53,5 |
2 |
60-75 |
3 |
210 |
70 |
3 |
75-90 |
12 |
1037 |
86,42 |
4 |
90-105 |
5 |
520 |
104 |
Итого |
30 |
2302 |
313,92 |
Вывод: на основании данных построенной аналитической группировки можно сказать, что с увеличением численности населения средний товарооборот также увеличивается, что свидетельствует о наличии прямой связи между указанными признаками.
Сначала строим другой интервальный ряд распределения, где у - прибыль.
Группы товарооборота, млрд. руб. |
Число городов |
2-4 |
6 |
4-6 |
7 |
6-8 |
12 |
8-10 |
5 |
ИТОГО |
30 |
Корреляционная таблица, характеризующая наличие связи между численностью населения и товарооборотом
Численность населения тыс. чел. |
Группы товарооборота млрд. руб. |
Итого | ||
2-4 |
4-6 |
6-8 |
8-10 | |
45-60 |
5 |
5 |
10 | |
60-75 |
1 |
2 |
3 | |
75-90 |
12 |
12 | ||
90-105 |
5 |
5 | ||
Итого |
6 |
7 |
12 |
5 |
Вывод: на основании данных построенной корреляционной таблицы можно сказать, что с увеличением численности населения, в преобладающем большинстве случаев, товарооборот также увеличивается, что свидетельствует о наличии прямой корреляционной связи между указанными признаками.
Измерение тесноты корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения:
Для измерения тесноты связи между факторным и результативным признаками рассчитывают специальные показатели - эмпирический коэффициент детерминации и эмпирическое корреляционное отношение.
Эмпирический коэффициент детерминации оценивает, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
,
Где - общая дисперсия признака Y,
- межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах 0 ? ?1. При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
,
Где yi - индивидуальные значения результативного признака;
- общая средняя значений результативного признака;
N - число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
,
Или как средняя взвешенная по частоте групп интервального ряда:
Расчет по формуле (11):
Для расчета общей дисперсии применяется вспомогательная таблица
Вспомогательная таблица для расчета общей дисперсии
Номер городов п/п |
Товарооборот, млрд. руб. | |||
1 |
2 |
3 |
4 |
5 |
1 |
4 |
-2,32 |
5,3824 |
16 |
2 |
4,2 |
-2,12 |
4,4944 |
17,64 |
3 |
7,9 |
1,58 |
2,4964 |
62,41 |
4 |
7,8 |
1,48 |
2,1904 |
60,84 |
5 |
4,15 |
-2,17 |
4,7089 |
17,2225 |
6 |
2 |
-4,32 |
18,6624 |
4 |
7 |
4,05 |
-2,27 |
5,1529 |
16,4025 |
8 |
7,8 |
1,48 |
2,1904 |
60,84 |
9 |
4,5 |
-1,82 |
3,3124 |
20,25 |
10 |
5 |
-1,32 |
1,7424 |
25 |
11 |
4 |
-2,32 |
5,3824 |
16 |
12 |
10 |
3,68 |
13,5424 |
100 |
13 |
7,95 |
1,63 |
2,6569 |
63,2025 |
14 |
6 |
-0,32 |
0,1024 |
36 |
15 |
7,9 |
1,58 |
2,4964 |
62,41 |
16 |
7,7 |
1,38 |
1,9044 |
59,29 |
17 |
2 |
-4,32 |
18,6624 |
4 |
18 |
7 |
0,68 |
0,4624 |
49 |
19 |
7,9 |
1,58 |
2,4964 |
62,41 |
20 |
7,6 |
1,28 |
1,6384 |
57,76 |
21 |
7 |
0,68 |
0,4624 |
49 |
22 |
5,3 |
-1,02 |
1,0404 |
28,09 |
23 |
7,95 |
1,63 |
2,6569 |
63,2025 |
24 |
6,3 |
-0,02 |
0,0004 |
39,69 |
25 |
9,8 |
3,48 |
12,1104 |
96,04 |
26 |
9,05 |
2,73 |
7,4529 |
81,9025 |
27 |
9,6 |
3,28 |
10,7584 |
92,16 |
28 |
3,9 |
-2,42 |
5,8564 |
15,21 |
29 |
2,1 |
-4,22 |
17,8084 |
4,41 |
30 |
9,7 |
3,38 |
11,4244 |
94,09 |
Итого |
189,65 |
169,2485 |
1374,473 |
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
,
Где - средняя из квадратов значений результативного признака,
- квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней. Показатель вычисляется по формуле
,
Где - групповые средние,
- общая средняя,
-число единиц в j-ой группе,
K - число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица При этом используются групповые средние значения.
Вспомогательная таблица для расчета межгрупповой дисперсии
Численность населения тыс. чел. |
Число городов |
Среднее значение в группе | ||
1 |
2 |
3 |
4 |
5 |
45-60 |
10 |
3,44 |
-2,88 |
82,944 |
60-75 |
3 |
5,43 |
-0,89 |
2,3763 |
75-90 |
12 |
7,57 |
1,25 |
18,75 |
90-105 |
5 |
9,63 |
3,31 |
54,7805 |
Итого |
30 |
26,07 |
158,8508 |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
или 90,01 %
Вывод. 90,01% общая доля товарооборота вызывает среднесписочная численность населения, а остальные 9,99 %- вариации товарооборота вызывают другие неучтенные признаки.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
Значение показателя изменяются в пределах 0 ?? 1. Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока
Шкала Чэддока
0,1-0,3 |
0,3-0,5 |
0,5-0,7 |
0,7-0,9 |
0,9-0,99 | |
Характеристика силы связи |
Слабая |
Умеренная |
Заметная |
Тесная |
Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле:
Или 94,9%
Вывод. Согласно шкале Чэддока связь между численностью населения и товарооборотом весьма тесная.
Оценка значимости (неслучайности) полученных характеристик связи признаков и
Показатели и рассчитаны для выборочной совокупности, т. е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи, несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
Где n - число единиц выборочной совокупности,
M - количество групп,
- межгрупповая дисперсия,
- дисперсия j-ой группы (j=1,2,...,m),
- средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
Где - общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений, k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений, k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если FрасчFтабл, коэффициент детерминации признается статистически значимым, т. е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если FрасчFтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35
K2 | ||||||||||||
K1 |
24 |
25 |
26 |
27 |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
3 |
3,01 |
2,99 |
2,98 |
2,96 |
2,95 |
2,93 |
2,92 |
2,91 |
2,90 |
2,89 |
2,88 |
2,87 |
Расчет дисперсионного F-критерия Фишера для оценки =90,01%, полученной при =5,64, =5,295
Fрасч
Табличное значение F-критерия при = 0,05:
N |
M |
K1=m-1 |
K2=n-m |
Fтабл (,3, 26) |
30 |
4 |
3 |
26 |
2,98 |
ВЫВОД: поскольку FрасчFтабл, то величина коэффициента детерминации =90,01% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками правомерны не только для выборки, но и для всей генеральной совокупности фирм
Задание 3
По результатам выполнения задания 1 с вероятностью 0,954 определите:
- 1. Ошибку выборки средней численности населения города и границы, в которых она будет находиться в городах генеральной совокупности. 2. Ошибку выборки доли городов с численностью 90,0 тыс. человек и более и границы, в которых будет находиться генеральная доля.
Решение:
При уровне вероятности Ф(t) = 0,954 коэффициент кратности средней ошибки выборки t = 2,00.
W=0, 1 (или 10% предприятий имеют в выборочной совокупности число работников менее 90 тыс. человек)
=2205/30=73,5 тыс. чел.
Среднее квадратическое отклонение:
Тыс. чел.
Д =t*=2,89*2=5,78 тыс. чел.
(тыс. чел.)
Вывод: с вероятностью 0,954 можно утверждать, что средняя численность населения города будет находиться в пределах от 67,72 до 79,28 тыс. чел.
2) доли городов с численностью 90,0 тыс. чел.
или 6%
Вывод: с вероятностью 0,954 можно утверждать, что доля городов с численностью 90,0тыс. человек и более будет находиться в пределах от 10% до 22 % для всех городов.
Задание 4
Имеются следующие данные о динамике товарооборота двух районов одного из регионов страны:
№района п/п |
Численность населения, тыс. чел. |
Товарооборот, млрд. руб. | ||
Базисный период |
Отчетный период |
Базисный период |
Отчетный период | |
1 |
535 |
400 |
1,20 |
1,87 |
2 |
1767 |
1700 |
12,75 |
13,71 |
Определите:
- 1)общие индексы среднего товарооборота на душу населения переменного, постоянного состава, структурных сдвигов. 2) абсолютное изменение среднего товарооборота на душу населения под влиянием отдельных факторов.
Сделайте выводы.
Решение:
Численность населения, тыс. чел. z |
Товарооборот, млрд. руб |
Уровень рентабельности, R |
Индекс рентабельности | |||
Базис. период П |
Отчет. период П |
Базис. период z |
Отчет. период z |
Базис. период R |
Отчет. период R | |
535 |
400 |
1,20 |
1,87 |
445,833 |
213,904 |
0,48 |
1767 |
1700 |
12,75 |
13,71 |
138,588 |
123,997 |
0,895 |
?2302 |
?2100 |
?13,95 |
?15,58 |
?584,421 |
?337,901 |
Индекс средней рентабельности переменного состава:
Индекс средней рентабельности постоянного состава:
Индекс структурных сдвигов:
Абсолютное изменение средней рентабельности продукции в целом
?
Абсолютное изменение балансовой прибыли от изменения уровня рентабельности
?=
Абсолютное изменение балансовой прибыли от изменения структурных сдвигов:
?=
Похожие статьи
-
Распределение торговых предприятий города по их товарообороту
Задан годовой товарооборот (млн. руб.) 60 торговых предприятий города. Первые 40 значений товарооборота относятся к государственным предприятиям,...
-
Данная контрольная работа состоит из двух частей - теоретической и практической. В теоретической части будет подробно рассмотрена такая важная...
-
Моделирование числа предприятий в РФ - Статистический анализ предпринимательства
Приведем данные (взяты из справочника Регионы России), характеризующие число предприятий в РФ. Год 1995 1996 1997 1998 1999 2000 2001 2002 2003 Число...
-
Средняя арифметическая Средней арифметической величиной называется такое среднее значение признака, при вычислении которого общий объем признака в...
-
Факторы, оказывающие влияние на уровень безработицы в России Перед тем как переходить непосредственно к анализу данных, необходимо предварительно выбрать...
-
Будем моделировать среднегодовую численность занятого населения с помощью показателей общей численности населения и миграционного прироста Среднегодовая...
-
Экономический корреляционный регрессионный Парная линейная регрессия Парная регрессия характеризует связь между двумя признаками: результативным и...
-
Тема: Статистическое изучение объема, состава и динамики доходов и расходов государственного бюджета Имеются следующие выборочные данные (выборка 25%-ная...
-
Данные взяты на сайте Госкомстата Http://www. gks. ru/free_doc/2006/b06_13/14-08.htm Год Значение, Млн. чел. 2000 4,7 2001 4,2 2002 3,8 2003 3,3 2004 2,9...
-
Статистический анализ состава населения - Система источников данных о населении
В практической и научно-исследовательской деятельности требуются сведения о составе населения, т. е. по отдельным группам населения, выделенным по тем...
-
Где - ошибка аппроксимации. Подставляем в уравнения регрессии фактические значения х, определим теоретические (расчетные) значения (табл. 2). Найдем...
-
В интервальном вариационном ряду мода вычисляется по формуле: , Где Y O - нижняя граница модального интервала; H - размер модального интервала; F Mo -...
-
При использовании статистических методов прогнозирования во многих случаях необходимо знать возможную ошибку прогноза, т. е. тот интервал, в котором...
-
Для регрессии вида Найдем коэффициенты по формулам Вычислим Тогда Откуда Тогда линейная регрессия будет иметь вид Смысл коэффициента beta заключается в...
-
Приведем данные среднегодовой численности занятого населения Год Тыс. чел. 1996 2301,3 1997 2341,4 1998 2329,8 1999 2351,6 2000 2367,8 2001 2372,3 2002...
-
Средняя геометрическая - Общая теория статистики
Если значения осредняемого признака существенно отстоят друг от друга или заданы коэффициентами (темпы роста, индексы цен), то для расчета применяют...
-
Методы определения корреляционной связи - Корреляционно-регрессионный анализ
Корреляцию и регрессию принято рассматривать как совокупный процесс статистического исследования, поэтому их использование в статистике часто именуют...
-
Виды дисперсий и правило их сложения - Основы статистики
Большинство показателей вариации (колеблемости, рассеивания) исчисляется на основе отклонений признака у отдельных единиц совокупности от средней...
-
Средние величины - Ряды распределения
Для целей исследования возьмем данные о численности населения по субъектам Российской Федерации по основным группам за 2013 год. Округ Численность в тыс....
-
Применим аппарат. Результаты приведены ниже Таблица 6. индексный анализ Рисунок 4. График сглаженного признака Полиномиальная регрессия Приведем массив...
-
ОПРЕДЕЛЕНИЕ МЕТОДА ФАКТОРНОГО АНАЛИЗА И ЧИСЛА ФАКТОРОВ - Многомерный статистический анализ
Определение метода факторного анализа. Различные методы факторного анализа различаются в зависимости от подходов, которые используются для выделения...
-
Сущность группировки, их виды и значение Группировка -- это распределение единиц по группам в соответствии со следующим принципом: различия между...
-
В ряде случаев в экономической практике возникает потребность расчета среднего размера признака, выраженного в квадратных или кубических единицах...
-
Метод сравнения является универсальным методом и применяется во всех разделах статистики (метод сравнения средних, оценивания неизвестных параметров и...
-
Подсчитаем функцию эластичности по формуле В нашем случае или Значение эластичности в средней точке Показывает, что при изменении X на 1% Y меняется на...
-
ФАКТОРНАЯ МОДЕЛЬ ПРИ НОРМИРОВАННЫХ ПЕРЕМЕННЫХ - Многомерный статистический анализ
С математической точки зрения факторный анализ аналогичен множественному регрессионному анализу в том смысле, что каждая переменная выражена как линейная...
-
Множественный регрессионный анализ, Заключение - Система источников данных о населении
Будем моделировать среднегодовую численность занятого населения с помощью показателей общей численности населения и миграционного прироста Среднегодовая...
-
Возьмем данные об инвестициях в основной капитал (млрд. руб.) Год Квартал Номер квартала Значение 2003 I 1 330 II 2 470,4 III 3 608,8 IV 4 773,7 2004 I 5...
-
Расчетная часть - Индексный метод в статистическом изучении заработной платы работников
Построить статистический ряд распределения организаций по признаку среднегодовая заработная плата (как отношение фонда заработной платы к среднесписочной...
-
Типы зависимостей - Корреляционно-регрессионный анализ
Зависимость одной случайной величины от значений, которые принимает другая случайная величина (физическая характеристика), в статистике называется...
-
Методы изучения связи качественных признаков - Основы эконометрики
При наличии соотношения между вариацией качественных признаков говорят об их ассоциации, взаимосвязанности. Для оценки связи в этом случае используют ряд...
-
Сущность и основные условия применения корреляционного анализа В соответствии с сущностью корреляционной связи ее изучение имеет две цели: 1) измерение...
-
Показатели вариации - Основы эконометрики
Показатели вариации делятся на две группы: абсолютные и относительные. К Абсолютным показателям вариации относятся: § размах вариации; § среднее линейное...
-
Проверить ряд на наличие выбросов методом Ирвина, сгладить методом простой скользящее средней с интервалом сглаживания 3, методом экспоненциального...
-
В данной работе были рассмотрены два теста, которые позволяют выявить гетероскедастичность. И тест Вайта, и тест Парка являются простыми тестами, которые...
-
Гомоскедастичностью называется выполняемость предпосылки о постоянстве дисперсии отклонений. Гетероскедастичностью называется невыполняемость этой самой...
-
Построение, расчет и анализ среднего арифметического взвешенного индекса физического объема товарооборота Исходная информация для расчета среднего...
-
Для прогнозирования банкротства, некоторые исследователи создают модели, основанные на использовании искусственных нейронных сетей. Как правило,...
-
Регрессионный анализ данных - Статистическое исследование инвестиционной деятельности в регионе
Если расчет корреляции характеризует силу связи между переменными, то регрессионный анализ служит для определения вида этой связи и дает возможность для...
-
В результате первой стадии статистического исследования (статистического наблюдения) получают статистическую информацию, представляющую собой большое...
Интервал (i), число групп (n), Средняя арифметическая простая равна сумме значений признака, деленной на их число: - Статистический анализ влияния численности населения на объем товарооборота