Сводка и группировка статистических данных


Исходные данные

Имеются следующие выборочные данные по предприятиям одной из корпораций в отчетном году (выборка 20%-ная, механическая), млн руб.:

№ предприятия п/п

Средняя списочная численность работников, чел.

Выпуск продукции, млн руб.

№ предприятия п/п

Средняя списочная численность работников, чел.

Выпуск продукции, млн руб.

1

110

14

16

155

43

2

115

18

17

156

42

3

126

22

18

160

41

4

131

27

19

162

47

5

133

30

20

163

60

6

136

40

21

173

55

7

141

35

22

175

52

8

144

38

23

177

53

9

152

41

24

181

56

10

154

34

25

183

57

11

156

40

26

185

51

12

150

30

27

192

61

13

150

36

28

193

71

14

150

36

29

205

69

15

152

42

30

210

79

Задание 1

    1. Провести группировку единиц наблюдения статистической совокупности по факторному признаку, образовав пять групп с равными интервалами. Построить аналитическую таблицу. Построить гистограмму и круговую диаграмму. Сделать выводы. 2. По данным первоначальной и аналитической таблицы по факторной и результативной переменными расчетным путем (в форме расчетной таблицы) и с использованием статистических функций в Excel (в качестве проверки правильности расчета) определить и обосновать:
      - средние значения, моду и медиану. Сравнить их между собой и сделать соответствующие выводы. - показатели вариации (среднее линейное отклонение, дисперсию, среднеквадратическое отклонение, коэффициент вариации). Оценить исходную информацию на устойчивость и сделать выводы.

Решение

Проведем группировку единиц совокупности по среднесписочной численности работников, образовав 5 групп с равными интервалами.

Для этого определим размер интервала по формуле:

Где h - шаг интервала;

XMax, xMin - максимальное и минимальное значение признака в ряду;

N - число групп.

Построим аналитическую группировку, для чего рассчитаем по каждой группе объем выпуска всего и в среднем на одно предприятие. Результаты представим в таблице. статистический факторный корреляция

Таблица

Группировочная таблица

№ группы

Средняя списочная численность работников, чел.

Число предприятий

Выпуск продукции, млн. руб.

Всего

В среднем на 1 предприятие

1

110-130

3

54

18

2

130-150

5

170

34

3

150-170

12

492

41

4

170-190

6

324

54

5

190-210

4

280

70

Итого

30

1320

44

Результаты проведенной группировки показывают, что с ростом среднесписочной численности работников на предприятии увеличивается также выпуск продукции, то есть между показателями имеется прямая зависимость.

Представим результаты группировки в виде гистограммы и круговой диаграммы.

гистограмма распределения предприятий по средней списочной численности работников

Рисунок 1 - Гистограмма распределения предприятий по средней списочной численности работников

круговая диаграмма распределения предприятий по средней списочной численности работников, чел

Рисунок 2 - Круговая диаграмма распределения предприятий по средней списочной численности работников, чел.

Наиболее наполненной оказалась группа предприятий с средней списочной численностью работников от 150 до 170 человек.

Рассчитаем показатели по данным первоначальной таблицы.

Таблица

Расчетная таблица

№ предприятия п/п

Средняя списочная численность работников, чел., x

1

110

49

2401

2

115

44

1936

3

126

33

1089

4

131

28

784

5

133

26

676

6

136

23

529

7

141

18

324

8

144

15

225

9

152

7

49

10

154

5

25

11

156

3

9

12

150

9

81

13

150

9

81

14

150

9

81

15

152

7

49

16

155

4

16

17

156

3

9

18

160

1

1

19

162

3

9

20

163

4

16

21

173

14

196

22

175

16

256

23

177

18

324

24

181

22

484

25

183

24

576

26

185

26

676

27

192

33

1089

28

193

34

1156

29

205

46

2116

30

210

51

2601

Сумма

4770

584

17864

Среднее значение средней списочной численности работников найдем по формуле средней арифметической простой:

Мода - варианта с наибольшей частотой. В данном ряду наиболее часто встречается значение 150.

Медина - значение совокупности делящее выборку на две равные части.

Так как число единиц совокупности четное, то медиана будет равна полу сумме двух средних вариант:

То есть на половине предприятий средняя численность работников более 155,5 человек, анна половине - менее.

Среднее значение ряда больше моды и медианы, следовательно, для ряда характерна правосторонняя асимметрия.

Произведем расчет показателей вариации.

Среднее линейное отклонение:

Дисперсия:

Среднее квадратическое отклонение:

Для оценки однородности совокупности рассчитаем коэффициент вариации.

Полученное значение коэффициента вариации показывает, что совокупность предприятий однородна по средней списочной численности работников.

Рассчитаем данные показатели с помощью встроенных функций EXCEL.

СРЗНАЧ

159

МОДА

150

МЕДИАНА

155,5

ДИСПР

595,4667

СТАНДОТКЛОНП

24,40219

Результаты расчетов совпадают.

Произведем расчеты показателей по выпуску продукции. Проранжируем предприятия по величине выпуска продукции для того чтобы в дальнейшем определить медиану.

Таблица

Расчетная таблица

№ предприятия п/п

Выпуск продукции, млн руб., у

1

14

30

900

2

18

26

676

3

22

22

484

4

27

17

289

5

30

14

196

12

30

14

196

10

34

10

100

7

35

9

81

13

36

8

64

14

36

8

64

8

38

6

36

6

40

4

16

11

40

4

16

9

41

3

9

18

41

3

9

15

42

2

4

17

42

2

4

16

43

1

1

19

47

3

9

26

51

7

49

22

52

8

64

23

53

9

81

21

55

11

121

24

56

12

144

25

57

13

169

20

60

16

256

27

61

17

289

29

69

25

625

28

71

27

729

30

79

35

1225

Сумма

1320

366

6906

В данном ряду 5 значений выпуска продукции встречаются одинаковое количество раз.

То есть на половине предприятий величина выпуска продукции меньше 41,5 млн. рублей, а на половине - больше.

Среднее значение ряда больше моды и медианы, следовательно, для ряда характерна правосторонняя асимметрия.

Произведем расчет показателей вариации.

Среднее линейное отклонение:

Дисперсия:

Среднее квадратическое отклонение:

Коэффициент вариации;

Полученное значение коэффициента вариации превышает 33%, следовательно, совокупность предприятий не однородна по величине выпуска продукции

Рассчитаем данные показатели с помощью встроенных функций EXCEL.

СРЗНАЧ

44

МОДА

30

МЕДИАНА

41,5

ДИСПР

230,2

СТАНДОТКЛОНП

15,17234

Результаты расчетов совпадают.

Произведем расчеты по построенному интервальному ряду.

Среднее значение численности работников определим по формуле средней арифметической взвешенной:

Где - середины интервалов;

- число предприятий.

Таблица

Расчетная таблица

№ группы

Средняя списочная численность работников, чел.

Число предприятий,

Накопленная частота

1

110-130

3

120

360

3

126

5292

2

130-150

5

140

700

8

110

2420

3

150-170

12

160

1920

20

24

48

4

170-190

6

180

1080

26

108

1944

5

190-210

4

200

800

30

152

5776

Итого

30

X

4860

X

520

15480

Мода - наиболее часто встречающееся значение признака у единиц данной совокупности.

Выбираем в качестве начала интервала 150, так как именно на этот интервал приходится наибольшее количество.

Медиана делит выборку на две части: половина вариант меньше медианы, половина -- больше.

Медианным является интервал 150-170, т. к. в этом интервале накопленная частота превышает половину общей суммы частот.

Таким образом, у половины предприятий средняя списочная численность работников больше 162 человек, а у половины - меньше.

Среднее линейное отклонение:

Дисперсия:

Среднее квадратическое отклонение:

Результаты расчетов показателей по дискретному и интервальному ряду не значительно отличаются.

Задание 2

    1. Установить наличие и направление связи между факторной и результативной переменными 2. Дать количественную оценку тесноте связи между исследуемыми переменными на основе расчета линейного коэффициента корреляции как расчетным путем (в форме расчетной таблицы) так и в автоматическом режиме с использованием статистической функций в Excel в качестве проверки правильности расчета. Сделать вывод. 3. Построить уравнение регрессии и показать его на графике. Обосновать параметры уравнения. Определить теоретические значения результативной переменной. Рассчитать коэффициент эластичности. Все расчеты представить в виде расчетной таблицы. Проверить полученные расчеты в автоматическом режиме с использованием статистических функций в Excel. Сделать выводы. 4. Провести дисперсионный анализ на основе расчета общей, факторной и остаточной дисперсий (расчеты показать в виде данных расчетной таблицы). На основе правила сложения дисперсий определить эмпирический коэффициент детерминации и эмпирическое корреляционное отношение. Оценить выведенное уравнение регрессии на статистическую значимость. Сделать соответствующие выводы.

Решение

Для того чтобы установить наличие и направление связи между переменными построим поле корреляции.

поле корреляции

Рисунок 3 - Поле корреляции

Построенный график показывает, что между переменными имеется прямая связь, так как с увеличением факторной переменной - средней списочной численности работников, увеличивается также результативная переменная - выпуск продукции. Форма связи близка к линейной.

Рассчитаем линейный коэффициент корреляции. Воспользуемся формулой:

Промежуточные расчеты произведем в таблице.

Таблица

Расчетная таблица

№ предприятия п/п

Средняя списочная численность работников, чел.

Выпуск продукции, млн руб.

Х2

У2

Х*у

Х

У

1

110

14

12100

196

1540

2

115

18

13225

324

2070

3

126

22

15876

484

2772

4

131

27

17161

729

3537

5

133

30

17689

900

3990

6

136

40

18496

1600

5440

7

141

35

19881

1225

4935

8

144

38

20736

1444

5472

12

150

30

22500

900

4500

13

150

36

22500

1296

5400

14

150

36

22500

1296

5400

9

152

41

23104

1681

6232

15

152

42

23104

1764

6384

10

154

34

23716

1156

5236

16

155

43

24025

1849

6665

11

156

40

24336

1600

6240

17

156

42

24336

1764

6552

18

160

41

25600

1681

6560

19

162

47

26244

2209

7614

20

163

60

26569

3600

9780

21

173

55

29929

3025

9515

22

175

52

30625

2704

9100

23

177

53

31329

2809

9381

24

181

56

32761

3136

10136

25

183

57

33489

3249

10431

26

185

51

34225

2601

9435

27

192

61

36864

3721

11712

28

193

71

37249

5041

13703

29

205

69

42025

4761

14145

30

210

79

44100

6241

16590

Сумма

4770

1320

776294

64986

220467

Среднее

159

44

25876,5

2166,2

7348,9

Полученное значение коэффициента корреляции показывает, что связь между переменными прямая и тесная.

Рассчитаем коэффициент с помощью функции MS EXCEL "Коррел":

КОРРЕЛ

0,95317

Результаты расчетов коэффициента корреляции совпадают.

Построим линейное уравнение регрессии. Уравнение парной линейной регрессии в общем виде имеет вид:

Параметры уравнения найдем с помощью метода наименьших квадратов. Система нормальных уравнений МНК для определения параметров модели имеет вид:

Подставим полученные ранее значения и решим систему.

Домножим первое уравнение системы на 159 и решим системы методом вычитания.

Уравнение будет иметь вид:

Значение параметра регрессии означает, что с ростом средней списочной численности работников на 1 человека, выпуск продукции увеличивается в среднем на 0,593 млн. рублей.

Рассчитаем теоретические значения результативной переменной по полученному уравнению регрессии, представим их в таблице, а также представим его на графике.

Таблица

Теоретические и фактические значения результативной переменной

№ предприятия п/п

Средняя списочная численность работников, чел.

Выпуск продукции, млн руб.

Теоретические значения результативной переменной, млн. руб.

Х

У

У теор

1

110

14

15,0

2

115

18

17,9

3

126

22

24,4

4

131

27

27,4

5

133

30

28,6

6

136

40

30,4

7

141

35

33,3

8

144

38

35,1

12

150

30

38,7

13

150

36

38,7

14

150

36

38,7

9

152

41

39,9

15

152

42

39,9

10

154

34

41,0

16

155

43

41,6

11

156

40

42,2

17

156

42

42,2

18

160

41

44,6

19

162

47

45,8

20

163

60

46,4

21

173

55

52,3

22

175

52

53,5

23

177

53

54,7

24

181

56

57,0

25

183

57

58,2

26

185

51

59,4

27

192

61

63,6

28

193

71

64,1

29

205

69

71,3

30

210

79

74,2

Сумма

4770

1320

1320

Представим на графике.

фактические и теоретические значения выпуска продукции, млн. руб

Рисунок 2.2. Фактические и теоретические значения выпуска продукции, млн. руб.

Рассчитаем коэффициент эластичности по формуле:

Рассчитанный коэффициент показывает, что с ростом средней списочной численности работников на 1%, выпуск продукции увеличивается на 2,14%.

Найдем параметры линейной регрессии с помощью MS EXCEL с помощью модуля "Анализ данных".

Результаты, полученные с помощью MS EXCEL, совпали с произведенными ранее вычислениями.

Произведем расчеты дисперсий. Внутригрупповая дисперсия:

Таблица

Средняя списочная численность работников, чел

Выпуск продукции, млн руб.

Средняя списочная численность работников, чел

Выпуск продукции, млн руб.

Средняя списочная численность работников, чел

Выпуск продукции, млн руб.

Средняя списочная численность работников, чел

Выпуск продукции, млн руб.

Средняя списочная численность работников, чел

Выпуск продукции, млн руб.

110-130

14

16

130-150

27

49

150-170

30

121

170-190

55

1

190-210

61

81

18

0

30

16

36

25

52

4

71

1

22

16

40

36

36

25

53

1

69

1

Сумма

54

32

35

1

41

0

56

4

79

81

Среднее

18

38

16

42

1

57

9

Сумма

280

164

Сумма

170

118

34

49

51

9

Среднее

70

Среднее

34

43

4

Сумма

324

28

40

1

Среднее

54

42

1

41

0

47

36

60

361

Сумма

492

624

Среднее

41

Средняя из внутригрупповых составит:

Межгрупповая дисперсия:

Общая дисперсия:

Таблица

Расчетная таблица

№ предприятия п/п

Выпуск продукции, млн руб.

1

14

900

2

18

676

3

22

484

4

27

289

5

30

196

6

40

16

7

35

81

8

38

36

12

30

196

13

36

64

14

36

64

9

41

9

15

42

4

10

34

100

16

43

1

11

40

16

17

42

4

18

41

9

19

47

9

20

60

256

21

55

121

22

52

64

23

53

81

24

56

144

25

57

169

26

51

49

27

61

289

28

71

729

29

69

625

30

79

1225

Сумма

1320

6906

Проверим по правилу сложения дисперсий:

Расчеты дисперсий верны.

На основе рассчитанных дисперсий можно рассчитать эмпирический коэффициент детерминации:

Это означает что 86,0% вариации признака обусловлено фактором группировки.

Рассчитанное значение эмпирического корреляционного отношения свидетельствует о высокой статистической связи.

Оценим полученное уравнение на значимость рассчитав значение F-критерия Фишера:

Где m - число параметров.

Таблица

Расчетная таблица

№ предприятия п/п

Средняя списочная численность работников, чел.

Выпуск продукции, млн руб.

Теоретические значения результативной переменной, млн. руб.

Х

У

У теор

1

110

14

15,0

843,3

0,9

2

115

18

17,9

680,0

0,0

3

126

22

24,4

382,5

6,0

4

131

27

27,4

275,4

0,2

5

133

30

28,6

237,4

2,0

6

136

40

30,4

185,8

92,8

7

141

35

33,3

113,8

2,8

8

144

38

35,1

79,0

8,4

12

150

30

38,7

28,5

75,1

13

150

36

38,7

28,5

7,1

14

150

36

38,7

28,5

7,1

9

152

41

39,9

17,2

1,3

15

152

42

39,9

17,2

4,6

10

154

34

41,0

8,8

49,5

16

155

43

41,6

5,6

1,9

11

156

40

42,2

3,2

4,9

17

156

42

42,2

3,2

0,0

18

160

41

44,6

0,4

12,9

19

162

47

45,8

3,2

1,5

20

163

60

46,4

5,6

185,8

21

173

55

52,3

68,8

7,3

22

175

52

53,5

89,9

2,2

23

177

53

54,7

113,8

2,8

24

181

56

57,0

170,0

1,1

25

183

57

58,2

202,3

1,5

26

185

51

59,4

237,4

70,7

27

192

61

63,6

382,5

6,5

28

193

71

64,1

406,0

46,9

29

205

69

71,3

743,2

5,1

30

210

79

74,2

913,5

22,8

Сумма

4770

1320

1320,0

6274,3

631,7

Среднее

159

44

44,0

209,1

21,1

Где n - число наблюдений.

Таким образом, уравнение статистически значимо. Значение рассчитанного F-критерия и дисперсий совпали со значениями рассчитанными с помощью пакета "Анализ данных".

Задание 3

По результатам выполнения задания 1 с вероятностью 0,683 определите:

ошибку выборки средней списочной численности работников и границы, в которых будет находиться средняя списочная численность работников для предприятий в генеральной совокупности;

ошибку выборки доли предприятий со средней списочной численностью работников 170 и более человек и границы, в которых будет находиться генеральная доля.

Решение

Таблица

Исходные данные

№ группы

Средняя списочная численность работников, чел.

Число предприятий

1

110-130

3

2

130-150

5

3

150-170

12

4

170-190

6

5

190-210

4

Итого

30

В задании 1 были рассчитаны среднее значение по выборке:

Дисперсия:

Средняя списочную численность работников в генеральной совокупности может быть найден по формуле:

Где ДХ - предельная ошибка выборки

µX - средняя ошибка выборки

Для бесповторного отбора:

Для вероятности 0,683 t=1

Тогда с вероятностью 0,683 средняя списочная численность работников в генеральной совокупности составит

От: 162-3,7=158,3?158 человек

До: 162+3,7=165,7?166 человек.

Определим долю предприятий со средней списочной численностью работников 170 и более человек по выборке:

Доля таких предприятий в генеральной совокупности находиться в пределах:

Дисперсия доли:

Средняя ошибка:

Предельная ошибка доли:

Таким образом, доля предприятий со средней списочной численностью работников 170 и более человек в генеральной совокупности окажется в пределах

От: 0,333-0,077=0,256=25,6%

До: 0,333+0,077=0,410=41,0%

Задание 4

По материалам государственной статистики построить за последние пять лет ряд динамики, характеризующий изменение численности экономически активного населения на любом территориальном уровне. Ряд динамики представить в табличной и графической (в виде линейной диаграммы) форме.

На основе построенного ряда динамики определить:

    1. Показатели анализа ряда динамики (абсолютный прирост, темп роста, темп прироста, абсолютное содержание 1% прироста, средний уровень ряда, средний абсолютный прирост, средние темпы роста и прироста). Все расчеты представить в виде данных расчетной таблицы. Сделать выводы по рассчитанным показателям. Определить тенденцию развития исследуемого явления. 2. Построить уравнение тренда, определив теоретические значения уровня ряда динамики за каждый период, обосновать параметры уравнения тренда, определить точечный прогноз по исследуемому показателю.

Решение

Исходные данные возьмем на сайте федеральной службы государственной статистики, раздел:

Официальная статистика Рынок труда, занятость и заработная плата Трудовые ресурсы http://www. gks. ru/free_doc/new_site/population/trud/trud1.xls

Таблица

Численность экономически активного населения, тыс. человек

2010

2011

2012

2013

2014

Российская Федерация

75477,9

75779,0

75676,1

75528,9

75428,4

Представим ряд графически в виде линейной диаграммы.

численность экономически активного населения рф в 2010-1014 годах

Рисунок 5 - Численность экономически активного населения РФ в 2010-1014 годах

Расчет показателей динамики произведем по формулам:

Цепной абсолютный прирост:

Где - розничный товарооборот в i-год;

Розничный товарооборот в (i-1)-год.

Базисный абсолютный прирост:

Где - розничный товарооборот в базисный год.

Цепной темп роста:

Базисный темп роста:

Темп прироста:

Абсолютное содержание одного процента прироста:

Где - розничный товарооборот в (i-1)-год.

Расчеты произведем в таблице.

Таблица

Расчетная таблица

Годы

Численность ЭАН, тыс. чел.

Абсолютный прирост, тыс. руб.

Темп роста, %

Темп прироста, %

А%, тыс. чел.

Цепной

Базисный

Цепной

Базисный

Цепной

Базисный

2010

75477,9

-

-

-

-

-

-

-

2011

75779,0

301,1

301,1

100,40

100,40

0,40

0,40

754,8

2012

75676,1

-102,9

198,2

99,86

100,26

-0,14

0,26

757,8

2013

75528,9

-147,2

51,0

99,81

100,07

-0,19

0,07

756,8

2014

75428,4

-100,5

-49,5

99,87

99,93

-0,13

-0,07

755,3

Итого

377890,3

-49,5

-

-

-

-

-

-

За рассматриваемый период численность экономически активного населения сначала увеличилась, затем снижалась. В целом за рассматриваемый период она сократилась на 49,5 тысяч человек, что в относительном выражении составило 0,07%.

Среднегодовой уровень ряда найдем по формуле средней арифметической простой:

За период с 2010 по 2014 год численность экономически активного населения составляла в среднем 75578,1 тыс. человек ежегодно.

Среднегодовой абсолютный прирост:

В среднем ежегодно численность ЭАН снижалась на 12,4 тыс. человек.

Среднегодовой темп роста:

Средний темп прироста:

Это означает, что ежегодно численность экономически активного населения сокращалась в относительном выражении в среднем на 0,2%.

Построим линейное уравнение тренда. Уравнение линейного тренда в общем виде имеет вид:

Параметры уравнения найдем с помощью метода наименьших квадратов. Система нормальных уравнений МНК для определения параметров модели имеет вид:

Расчеты произведем в таблице.

Таблица

Расчетная таблица

Годы

Численность ЭАН, тыс. чел., y

T

T2

T*y

2010

75477,9

1

1

75477,9

2011

75779,0

2

4

151558,0

2012

75676,1

3

9

227028,2

2013

75528,9

4

16

302115,6

2014

75428,4

5

25

377142,0

Итого

377890,3

15

55

1133321,7

Уравнение тренда будет иметь вид:

Это означает, что ежегодно численность ЭАН снижается в среднем на 34,91 тыс. человек. Определим теоретические уровни ряда по полученному уравнению тренда.

Таблица

Теоретические и фактические уровни ряда

Годы

Фактическая численность ЭАН, тыс. чел.

Теоретические уровни ряда, тыс. чел.

2010

75477,9

75647,9

2011

75779,0

75613,0

2012

75676,1

75578,1

2013

75528,9

75543,1

2014

75428,4

75508,2

Итого

377890,3

377890,3

Построим точечный прогноз на 2015 год:

При сохранении сложившейся тенденции численность экономически активного населения в 2015 году составит 75473,3 тыс. человек.

Похожие статьи




Сводка и группировка статистических данных

Предыдущая | Следующая