Статистическая обработка исходных данных - Проектирование автоматизированной системы резервирования мест и продажи билетов на автовокзале

Так как объем статистической выборки достаточно велик (n=365), статистическая обработка осуществляется с помощью метода группирования.

Одним из возможных алгоритмов расчета характеристик эмпирического распределения непрерывной случайной величины является следующий:

1) найти минимальное и максимальное значения случайной величины и размах варьирования

XР= XMax - XMin; (2.1)

XР= 9992 - 1569 = 8423 т.

2) определить число интервалов N разбиения случайной величины. Количество рядов, на которые разделяется выборка определяется по формуле Стерджесса:

NП = 1 + 3,32 * lg n; (2.2)

Где n - размер выборки случайной величины;

N = max(NП;5), (2.3)

NП = 1 + 3,32 * lg 365 = 9.51.

Количество разрядов принимается равным 9.

N = max(9;5)=9.

3) рассчитать длину интервала h

H = XР / N; (2.4)

H = 8423 / 9 = 935,89.

Длина разряда принимается равной 936.

4) определить границы XJ (верхнюю), XJ-1(нижнюю) и середину XСj j-го интервала случайной величины (j=1...N)

XJ = XMin + jh; (2.5)

XJ-1 = XMin + (j - 1)h; (2.6)

XСj = (XJ-1 + XJ)/2. (2.7)

Определяется середина первого интервала, а так же его верхняя и нижняя граница:

XJ = 1569 + 1*936 = 2505; XJ-1 = 1569 + (1 - 1)936 = 1569;

XСj = (1569 + 2505)/2 = 2037.

Для остальных интервалов расчет сведен в таблицу 2.1.

Таблица 2.1 Расчет границ и середин интервалов распределения случайной величины

Интервал j	Граница	Середина Xсj
Верхняя Xj	Нижняя Xj-1
1	2505	1569	2037
2	3441	2505	2973
3	4377	3441	3909
4	5313	4377	4875
5	6249	5313	5781
6	7185	6249	6717
7	8121	7185	7653
8	9057	8121	8589
9	9993	9057	9525

5) подсчитать число попаданий случайной величины в каждый j-й интервал (частоты MJ), для чего пересмотреть все числа xI (i = 1...n) относительно границ интервалов

MJ = MJ + 1 , если XJ-1 ? хI < XJ при j = 1...N-1;

MJ = MJ + 1 , если XJ-1 ? хI ? XJ при j = 1...N;

6) определить частости (эмпирические вероятности) рЭj появления значений случайной величины в каждом из интервалов путем деления соответствующих частот на объем выборки n, т. е. рЭj = MJ / n. Сумма всех частот равна объему выборки

(2.8)

А сумма частостей рЭj соответственно равна единице.

Частоты и частости появления значений случайной величины в каждом из интервалов представлены в таблице 2.2.

Таблица 2.2 Частоты и частости появления значений случайной величины в каждом из интервалов

Номер интервала j	Частоты Mj	Частости рэj
1	10	0,0274
2	46	0,1260
3	93	0,2548
4	113	0,3096
5	69	0,1890
6	26	0,0712
7	6	0,0164
8	1	0,0027
9	1	0,0027
Сумма	365	1

В) построить гистограмму или полигон эмпирического распределения.

С этой целью строят график, на котором по оси Х откладывают границы интервалов значений случайной величины. На каждом из интервалов строится прямоугольник, высота которого равна частному от деления частости данного интервала на величину интервала:

FЭj = рЭj / h, (2.9)

Где fЭj - эмпирическая функция плотности вероятности.

Полигон строится также по значениям fЭj, но на серединах интервалов в виде ломаной линии.

Рисунок 2.1 Гистограмма эмпирического распределения суточных объемов перевозок

Г) определить значения функции распределения и построить для нее график

При этом FЭ0 = 0 (j=0).

Рисунок 2.2 Полигон эмпирического распределения

Д) определить числовые характеристики выборки: начальные µK и центральные статистические µCk моменты k-го порядка и рассчитываемые через них параметры (оценка среднего арифметического xM, выборочная дисперсия s2, среднеквадратическое отклонение s, коэффициент вариации V, асимметрия А и эксцесс Е)

Или ; (2.11)

XМ= µ1 ; (2.12)

Или ; (2.13)

S2 = kCµCk; (2.14)

S = ; (2.15)

V = s/ xМ. (2.16)

Статистические характеристики выборки представлены в таблице 2.3.

Таблица 2.3 Статистические характеристики выборки

Показатель	Значение
Медиана	4670
Мода	4726
Стандартное отклонение	1177,97
Дисперсия выборки	1387610
Эксцесс	0,844
Минимум	1569
Максимум	9992
Сумма	1684220
Размах выборки	365
Ассиметричность	0,317

Гипотеза о законе распределения исследуемой случайной величины выдвигается на основании учета следующих данных:

Условия и факторы, влияющие на процесс формирования значений случайной величины; форма гистограммы (полигона); значения коэффициента вариации V.

Исходя из формы гистограммы, а также из того, коэффициент вариации равен 0,115, можно выдвинуть гипотезу о том, что распределение посуточного объема перевозки подчиняется нормальному закону.

Для выбранного закона распределения необходимо определить значения его параметров, записать выражения для функции плотности вероятности и функции распределения исследуемой величины. Плотность вероятности в данном случае рассчитывается по следующей формуле:

. (2.17)

Функция распределения случайной величины по нормальному закону выглядит следующим образом:

. (2.18)

Эмпирическая и теоретическая кривые распределения представлены на рисунке 2.4 и 2.5.

Рисунок 2.4 Теоретическая кривая распределения

Плотность вероятности рассчитывается по следующей формуле:

Оценка согласованности теоретического и эмпирического распределений может производиться по критерию Пирсона.

Для этого вычисляют статистику хи-квадрат по формуле

, (2.19)

Где npJ - теоретическая частота попадания случайной величины в j-й интервал; N0 - число интервалов с учетом их объединения для расчета статистики критерия Пирсона.

Для расчета критерия Пирсона интервалы рекомендуется объединять на концах таким образом, чтобы MJ ?5 или npJ ?10. Однако число N0 не должно быть менее четырех. В соответствии с этим требованием для расчета критерия Пирсона интервалы объединяются следующим образом:

Таблица 2.4 Интервалы для расчета критерия Пирсона

Номер интервала	Диапозон	Частота
1	1569 - 2505	10
2	2505 - 3441	46
3	3441 - 4377	93
4	4377 - 5313	113
5	5313 - 6249	69
6	6249 - 7185	26
7	7185 - 9993	22

Вероятность pJ определяется по формуле:

PJ = Р(ХJ-1 < х < ХJ) = F(ХJ) - F(ХJ-1), (2.20)

Где F(х) - значение функции распределения в точке х.

PJ = - .

Расчет критерия Пирсона предстален в таблице 2.5.

Таблица 2.5 Расчет критерия Пирсона

Интервал	Частоты mJ	Частости wJ= mJ/nJ	PJ	NpJ	(mJ-npJ) 2/npJ
1569 - 2505	10	0,0274	0,0320	11,680	0,2416
2505 - 3441	46	0,1260	0,1230	44,895	0,0272
3441 - 4377	93	0,2548	0,2610	95,265	0,0539
4377 - 5313	113	0,3096	0,3030	110,595	0,0523
5313 - 6249	69	0,1890	0,1940	70,810	0,0463
6249 - 7185	26	0,0712	0,0680	24,820	0,0561
7185 - 9993	8	0,0219	0,0150	5,475	1,1645
Критерий Пирсона	1,6419

Полученное значение критерия сравнивается с табличным, которое находится в зависимости от доверительной вероятности и числа степеней свободы r.

Уровень значимости г представляет собой вероятность отклонения верной гипотезы. Проверку соответствия теоретического и эмпирического распределений рекомендуется проводить при г = 0,05 - 0,1. При больших значениях г выше требования к согласованности распределений.

Число степеней свободы определяется по формуле:

R = N0 - k - 1, (2.22)

Где N0 - число интервалов после объединения для расчета статистики критерия хи-квадрат;

K - число параметров рассматриваемой теоретической функции распределения.

R = 7 - 2 - 1 = 4.

При уровне значимости 0,05 и числе степеней свободы 4 табличное значение критерия Пирсона составляет 9,4877 , а расчетный - 1,6419, то есть гипотеза о том, что распределение посуточного объема перевозок подчиняется нормальному закону, верна.

Похожие статьи

Характеристика объекта проектирования - Проектирование автоматизированной системы резервирования мест и продажи билетов на автовокзале

Автовокзал - комплекс сооружений для обслуживания пассажиров междугородных и пригородных автобусных сообщений в больших городах на конечных пунктах...
Анализ места подключаемых систем в общей архитектуре серверов компании, Оценка проекта до изменений - Метод интеграции сторонних систем анализа и обработки данных в существующую ИС-архитектуру компании

В данном пункте представлено описание подключенных систем к общей инфраструктуре ИС компании. В случае IBM SPSS: Вследствие того, что сбор данных с...
Этапы проектирования баз данных, Структура автоматизированного банка данных - Автоматизированные системы обработки экономической информации

Этапы жизненного цикла БД включают: -Планирование БД - определяются принципы, задачи создания БД. -Проектирование БД. -Материализация БД -...
РАСЧЕТ ПАРАМЕТРОВ СВЕРТОЧНОГО КОДА, Исходные данные к курсовому проектированию, Расчет параметров - Разработка кодека сверточного кода с алгоритмом порогового декодирования

Исходные данные к курсовому проектированию Количество информационных символов k0 = 2 двоичных символа. Количество входов пороговых элементов - 2. Расчет...
Форма использования средств обработки данных - Автоматизированные системы обработки экономической информации

Наиболее распространенная форма - ЭВМ. Раньше чаще использовались вычислительные центры (ВЦ). Вычислительный центр - организуется и специализируется на...
Разработка структурной схемы проекта и структуры программного обеспечения, Проектирование базы данных - Разработка и тестирование автоматизированной системы контроля успеваемости студентов

При работе над проектом разрабатывались два основных компонента системы: база данных (далее - БД) и интерфейс клиентского приложения. Затем необходимо...
Выборка, Двухвыборочный z-тест для средних, Статистические функции - Инструменты пакета анализа в Microsoft Excel

Создает выборку из генеральной совокупности, рассматривая входной диапазон как генеральную совокупность. Если совокупность слишком велика для обработки...
Функции рабочего листа статистические. Использование Мастера функций - Автоматизация решения задач пользователя

Excel программирование статистический Статистические функции Применение статистических функций облегчает пользователю статистический анализ данных. Целый...
Операторы языка SQL - Основные понятия систем базы данных

SELECT служит для получения любого количества данных из одной или нескольких таблиц. В общем случае результатом выполнения предложения SELECT ЯВЛЯЕТСЯ...
Реализация БД, Создание таблиц базы данных в Database Desktop, Создание псевдонима в BDE Administrator - Автоматизация рабочего места кассира автовокзала

Создание таблиц базы данных в Database Desktop Database Desktop - это утилита, во многом похожая на Paradox, которая поставляется вместе с Delphi для...
ЗАДАЧИ ОПЕРАТИВНОГО УПРАВЛЕНИЯ РАБОТОЙ ПОДВИЖНОГО СОСТАВА НА МАРШРУТАХ - Автоматизированные системы обработки информации и управления на автомобильном транспорте

На каждом уровне управления имеются индивидуальные черты делового процесса принятия решений. Это напрямую относится к выработке решений в управленческих...
Типы и виды полей для ввода данных - Разработка автоматизированной системы учета материальных ценностей "АС УМЦ"

Типы полей ограничивают вводимую пользователем информацию по содержанию. В Системе используются следующие типы полей данных: Text . Поле ввода текста в...
Выбор средства разработки и системы управления базами данных - Разработка автоматизированной системы расписания занятий учебного заведения

Выбор системы управления базами данных является одним из важных этапов при разработке автоматизированной системы расписания занятий. Выбранный...
Системы автоматизированного проектирования - Теоретические основы информационных технологий

Близкими по своей структуре и функциям к системам автоматизации научных исследований оказываются системы автоматизированного проектирования (САПР). САПР...
Цель создания САПР - Состав систем автоматизированного проектирования

Под автоматизацией проектирования понимают систематическое применение ЭВМ в процессе проектирования при научно обоснованном распределении функций между...
Формирование выборки случайных чисел, распределенных по заданному закону распределения

Лабораторная работа Тема: Формирование выборки случайных чисел, распределенных по заданному закону распределения Цель: освоение методов генерации...
ПОДСИСТЕМЫ АСУ НА АВТОТРАНСПОРТНЫХ ПРЕДПРИЯТИЯХ, ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ, База данных как основа информационного обеспечения - Автоматизированные системы обработки информации и управления на автомобильном транспорте

ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ База данных как основа информационного обеспечения В состав информационного, программного и математического обеспечения...
ИСПОЛЬЗОВАНИЕ БАЗ ДАННЫХ И ИХ РЕДАКТИРОВАНИЕ В СИСТЕМАХ: ADEM, КОМПАС+ВЕРТИКАЛЬ И T-FLEX - Понятие о системах автоматизированного проектирования

Базы данных - это определенная совокупность информационных данных, отображающих в максимально возможной полноте состояние тех или иных объектов или...
Методы и средства проектирования - Автоматизированные системы обработки экономической информации

Проектирование - процесс создания проекта-прототипа, прообраза предполагаемого или возможного объекта, его состояния. Современная технология создания АИС...
Приложение, Распечатки экранов ПК, Контекстные диаграммы потоков данных, Отчеты АРМ "Отдел кадров", Инструкция пользователя АРМ "Отдел кадров", Рекламный проспект - Проектирование автоматизированного рабочего места работника отдела кадров

Распечатки экранов ПК Рис.5. Форма "Главное меню" Рис.6. Форма "Специальности" Рис.7. Форма "Личные карточки" Рис.8. Форма "Поощрения" Рис.9. Форма...
Форма использования средств обработки данных - История создания и развития автоматизированных информационных систем

Наиболее распространенная форма - ЭВМ. Раньше чаще использовались вычислительные центры (ВЦ). Вычислительный центр - организуется и специализируется на...
Проектирование базы данных - Проектирование автоматизированного рабочего места работника отдела кадров

Таблица 2. Структура записей таблицы "Специальности" № п/п Имя поля в таблице Тип данных Размер поля Ключевое поле 1 № специальности Числовой (INT)...
База данных - понятие и ее структурные единицы (см. пред. вопрос) - Автоматизированные системы обработки экономической информации

База данных представляет собой информационную модель того объекта (организации или предприятия), информация о котором требуется пользователю для...
Расчет затрат на создание программного обеспечения, цены и прибыли от его продажи - Проектирование автоматизированной информационной системы

Над созданием ИС "Учет посещаемости в детском саду" будет работать определенная группа разработчиков, состоящая из руководителя и инженера-программиста....
Способы обработки данных - Автоматизированные системы обработки экономической информации

Различаются следующие способы обработки данных: централизованная, децентрализованная, распределенная и интегрированная. Централизованная предполагает...
Проектирование структуры базы данных - Автоматизированное рабочее место медицинского работника дошкольного учреждения

Основным компонентом АРМ является база данных (БД). Использование БД является эффективным средством разработки и поддержки информационного обеспечения...
Средства обработки данных - Автоматизированные системы обработки экономической информации

Это компьютеры - 4 класса: микро, малые (мини); большие и суперЭВМ. Главные хар-ки ЭВМ - быстродействие и объем памяти. МикроЭВМ - 2 группы: 1....
Описание рабочих мест и выполняемых работ в различных отделах предприятия - Автоматизированные системы управления и обработки информации

Рабочее место -- это зона нахождения работника и средств приложения его труда, которая определяется на основе технических и эргономических нормативов и...
Проектирование, Логическая модель данных - Автоматизированное рабочее место менеджера салона красоты ЧУП "Александрия"

Логическая модель данных Логическая модель данных представлена сущностями (таблицами). Таблицы - фундаментальные объекты реляционной базы данных, в...
Типы данных и команды SQL - Разработка информационной системы "Магазин компьютерных товаров"

Microsoft SQL Server поддерживает большинство типов данных SQL 2003. Также SQL Server поддерживает дополнительные типы данных, используемые для...
Структура SQL - Банки и базы данных. Системы управления базами данных

Широкое развитие информационных систем и связанная с этим унифицированность информационного пространства привело к необходимости создания стандартного...
Анализ и выбор СУБД и среды программирования - Проектирование автоматизированной информационной системы

В настоящее время существует несколько видов СУБД. Для создания базы данных "Учет посещаемости в детском саду" была выбрана СУБД Paradox. Выбор...
ER-модель данных, Структура таблиц, Схемы работы модулей - Разработка автоматизированной системы учета материальных ценностей "АС УМЦ"

Модель сущность-связь представлена в приложении 1. Структура таблиц Следует отметить назначение полей, которые встречаются во всех таблицах: - id --...
КРИТЕРИИ КАЧЕСТВА ИНФОРМАЦИИ, ОЦЕНКА ИХ ВЛИЯНИЯ НА ПРИНЯТИЕ УПРАВЛЕНЧЕСКИХ РЕШЕНИЙ - Автоматизированные системы обработки информации и управления на автомобильном транспорте

Нет необходимости для детального рассмотрения предлагающихся разнообразных направлений классификации информации. Выделим только те признаки информации,...
ИНФОРМАЦИОННЫЕ ПОТРЕБНОСТИ ПОЛЬЗОВАТЕЛЕЙ - Автоматизированные системы обработки информации и управления на автомобильном транспорте

Значительное влияние на процесс дифференциации и интеграции управленческого труда оказывает возрастание сложности и масштабов решаемых управленческих...
Объектно-ориентированные СУБД. Параллельная обработка данных - Теория экономических информационных систем

Объектно-ориентированные СУБД Несмотря на большую популярность реляционных СУБД, развитие технологии появления данными на них не остановилось. Развитие...
Разработка физической модели АИС, Разработка интерфейса программы АИС - Проектирование автоматизированной информационной системы

Физическая модель базы данных определяет способ размещения данных в среде хранения и способ доступа к этим данным, которые поддерживаются на физическом...
ВЗАИМОДЕЙСТВИЕ С ГЛОБАЛЬНЫМИ ИНФОРМАЦИОННЫМИ СЕТЯМИ - Автоматизированные системы обработки информации и управления на автомобильном транспорте

В деятельности крупных фирм (в особенности транснациональных корпораций, представляющих собой комплексы большого числа взаимосвязанных и...
Экономическая выгода от внедрения - Разработка автоматизированной информационной системы для устранения различий в структурах баз данных разработчиков, при работе над общим проектом с использованием системы контроля версий

Для того чтобы оценить экономическую выгоду от внедрения АИС необходимо вычислить трудозатраты компании направленные непосредственно на реализацию...
ФУНКЦИИ, ХАРАКТЕРИСТИКИ И ПРИМЕРЫ CAE/CAD/CAM-СИСТЕМ - Понятие о системах автоматизированного проектирования

Функции CAD-систем в машиностроении подразделяют на функции двухмерного (2 D ) и трехмерного (3 D ) проектирования. К функциям 2 D Относятся черчение,...

Статистическая обработка исходных данных - Проектирование автоматизированной системы резервирования мест и продажи билетов на автовокзале

Предыдущая | Следующая