Заключение - Создание модели хранилища данных

В проделанной работе были продемонстрированы навыки владения основными понятиями и методами, связанными с концепцией хранилищ данных (ETL, BI, data mining). Также было показано умение собирать данные и моделировать данные на основе реальной информации. При анализе данных было отмечено, что смоделированные данные в целом отражают реальные события, произошедшие в экономике России (например, кризис 2008 года).

В работе был решен ряд задач и были найдены ответы на ряд важных вопросов, касающихся авиатранспортной отрасли России, например:

    - Какую долю в общем авиатранспортном потоке по стране занимает трафик через московский транспортный узел? Какая динамика изменения этой доли прослеживается в период с 2005 по 2012 год? - В каком направлении и какими темпами будет развиваться авиатранспортная отрасль России в разрезе объемов авиаперевозок? - Как можно оптимизировать авиатранспортную сеть России? Какие аэропорты необходимо развивать, чтобы разгрузить московский транспортный узел, тем самым уменьшив степень централизации авиатранспортной системы страны?

Результаты реализации средств интеллектуального анализа данных, которые одновременно являются ответами на приведенные выше вопросы, следующие:

    - Во вводной части работы был выполнен комплексный обзор проблемы, из которого видно, что авиатранспортная система России представляет собой централизованную несбалансированную структуру с центром в московском транспортном узле. Разработанная система анализа позволяет уточнить конкретную долю московского региона в общем объеме перевозок по стране во временном разрезе. В третьей главе на рисунке 19 представлена динамика изменения данного показателя. В среднем, в период с 2005 года по 2012 год доля московского транспортного узла, судя по смоделированным данным, выросла с 20,9% до 22,1%. Этот результат говорит о том, что авиатранспортная система стала еще более централизованной и несбалансированной за указанный период. - Динамика развития авиатранспортных потоков -- это очень актуальный вопрос, которому посвящены многие коммерческие и государственные исследования. По прогнозам можно заранее определить вектор последующего развития отрасли. В данной работе стояла задача спрогнозировать объемы авиаперевозок до 2020 года. Для прогнозирования объемов авиаперевозок использовалась модель data mining, которая предсказала 4-х кратный рост данного показателя к 2020 году относительно 2005 года. - Оптимизация авиатранспортной сети России -- это очень важный вопрос, который рассматривают как государственные органы и коммерческие организации, так и академическая среда. Реструктуризация отрасли может в лучшую сторону повлиять на более сбалансированное экономическое развитие российских регионов. Одним из вариантов реструктуризации структуры аэропортовой сети является создание нескольких транспортных узлов (хабов), которые будут равномерно расположены по территории всей страны. Эти узлы помогли бы снять большую часть нагрузки с московского транспортного узла, а также развитие этих узлов повлекло бы за собой развитие регионов, в которых эти узлы находятся. Разработанная система анализа с помощью алгоритма кластеризации выделила 6 регионов, которые потенциально предрасположены к развитию на них транспортных хабов. Результаты, полученные на этом этапе, представлены в таблице 9 и на иллюстрации 22.

В итоге можно утверждать, что основная цель работы, а именно: построение хранилища данных для анализа авиаперевозок на территории России, - достигнута. Применение разработанного инструмента показало корректные и адекватные результаты, по которым возможно сделать прогнозы и выдвинуть некоторые предложения по развитию структуры авиатранспортной системы России. Но, нельзя также забывать, что система была применена к модельным данным. То есть полученные выводы содержат только лишь верное направление. Применение инструмента к реальным данным показало бы более точные и правдоподобные результаты, которые могли бы реально быть использованы на практике.

Также нужно отметить, что система разработана с возможностью дальнейшего развития функциональности. Данные могут быть рассмотрены в двух дополнительных разрезах (что не было сделано в данной работе), а именно: в разрезе авиакомпаний и в разрезе видов авиаперевозок (пассажирские, грузовые, почтовые). Это позволит более детально проанализировать авиатранспортную отрасль для решения некоторых аналитических задач, отличных от задач, решаемых в данной работе.

Похожие статьи




Заключение - Создание модели хранилища данных

Предыдущая | Следующая