Результаты и исследование эффективности - Использование нейронных сетей для прогнозирования и принятия автоматизированных решений при инвестировании на фондовом рынке
В данном разделе будут приведены основные результаты работы системы, реализованной на основе смоделированной нейронной сети, и проведен анализ качества предсказаний для выбранных в качестве объектов исследования биржевых инструментов. Критерием оценки точности прогнозирования является доля верно определенных направлений динамики изменения дневных котировок в процентном выражении. Данный подход обусловлен спецификой рассматриваемой задачи (анализ финансовых временных рядов), целью которой является максимизация прибыли (подробнее в главе 2).
В работе, в качестве входного эмпирического массива данных, использовались котировки акций, включенных в индекс РТС (здесь и далее в качестве обучающей и тестовой выборки использовались котировки биржевых активов в период с 01.01.2014 по 01.01.2016 и с 01.01.2016 по 15.05.2016 соответственно). Две ценные бумаги, эмитированные компаниями банковского сектора - Сбербанк и ВТБ - и два биржевых инструмента, представляющие нефтегазовую отрасль - Башнефть и Роснефть. Данный выбор обусловлен желанием не только провести анализ эффективности использования нейронных сетей для прогнозирования цен конкретных инструментов, но и попыткой обобщить полученные данные для отрасли, сектора экономики.
Первым этапом анализа является сравнение оценок качества адаптивных предсказаний многослойного перцептрона для каждого рассматриваемого инструмента, при условиях, что нейронная сеть обучалась на всем массиве данных (котировки всех четырех инструментов) и обучение производилось на "своих" (финансовый временной ряд данного инструмента) данных соответственно. В силу адаптивности нейромоделей, данный шаг логически обоснован.
Для получения результатов на данном этапе использовался трехслойный перцептрон с количеством нейронов во входном слое от 8 до 12 (далее [8; 12]), первом скрытом - [10; 15], втором скрытом - [10; 15], третьем скрытом - [8; 12] и в выходном - один нейрон, для определения вектора изменения цены. На данном этапе анализа на вход нейронной сети подавались данные после процедуры нормирования, описанной в главы 2 (то есть входные данные не обрабатывались дополнительно методом главных компонент). В качестве функции активации использовались обе, логистическая и гиперболического тангенса, а параметры "скорость обучения" и "момент" фиксировались со значениями 0.75 и 0.2 соответственно. В таблице 1 приведены полученные средние результаты, а так же разброс предсказаний.
Таблица 1. Сравнение результатов прогнозирования нейронной сети, в зависимости от обучающей выборки
Сбербанк |
ВТБ |
Башнефть |
Роснефть | |
Обучение на всем эмпирическом массиве данных(1) | ||||
Средний результат |
59,956% |
60,865% |
58,73% |
59,337% |
Разброс |
51,49% - 69,19% |
48% - 71,63% |
51,95% - 64,92% |
56,01% - 65, 37% |
Обучение на "своих" исторических данных (2) | ||||
Средний результат |
62,139% |
64,22% |
60,034% |
61,157% |
Разброс |
52,62% - 78,16% |
51,62% -81,46% |
56,34% - 68,92% |
52,64% - 72,36% |
Полученные результаты графически представлены на рисунках 11-14. В соответствии с заданными промежутками размеров слоев нейронной сети, было получено по 900 предсказаний для каждого инструмента при (1) и (2). Дабы графическое отображение имело смысл, полученные результаты группировались по 10 (по принципу ближайших) и на графике отмечалось среднее значение группы.
Основываясь на полученных результатах, был сделан вывод:
Вывод 1:
Искусственная нейронная сеть многослойный перцептрон с обратным распространением ошибки, в рамках задачи аппроксимации функции финансового временного ряда, показывает более высокое качество предсказания направления динамики изменения биржевой цены актива при обучении сети на исторических данных исключительно исследуемого инструмента, в сравнении с обучением на всем эмпирическом массиве (в рамках конкретного исследования) данных.
Таким образом, построенная модель эффективнее анализирует и прогнозирует изменения котировок инструмента тогда, когда "историческая информация", обучающая выборка, рассматривается вне контекста общей "информации" о рынке, отрасли, секторе. Еще один вывод, который необходимо сделать по результатам первого этапа исследования, связан с меньшей стабильностью предсказаний при (2):
Вывод 2:
Многослойный перцептрон, обучающийся на всем объеме эмпирический данных, аппроксимирует функцию финансового временного ряда биржевого инструмента с меньшей амплитудой флуктуаций качества, нежели при обучении на обособленных от рынка собственных данных.
Вывод 2, с технической точки зрения, является следствие преждевременного "сползания" сети, как функции нелинейного отображения множества относительных приращений цен на финансовые активы в единичный вектор направления динамики изменения этих цен, в локальный экстремум, что, в свою очередь, объясняется отсутствием полноты информации (общая проблема технического анализа) в обучающей выборке или/и сильной зашумленностью входных данных.
Следующий момент, который необходимо отметить, - адаптивные предсказания нейронной сети для биржевых инструментов, представляющих нефтегазовую отрасль, показывают большую стационарность в совокупности с меньшим качеством. По мнению автора, данный эффект связан с макроэкономическими процессами и институциональными изменениями в экономике России, которые имели место быть в течение исследуемого периода. Нефтегазовая отрасль, к которой относятся анализируемые инструменты "Башнефть" и "Роснефть", характеризовалась определенными тенденциями роста / падения на длительном промежутке времени, в то время как банковский сектор экономики РФ был подвержен сильным колебаниям как со стороны рынка, так и со стороны регулирующих данный сектор структур. Но в рамках данной работы, качественная интерпретация полученных результатов с экономической точки зрения находится вне обозначенного предмета исследования, поэтому вопрос остается открытым для обсуждения и не выносится в качестве вывода.
Основываясь на (В:1) и используя (В:2) в качестве допущения (так как, даже с учетом увеличения амплитуды колебания качества адаптивных предсказаний, результаты оказываются выше), в дальнейшем анализ эффективности нейронной сети и поиск оптимальной архитектуры будет проводиться при помощи (2), с последующей апробацией на других инструментах.
Как отмечалось выше, увеличение амплитуды колебания оценки качества адаптивных предсказаний может быть связано с наличием высокого уровня "шума" во входных данных, что ставит под сомнение релевантность используемой выборки. Таким образом, вторым этапом анализа эффективности работы многослойного перцептрона будет являться внедрение в модель метода предварительной обработки массива данных, основанного на методе выделения главных компонент, для повышения статистической значимости выборки. Параметры нейронной сети остаются прежними, как и на первом этапе анализа (количество нейронов во входном слое - [8; 12], первом скрытом - [10; 15], втором скрытом - [10; 15], третьем скрытом - [8; 12]; обе функции активации: логистическая и гиперболического тангенса; скорость обучения и величина момента - 0.75 и 0.2 соответственно). Полученные результаты приведены в таблице 2:
Таблица 2
Сбербанк |
ВТБ |
Башнефть |
Роснефть | |
Среднее значение (1 этап) |
62,139% |
64,22% |
60,034% |
61,157% |
Среднее значение (с предв. обработкой) |
66,056% |
67,187% |
65,702% |
65,34% |
Разброс (1 этап) |
52,62% - 78,16% |
51,62% -81,46% |
56,34% - 68,92% |
52,64% - 72,36% |
Разброс (с предв. обработкой) |
56,77% - 81,26% |
55,36% - 85,63% |
58,77% - 74,13% |
56,37% - 73,92% |
Как видно из таблицы: среднее значение оценки качества прогнозирования выросло для всех финансовых инструментов. Наибольшее увеличение, , было достигнуто для инструмента "Башнефть" - такой эффект дает право отнести данные о биржевых ценах актива к сильно зашумленным. Также важным моментом является "сдвиг" нижней границы (величина наихудшей оценки качества) в сторону увеличения для всех исследуемых инструментов. Следуют также отметить, что не было установлено корреляции между внедрением метода главных компонент и уменьшением / увеличением амплитуды колебаний оценок (разброс остался приблизительно на том же уровне). Таким образом, внедрение в модель механизма предварительной обработки входных данных являлось верным исследовательским шагом.
Вывод 3:
Предварительная обработка начальных входных данных позволяет повысить качество адаптивных предсказаний многослойного перцептрона, не влияя тенденциозно на величину "разброса" оценок.
На основании полученных положительных результатов на втором этапе исследования эффективности работы реализованной нейронной сети, на последующих этапах также будет использоваться предварительная обработка данных, основанная на методе главных компонент.
Начиная с третьего этапа, объектами анализа качества модели будут выступать архитектура и основные характеристики нейронной сети (количество слоев, количество нейронов в каждом из них, размер "скользящего окна", функция активации, скорость обучения).
Третий этап. На данном этапе будет проведена попытка выявить корреляцию (или установить ее отсутствие) между ростом / снижением качества прогнозирования и количеством слоев в нейронной сети (остальные характеристики сети остаются прежними). Подобный шаг допустим вследствие подтверждения Гипотезы 2 (Глава 2). В таблице 3 приведены результаты для исследуемых инструментов:
Таблица 3
Сбербанк |
ВТБ |
Башнефть |
Роснефть | |
Однослойный перцептрон | ||||
Среднее значение |
58,638% |
53,783% |
60,164% |
61,01% |
Разброс |
48,21% - 66,71% |
43,64% - 75,28% |
53,89% - 69,14% |
52,73% - 78,26% |
Двухслойный перцептрон | ||||
Среднее значение |
63,327% |
61,934% |
63,207% |
61,93% |
Разброс |
51,69% - 76,31% |
50,26% - 79,21% |
59,08% - 70,96% |
56,37% - 71,63% |
Трехслойный перцептрон | ||||
Среднее значение |
66,056% |
67,187% |
65,702% |
65,34% |
Разброс |
56,77% - 81,26% |
55,36% - 85,63% |
58,77% - 74,13% |
56,37% - 73,92% |
Четырехслойный перцептрон | ||||
Среднее значение |
66,732% |
68,036% |
65,326% |
64,71% |
Разброс |
55,23% - 84,07% |
55,02% - 85,47% |
54,23% - 74,87% |
59,19% - 72,43% |
Пятислойный перцептрон | ||||
Среднее значение |
64,962% |
68,739% |
65,187% |
67,04% |
Разброс |
59,16% - 80,92% |
54,27% - 87% |
60,64% - 78,16% |
53,98% - 84,36% |
Вывод 4:
Искусственная нейронная сеть многослойный перцептрон способна решать задачу прогнозирования финансовых временных рядов с различным уровнем качества, в зависимости от количества слоев (N) в архитектуре сети. Причем, для исследуемых инструментов, повышение N в промежутке [1; 3] приводит к увеличению качества адаптивных предсказаний (K). Корреляция между N и K, для N > 3, не установлена.
Вывод 4 может быть трансформирован и выражен в терминах необходимости / достаточности условий:
Вывод 4.1:
В рамках данного исследования, N > 2, где N - количество слоев многослойного перцептрона, является необходимым, но не достаточным, условием оптимальности (в том значении, которое определяется в данной работе) прогнозирования финансовых временных рядов (В:4.1).
На основании (В:4) и (В:4.1), весь остальной анализ будет проводится с использованием трехслойного перцептрона.
Четвертый этап. На данном этапе анализируется степень влияния выбора активационной функции на качество полученных результатов. Полученные результаты представлены в таблице 4:
Таблица 4
Сбербанк |
ВТБ |
Башнефть |
Роснефть | |
Логистическая функция: | ||||
Среднее значение |
65,837% |
67,121% |
66,33% |
64,431% |
Разброс |
55,93% - 83,02% |
54,49% - 84,64% |
58,19% - 74,92% |
55,17% - 74,67% |
Функция гиперболического тангенса: | ||||
Среднее значение |
66,382% |
67,307% |
64,921% |
65,983% |
Разброс |
56,32% - 80,67% |
52,46% - 86,91% |
58,83% - 74,08% |
57,39% - 73,72% |
Формальный вывод на данном этапе: использование функции гиперболического тангенса повышает качество предсказаний нейронной сети для трех инструментов из четырех и только для инструмента "Башнефть" предпочтительнее использовать логистическую функцию активации. Однако стоит отметить, что разница в качестве является сравнительно небольшой и, что более важно, может быть вызвана некоторыми "выбросами" статистики (так как сеть работает с конкретными инструментами, анализируя данные определенного интервала). С учетом вышесказанного, а также принимая во внимание ограниченную выборку анализируемых объектов (биржевых инструментов), по итогам четвертого этапа анализа был сделан вывод:
Вывод 5:
Ни одна из рассматриваемых в данном исследовании функций активаций нейрона не может быть определена как мажоранта. Следовательно, для предотвращения потери качества прогнозирования, необходимо использовать несколько функций активации с последующим выбором "лучшей" для данной конкретной задачи (инструмент, анализируемый на определенном интервале).
Принимая во внимание вывод 5, но основываясь на базовой цели данного исследования - анализ и выявление общей взаимосвязи между характеристиками построенной модели и качеством предсказаний - на этапе анализа длины "скользящего окна", в качестве функции активация нейрона будет использоваться "лучшая" для данного инструмента (Сбербанк, ВТБ, Роснефть - функция гиперболического тангенса; Башнефть - логистическая функция).
Пятый этап. На всех предшествующих этапах анализа эффективности работы многослойного перцептрона размер "скользящего окна" (размер массива данных, которые подаются на вход нейронной сети) не был фиксирован, а изменялся в соответствии с указанным промежутком. Но, в рамках данного исследования, необходимо установить оптимальный размер окна для каждого из анализируемых инструментов.
Анализ взаимосвязи между "длиной" входных данных и точностью прогноза для каждой из четырех акций позволил сделать следующий вывод:
Вывод 6:
В рамках данного исследования было установлено, что существует корреляция между размером входных данных для нейронной сети и величиной качества прогнозирования. Причем, для всех финансово-биржевых инструментов наблюдается одинаковая тенденция роста / снижения точности прогноза на всех участках изменения размера "скользящего окна".
Вывод 7:
Искусственная нейронная сеть многослойный перцептрон способна эффективно аппроксимировать функцию финансово-временного ряда при условии, что вектор входных данных в процессе обучения имеет размерность (W) не менее 5. Корреляция между точностью прогноза (K) и длиной "скользящего окна" для W > 5 не установлена. Но в рамках данного исследования было выявлено, что K не является значимо чувствительным к дальнейшему увеличению W.
Таким образом, в данной главе были выявлены оптимальные, в рамках исследования, характеристики нейронной сети, методов предварительной обработки входных данных, а также метода формирования обучающей выборки для каждого финансово-биржевого инструмента:
Таблица 5
Сбербанк |
ВТБ |
Башнефть |
Роснефть | |
Количество слоев в сети |
4 |
5 |
3 |
4 |
Эмпирический массив данных для обучения |
Финансово-временной ряд непосредственно данного биржевого инструмента | |||
Метод предварительной обработки данных |
Метод главных компонент | |||
Метод формирования обучающей выборки |
Метод "скользящего окна" | |||
Размерность вектора входных данных (размер окна) |
5 | |||
Число нейронов в первом скрытом слое |
8 |
10 |
8 |
14 |
Число нейронов во втором скрытом слое |
16 |
12 |
9 |
15 |
Число нейронов в третьем скрытом слое |
15 |
14 |
7 |
11 |
Число нейронов в четвертом скрытом слое |
6 |
8 |
- |
8 |
Число нейронов в пятом скрытом слое |
- |
- |
- |
- |
Функция активации нейронов |
Th(x)* |
Th(x) |
Lgc(X) |
Th(x) |
Лучшее качество прогноза |
84,07% |
87% |
74,92% |
84,36% |
* где th(x) - функция гиперболического тангенса; lgc(x) - логистическая функция
Похожие статьи
-
В работе рассматривался один из возможных подходов к решению задачи анализа и прогнозирования фондового рынка - нейросетевой. Было установлено, что...
-
В данной главе рассмотрены все этапы построения конкретной нейросетевой модели для анализа и прогнозирования цен на акции эмитентов, входящих в индекс...
-
Источник и формат входных данных В качестве объектов нейросетевого анализа были выбраны следующие акции, входящие в индекс РТС: - Сбербанк - ВТБ -...
-
В условиях глобализации мировой экономики развитие финансовой системы является важнейшей задачей, решение которой способно обеспечить стабильный рост...
-
В работе рассматривается математическая модель нейронной сети многослойный персептрон. Являясь обобщением однослойного персептрона, данная модель...
-
Преимущество нейросетевого моделирования, как инструмента анализа и исследования, заключается в построении параллельных процессов обработки информации и...
-
В данной главе приведено теоретическое обоснование исследования: описаны предпосылки для формирования подхода, основанного на нейросетевом моделировании,...
-
Предпосылки В данной работе, в соответствии с заявленным предметом исследования, рассматриваются искусственные нейронные сети, математические модели,...
-
Реализация Реализация системы для анализа эффективности работы искусственной нейронной сети многослойны перцептрон при решении задачи прогнозирования...
-
1. Абдуллин А. Р., Фаррахетдинова А. Р. Гипотеза эффективности рынка в свете теории финансов // Электронный научный журнал "Управление экономическими...
-
Анализ эффективности модели на реальных данных Перед выявлением наилучшего набора параметров можно выдвинуть гипотезу о том, что существует несколько...
-
Для того, чтобы рассмотреть, как модель ведет себя в различных ситуациях, было выбрано несколько акций и индексов, которые вели себя по-разному с течение...
-
В Главе 1 мы подробно рассмотрим основные теоретические аспекты, связанные с исследованием влияния макроэкономических шоков в одной стране на поведение...
-
Как уже говорилось в ч.1 данной работы, отзывы лицензий банков не всегда связаны с реальным негативным финансовым положением банка, а могут быть вызваны...
-
В результате статистического анализа и анализа значимости факторов, предложенных для использования в модели, предлагается использовать 2 дискриминирующие...
-
Устойчивость банковской системы является необходимым условием для обеспечения экономического роста страны. Во время финансового кризиса 2008-2009гг....
-
В данной главе рассматривается методология исследования. В начале главы приведены и описаны макроэкономические индикаторы, публикации которых будут...
-
Скрытый марковский процесс Скрытый марковский процесс является удобным средством для моделирования динамичных процессов, из-за чего его можно эффективно...
-
Считается, что впервые современный алгоритм событийного анализа был представлен в работе Fama, Fisher, Jensen, Roll (1969) [31] на примере дробления...
-
Для начала стоит сказать, что выборки по котировкам акций Apple, Google и индексов NASDAQ и S&;P500 были практически одинаковы за исключением Google,...
-
Теперь, когда все нюансы упомянуты, следует перейти к стандартным факторам эффективности, которые интересуют исследователей. Будем касаться каждого из...
-
Заключение - Влияние новостных шоков на фондовый рынок
В данной работе было исследовано влияние новостных шоков на фондовый рынок. В последнее время в зарубежной литературе появляется все больше научных работ...
-
Применение множественного дискриминантного анализа для моделирования банкротств Дискриминантный анализ - один из методов многомерного статистического...
-
Интервал данных - Влияние новостных шоков на фондовый рынок
Анализ реакции рынка на новостные шоки может проводиться на различных временных интервалах - с использованием высокочастотных (от минут до дней) или...
-
Введение - Влияние новостных шоков на фондовый рынок
Регулярные извещения о показателях макроэкономических индикаторов пользуются большим интересом, как в финансовой прессе, так и в академической...
-
Итак, были проведены тесты на fixed, random и pool регрессии. По итогам проведенных процедур предпочтение и в одном и во втором периоде было отдано...
-
Нередко можно услышать мнение, что знание фундаментального анализа требуется только для долгосрочных инвесторов15. При этом высказываются аргументы вроде...
-
Введение - Управление портфелем при помощи стратегии ребалансировки
Со времен первых комплексных методов портфельного управления ценными бумагами, предложенных Г. Марковицем, было выявлено множество белых пятен. В...
-
Заключение - Понятие ковенантов и их применимость на финансовом рынке
В данной работе был проведен комплексный анализ по изучению факторов, влияющих на спрэд доходности банковских облигаций, на основе собранных данных по...
-
Перед тем, как непосредственно рассчитать значения показателей банковской деятельности, используя "стрессовые" значения макроэкономических переменных,...
-
В качестве базы данных для исследования использовалась система Mobile. Период исследования, как следует из названия работы, разбит на два и каждый из них...
-
Стационарное распределение - Применение скрытого марковского процесса для прогноза на фондовом рынке
Сравнение эффективности стационарного распределения для репрезентативности предлагается провести на всех скользящих периодах для каждой бумаги при...
-
Введение - Применение скрытого марковского процесса для прогноза на фондовом рынке
С целью прогнозирования ценовых процессов на фондовом рынке на данный момент выведено большое количество теорий. Значительная часть из них представляет...
-
Торговые стратегии на фондовом рынке Торговая стратегия или торговая система - это перечень предписаний на открытие и закрытие торговых позиций, на...
-
Изучение влияния макроэкономических шоков в одной стране на фондовые рынки других стран является важнейшим аспектом оценки интегрированности мировых...
-
Введение - Проблемы и перспективы российского фондового рынка
Возрастающий интерес к статистике вызван современным этапом развития экономики в стране, формирования рыночных отношений. Это требует глубоких...
-
Стратегии скользящей средней и разрыва линии рынка - Стратегии торговли на фондовой бирже
Рассмотрим следующую инвестиционную стратегию: Рассчитываем среднюю цену закрытия данной акции за последние 200 торговых дней. Делим цену закрытия на...
-
Одним из первых научных трудов, в котором начало фигурировать понятие ковенантов касательно их применимости к облигационным займам, была статья Smith,...
-
Эффективность функционирования любого предприятия (фирмы) зависит от его способности приносить необходимую прибыль. Оценить эту способность позволяет...
-
Результаты дискриминантного анализа общей совокупности банков Рассмотрим результаты моделирования (Приложение 3): 1. За 0,5 года до дефолта По...
Результаты и исследование эффективности - Использование нейронных сетей для прогнозирования и принятия автоматизированных решений при инвестировании на фондовом рынке