Результаты и исследование эффективности - Использование нейронных сетей для прогнозирования и принятия автоматизированных решений при инвестировании на фондовом рынке

В данном разделе будут приведены основные результаты работы системы, реализованной на основе смоделированной нейронной сети, и проведен анализ качества предсказаний для выбранных в качестве объектов исследования биржевых инструментов. Критерием оценки точности прогнозирования является доля верно определенных направлений динамики изменения дневных котировок в процентном выражении. Данный подход обусловлен спецификой рассматриваемой задачи (анализ финансовых временных рядов), целью которой является максимизация прибыли (подробнее в главе 2).

В работе, в качестве входного эмпирического массива данных, использовались котировки акций, включенных в индекс РТС (здесь и далее в качестве обучающей и тестовой выборки использовались котировки биржевых активов в период с 01.01.2014 по 01.01.2016 и с 01.01.2016 по 15.05.2016 соответственно). Две ценные бумаги, эмитированные компаниями банковского сектора - Сбербанк и ВТБ - и два биржевых инструмента, представляющие нефтегазовую отрасль - Башнефть и Роснефть. Данный выбор обусловлен желанием не только провести анализ эффективности использования нейронных сетей для прогнозирования цен конкретных инструментов, но и попыткой обобщить полученные данные для отрасли, сектора экономики.

Первым этапом анализа является сравнение оценок качества адаптивных предсказаний многослойного перцептрона для каждого рассматриваемого инструмента, при условиях, что нейронная сеть обучалась на всем массиве данных (котировки всех четырех инструментов) и обучение производилось на "своих" (финансовый временной ряд данного инструмента) данных соответственно. В силу адаптивности нейромоделей, данный шаг логически обоснован.

Для получения результатов на данном этапе использовался трехслойный перцептрон с количеством нейронов во входном слое от 8 до 12 (далее [8; 12]), первом скрытом - [10; 15], втором скрытом - [10; 15], третьем скрытом - [8; 12] и в выходном - один нейрон, для определения вектора изменения цены. На данном этапе анализа на вход нейронной сети подавались данные после процедуры нормирования, описанной в главы 2 (то есть входные данные не обрабатывались дополнительно методом главных компонент). В качестве функции активации использовались обе, логистическая и гиперболического тангенса, а параметры "скорость обучения" и "момент" фиксировались со значениями 0.75 и 0.2 соответственно. В таблице 1 приведены полученные средние результаты, а так же разброс предсказаний.

Таблица 1. Сравнение результатов прогнозирования нейронной сети, в зависимости от обучающей выборки

Сбербанк	ВТБ	Башнефть	Роснефть
Обучение на всем эмпирическом массиве данных(1)
Средний результат	59,956%	60,865%	58,73%	59,337%
Разброс	51,49% - 69,19%	48% - 71,63%	51,95% - 64,92%	56,01% - 65, 37%
Обучение на "своих" исторических данных (2)
Средний результат	62,139%	64,22%	60,034%	61,157%
Разброс	52,62% - 78,16%	51,62% -81,46%	56,34% - 68,92%	52,64% - 72,36%

Полученные результаты графически представлены на рисунках 11-14. В соответствии с заданными промежутками размеров слоев нейронной сети, было получено по 900 предсказаний для каждого инструмента при (1) и (2). Дабы графическое отображение имело смысл, полученные результаты группировались по 10 (по принципу ближайших) и на графике отмечалось среднее значение группы.

Основываясь на полученных результатах, был сделан вывод:

Вывод 1:

Искусственная нейронная сеть многослойный перцептрон с обратным распространением ошибки, в рамках задачи аппроксимации функции финансового временного ряда, показывает более высокое качество предсказания направления динамики изменения биржевой цены актива при обучении сети на исторических данных исключительно исследуемого инструмента, в сравнении с обучением на всем эмпирическом массиве (в рамках конкретного исследования) данных.

Таким образом, построенная модель эффективнее анализирует и прогнозирует изменения котировок инструмента тогда, когда "историческая информация", обучающая выборка, рассматривается вне контекста общей "информации" о рынке, отрасли, секторе. Еще один вывод, который необходимо сделать по результатам первого этапа исследования, связан с меньшей стабильностью предсказаний при (2):

Вывод 2:

Многослойный перцептрон, обучающийся на всем объеме эмпирический данных, аппроксимирует функцию финансового временного ряда биржевого инструмента с меньшей амплитудой флуктуаций качества, нежели при обучении на обособленных от рынка собственных данных.

Вывод 2, с технической точки зрения, является следствие преждевременного "сползания" сети, как функции нелинейного отображения множества относительных приращений цен на финансовые активы в единичный вектор направления динамики изменения этих цен, в локальный экстремум, что, в свою очередь, объясняется отсутствием полноты информации (общая проблема технического анализа) в обучающей выборке или/и сильной зашумленностью входных данных.

Следующий момент, который необходимо отметить, - адаптивные предсказания нейронной сети для биржевых инструментов, представляющих нефтегазовую отрасль, показывают большую стационарность в совокупности с меньшим качеством. По мнению автора, данный эффект связан с макроэкономическими процессами и институциональными изменениями в экономике России, которые имели место быть в течение исследуемого периода. Нефтегазовая отрасль, к которой относятся анализируемые инструменты "Башнефть" и "Роснефть", характеризовалась определенными тенденциями роста / падения на длительном промежутке времени, в то время как банковский сектор экономики РФ был подвержен сильным колебаниям как со стороны рынка, так и со стороны регулирующих данный сектор структур. Но в рамках данной работы, качественная интерпретация полученных результатов с экономической точки зрения находится вне обозначенного предмета исследования, поэтому вопрос остается открытым для обсуждения и не выносится в качестве вывода.

Основываясь на (В:1) и используя (В:2) в качестве допущения (так как, даже с учетом увеличения амплитуды колебания качества адаптивных предсказаний, результаты оказываются выше), в дальнейшем анализ эффективности нейронной сети и поиск оптимальной архитектуры будет проводиться при помощи (2), с последующей апробацией на других инструментах.

Как отмечалось выше, увеличение амплитуды колебания оценки качества адаптивных предсказаний может быть связано с наличием высокого уровня "шума" во входных данных, что ставит под сомнение релевантность используемой выборки. Таким образом, вторым этапом анализа эффективности работы многослойного перцептрона будет являться внедрение в модель метода предварительной обработки массива данных, основанного на методе выделения главных компонент, для повышения статистической значимости выборки. Параметры нейронной сети остаются прежними, как и на первом этапе анализа (количество нейронов во входном слое - [8; 12], первом скрытом - [10; 15], втором скрытом - [10; 15], третьем скрытом - [8; 12]; обе функции активации: логистическая и гиперболического тангенса; скорость обучения и величина момента - 0.75 и 0.2 соответственно). Полученные результаты приведены в таблице 2:

Таблица 2

Сбербанк	ВТБ	Башнефть	Роснефть
Среднее значение (1 этап)	62,139%	64,22%	60,034%	61,157%
Среднее значение (с предв. обработкой)	66,056%	67,187%	65,702%	65,34%
Разброс (1 этап)	52,62% - 78,16%	51,62% -81,46%	56,34% - 68,92%	52,64% - 72,36%
Разброс (с предв. обработкой)	56,77% - 81,26%	55,36% - 85,63%	58,77% - 74,13%	56,37% - 73,92%

Как видно из таблицы: среднее значение оценки качества прогнозирования выросло для всех финансовых инструментов. Наибольшее увеличение, , было достигнуто для инструмента "Башнефть" - такой эффект дает право отнести данные о биржевых ценах актива к сильно зашумленным. Также важным моментом является "сдвиг" нижней границы (величина наихудшей оценки качества) в сторону увеличения для всех исследуемых инструментов. Следуют также отметить, что не было установлено корреляции между внедрением метода главных компонент и уменьшением / увеличением амплитуды колебаний оценок (разброс остался приблизительно на том же уровне). Таким образом, внедрение в модель механизма предварительной обработки входных данных являлось верным исследовательским шагом.

Вывод 3:

Предварительная обработка начальных входных данных позволяет повысить качество адаптивных предсказаний многослойного перцептрона, не влияя тенденциозно на величину "разброса" оценок.

На основании полученных положительных результатов на втором этапе исследования эффективности работы реализованной нейронной сети, на последующих этапах также будет использоваться предварительная обработка данных, основанная на методе главных компонент.

Начиная с третьего этапа, объектами анализа качества модели будут выступать архитектура и основные характеристики нейронной сети (количество слоев, количество нейронов в каждом из них, размер "скользящего окна", функция активации, скорость обучения).

Третий этап. На данном этапе будет проведена попытка выявить корреляцию (или установить ее отсутствие) между ростом / снижением качества прогнозирования и количеством слоев в нейронной сети (остальные характеристики сети остаются прежними). Подобный шаг допустим вследствие подтверждения Гипотезы 2 (Глава 2). В таблице 3 приведены результаты для исследуемых инструментов:

Таблица 3

Сбербанк	ВТБ	Башнефть	Роснефть
Однослойный перцептрон
Среднее значение	58,638%	53,783%	60,164%	61,01%
Разброс	48,21% - 66,71%	43,64% - 75,28%	53,89% - 69,14%	52,73% - 78,26%
Двухслойный перцептрон
Среднее значение	63,327%	61,934%	63,207%	61,93%
Разброс	51,69% - 76,31%	50,26% - 79,21%	59,08% - 70,96%	56,37% - 71,63%
Трехслойный перцептрон
Среднее значение	66,056%	67,187%	65,702%	65,34%
Разброс	56,77% - 81,26%	55,36% - 85,63%	58,77% - 74,13%	56,37% - 73,92%
Четырехслойный перцептрон
Среднее значение	66,732%	68,036%	65,326%	64,71%
Разброс	55,23% - 84,07%	55,02% - 85,47%	54,23% - 74,87%	59,19% - 72,43%
Пятислойный перцептрон
Среднее значение	64,962%	68,739%	65,187%	67,04%
Разброс	59,16% - 80,92%	54,27% - 87%	60,64% - 78,16%	53,98% - 84,36%

Вывод 4:

Искусственная нейронная сеть многослойный перцептрон способна решать задачу прогнозирования финансовых временных рядов с различным уровнем качества, в зависимости от количества слоев (N) в архитектуре сети. Причем, для исследуемых инструментов, повышение N в промежутке [1; 3] приводит к увеличению качества адаптивных предсказаний (K). Корреляция между N и K, для N > 3, не установлена.

Вывод 4 может быть трансформирован и выражен в терминах необходимости / достаточности условий:

Вывод 4.1:

В рамках данного исследования, N > 2, где N - количество слоев многослойного перцептрона, является необходимым, но не достаточным, условием оптимальности (в том значении, которое определяется в данной работе) прогнозирования финансовых временных рядов (В:4.1).

На основании (В:4) и (В:4.1), весь остальной анализ будет проводится с использованием трехслойного перцептрона.

Четвертый этап. На данном этапе анализируется степень влияния выбора активационной функции на качество полученных результатов. Полученные результаты представлены в таблице 4:

Таблица 4

Сбербанк	ВТБ	Башнефть	Роснефть
Логистическая функция:
Среднее значение	65,837%	67,121%	66,33%	64,431%
Разброс	55,93% - 83,02%	54,49% - 84,64%	58,19% - 74,92%	55,17% - 74,67%
Функция гиперболического тангенса:
Среднее значение	66,382%	67,307%	64,921%	65,983%
Разброс	56,32% - 80,67%	52,46% - 86,91%	58,83% - 74,08%	57,39% - 73,72%

Формальный вывод на данном этапе: использование функции гиперболического тангенса повышает качество предсказаний нейронной сети для трех инструментов из четырех и только для инструмента "Башнефть" предпочтительнее использовать логистическую функцию активации. Однако стоит отметить, что разница в качестве является сравнительно небольшой и, что более важно, может быть вызвана некоторыми "выбросами" статистики (так как сеть работает с конкретными инструментами, анализируя данные определенного интервала). С учетом вышесказанного, а также принимая во внимание ограниченную выборку анализируемых объектов (биржевых инструментов), по итогам четвертого этапа анализа был сделан вывод:

Вывод 5:

Ни одна из рассматриваемых в данном исследовании функций активаций нейрона не может быть определена как мажоранта. Следовательно, для предотвращения потери качества прогнозирования, необходимо использовать несколько функций активации с последующим выбором "лучшей" для данной конкретной задачи (инструмент, анализируемый на определенном интервале).

Принимая во внимание вывод 5, но основываясь на базовой цели данного исследования - анализ и выявление общей взаимосвязи между характеристиками построенной модели и качеством предсказаний - на этапе анализа длины "скользящего окна", в качестве функции активация нейрона будет использоваться "лучшая" для данного инструмента (Сбербанк, ВТБ, Роснефть - функция гиперболического тангенса; Башнефть - логистическая функция).

Пятый этап. На всех предшествующих этапах анализа эффективности работы многослойного перцептрона размер "скользящего окна" (размер массива данных, которые подаются на вход нейронной сети) не был фиксирован, а изменялся в соответствии с указанным промежутком. Но, в рамках данного исследования, необходимо установить оптимальный размер окна для каждого из анализируемых инструментов.

Анализ взаимосвязи между "длиной" входных данных и точностью прогноза для каждой из четырех акций позволил сделать следующий вывод:

Вывод 6:

В рамках данного исследования было установлено, что существует корреляция между размером входных данных для нейронной сети и величиной качества прогнозирования. Причем, для всех финансово-биржевых инструментов наблюдается одинаковая тенденция роста / снижения точности прогноза на всех участках изменения размера "скользящего окна".

Вывод 7:

Искусственная нейронная сеть многослойный перцептрон способна эффективно аппроксимировать функцию финансово-временного ряда при условии, что вектор входных данных в процессе обучения имеет размерность (W) не менее 5. Корреляция между точностью прогноза (K) и длиной "скользящего окна" для W > 5 не установлена. Но в рамках данного исследования было выявлено, что K не является значимо чувствительным к дальнейшему увеличению W.

Таким образом, в данной главе были выявлены оптимальные, в рамках исследования, характеристики нейронной сети, методов предварительной обработки входных данных, а также метода формирования обучающей выборки для каждого финансово-биржевого инструмента:

Таблица 5

Сбербанк	ВТБ	Башнефть	Роснефть
Количество слоев в сети	4	5	3	4
Эмпирический массив данных для обучения	Финансово-временной ряд непосредственно данного биржевого инструмента
Метод предварительной обработки данных	Метод главных компонент
Метод формирования обучающей выборки	Метод "скользящего окна"
Размерность вектора входных данных (размер окна)	5
Число нейронов в первом скрытом слое	8	10	8	14
Число нейронов во втором скрытом слое	16	12	9	15
Число нейронов в третьем скрытом слое	15	14	7	11
Число нейронов в четвертом скрытом слое	6	8	-	8
Число нейронов в пятом скрытом слое	-	-	-	-
Функция активации нейронов	Th(x)*	Th(x)	Lgc(X)	Th(x)
Лучшее качество прогноза	84,07%	87%	74,92%	84,36%

* где th(x) - функция гиперболического тангенса; lgc(x) - логистическая функция

Похожие статьи