Основные характеристика нейронных сетей как инструмента для решения задач прогнозирования на финансовом рынке. - Использование нейронных сетей для прогнозирования и принятия автоматизированных решений при инвестировании на фондовом рынке

Преимущество нейросетевого моделирования, как инструмента анализа и исследования, заключается в построении параллельных процессов обработки информации и возможности искусственных нейронных сетей самообучаться. Подобные характеристики приобретают особое значение при решении задач, находящихся в фокусе данной работы. Поэтому, необходимо более детально рассмотреть все "полезные" для нас свойства моделей, основанных на искусственных нейронных сетях[36]:

    - Нелинейность. Важнейшее свойство искусственных нейронных сетей, в силу специфики нелинейности - она является распределенной по сети. Попытка имитации нелинейных физических механизмов, к коим, безусловно, относится механизм ценообразования на фондовом рынке, предполагает нелинейность модели, которую и могут обеспечить нейронные сети. В этом и заключается главное преимущество данного подхода по сравнению с классическими методами анализа (например эконометрические модели). Конечно, в случае если элементы сети, нейроны, являются линейными, то и сеть будет являться линейной. Но в данной работе рассматривается нелинейно-распределенная искусственная нейронная сеть - многослойный перцептрон прямого распространения (подробнее в Главе 2). - Адаптивность. Любая нейронная сеть умеет адаптироваться в "новой среде", подстраиваясь под изменения при помощи настройки синаптических весов между нейронами. Данное свойство дает возможность использовать системы, базирующиеся на нейросетях, в нейстационарных, то есть динамических, средах. Данное исследование основывается на отвержении гипотезы (0) о том, что рынок является информационно-эффективным. Следовательно, для анализа фондового рынка, сложной самоорганизующейся динамической системы, адаптивность искусственных нейронных сетей является первоочередным. - Отсутствие априорных наблюдений (обучение "с нуля"). Моделирование механизмов ценообразования на фондовом рынке с привлечением априорных эмпирических наблюдений отдаляет данный подход от чисто технического. Искусственные нейронные сети позволяют строить модели, которые обучаются "с нуля" (то есть без привлечения априорных соображений!). Данное свойство обеспечивается за счет возможности прямого отображения входных данных в выходные при обучении. Аналогией подобного метода в статистике является непараметрическое обучение, то есть обучение, не основанное на конкретной модели вероятностного распределения. В подобной парадигме производится обучение нейросетей "с учителем". Как уже отмечалось ранее, данное свойство является очень важным для институциональных инвесторов, прибегающих к техническому анализу рынков при помощи нейросетевых моделей. - Единообразие и гибкость. Искусственные нейронные сети являются универсальным и очень гибким инструментом для анализа. Во-первых, все сети состоят из элементарных частиц - нейронов. Во-вторых, архитектуры нейронных сетей, в рамках класса решаемых задач, во многом схожи, что позволяет быстро модифицировать инструмент. И в-третьих, особенностью искусственных нейронных сетей является модульность, то есть, существуют возможность интеграции одной сети в другую.

Принципы построения искусственных нейронных сетей прямого распространения.

Первым этапом работы с искусственными нейронными сетями является определение типа архитектуры сети (конструкция узлов и связей между ними). Саймон Хайкин выделяет три фундаментальных класс архитектур нейронных сетей: однослойные и многослойные сети прямого распространения, а также рекуррентные сети[36]. В данной работе для решения задачи анализа и прогнозирования финансовых временных рядов будет использоваться нейронная сеть с типом архитектуры - многослойная сеть прямого распространения. На рисунке 2 представлена структура такой сети.

Рис. 2

Данное понятие, архитектура сети, не может рассматриваться вне разреза используемых алгоритмов обучения. Многослойная сеть прямого распространения в качестве алгоритма обучения использует "алгоритм обратного распространения ошибки". То есть, для сетей такого типа характерна прямая передача сигналов между слоями - от входного к первому скрытому, от первого скрытого ко второму и так далее - и обратная передача значений ошибки сети. На рисунке 3 представлена сеть с одним скрытым слоем и показано, каким образом происходит распространение ошибки:

Рис. 3.

Здесь

Также следует отметить, что нейроны скрытых слоев, а также выходные нейроны для сетей прямого распространения являются сумматорами "силы" потоков из предыдущего слоя. Под "силой" потока понимается степень влияния связанного нейрона, от которого поступает сигнал, на данный. Формальное определение функциональности нейрона описывается следующим образом (и проиллюстрировано на Рис. 4):

Где n - число входов нейрона; - значение i-го входа нейрона; - вес i-го синапса.

Рис. 4

Как видно из рисунка 4, для построения полноценной сети также требуется выбрать функцию активации нейрона f(u). Существуют несколько видов функций, которые широко применяются при построении сетей прямого распространения. Простейшей такой функцией является пороговая функция, которая принимает значение 1, активно, когда сумма входных сигналов для нейрона превышает заданный порог, и 0, неактивно, в противном случае. Но подобного рода функцию невозможно применять, в качестве активационной для нейрона, при обучении сети при помощи алгоритма "обратного распространения ошибки" (которой рассматривается в качестве основного для данной работы), так как она не является дифференцируемой. Ниже приведены функции, удовлетворяющие требованиям дифференциации, и, соответственно, могут применяться при построении искусственной нейронной сети прямого распространения с алгоритмом обучения, основанном на обратном распространении ошибки (подробно о выборе функции активации для рассматриваемой в работе модели см. Глава 2):

- Экспоненциальная функция

Где А - параметр, который может выбираться при начальном построении сети для оптимизации работы сети с конкретными входными данными.

- Логистическая

Где параметр t, величина крутизны логистической функции, выбирается произвольным образом, в зависимости от решаемой задачи. Достоинством данной функции является достаточна простая дифференциация. Стоит также отметить, что при логистическая функция активации вырождается в пороговую.

- Гиперболический тангенс

Главным отличием данной функции от логистической является смещенная область значений. Область значений гиперболического тангенса - (-1; 1), логистической функции - (0; 1).

Похожие статьи




Основные характеристика нейронных сетей как инструмента для решения задач прогнозирования на финансовом рынке. - Использование нейронных сетей для прогнозирования и принятия автоматизированных решений при инвестировании на фондовом рынке

Предыдущая | Следующая