Выбор рассматриваемых котировок, Составные части состояний - Применение скрытого марковского процесса для прогноза на фондовом рынке

Для того, чтобы рассмотреть, как модель ведет себя в различных ситуациях, было выбрано несколько акций и индексов, которые вели себя по-разному с течение 10 лет. Также в основу выбора входил тот факт, что объем торгов по этим финансовым инструментам должен быть достаточно высок. S&;P500 - в среднем за 10 лет индекс менялся не очень и был значительный спад вначале и конце периода. Apple - очень значительный и, в целом, стабильный рост, хоть и с несколькими спадами. Google - большой рост с 2004 года, но достаточно нестабильный, что, скорее всего, связано с областью деятельности компании (Интернет). NASDAQ - его динамика в некоторой степени похожа на динамику S&;P500, но данный индекс упал за 10 лет.

Также стоит отметить тот факт, что за последние 2-3 года у них тоже наблюдалась различная динамика, что позволит сравнить эффективность моделей, которые обучаются и тестируются на схожих выборках.

Составные части состояний

Если немного отвлечься от практики, то можно рассматривать два типа определения состояния на финансовом рынке: непрерывный и дискретный. Первый вариант подразумевает выявление функции плотности распределения наблюдаемых величин. Как один из простых вариантов, можно использовать метод окон Парцена-Розенблатта.

Допустим, что эта функция построена и следующей проблемой становится определение границ состояний. Дискретный же случай позволяет сразу переходить к определению границ. Несмотря на этот факт, на основе функции плотности вероятности можно приблизительно посмотреть, каковы должны быть эти границы, хотя в случае большой обучаемой выборки график распределения может быть очень сильно похож на график нормального распределения и пользы от этого будет не очень много.

В целом, если использовать график функции плотности вероятности и искать на нем некоторые ключевые моменты - заметные изменения значений плотности, то это уже несколько упростит поиск оптимальных значений границ.

Теперь надо рассмотреть возможность состояний, которые определяются по нескольким бумагам или индексам. В данном случае возникает две проблемы:

    1) определение таких бумаг в функцию, которые не будут снижать эффективность модели. В качестве этого можно привести следующий пример: допустим, что две разные бумаги падают, тогда получается, что в среднем они упали и падение первой бумаги будет соответствовать среднему падению. Но если первая бумага упала, а вторая выросла, тогда среднее значение может оказаться как равным нулю, так и отличным от него. В данном случае падение первой бумаги может соответствовать не только падению среднего значения. В итоге получается так, что одно и то же изменение первой бумаги имеет вероятность появиться в минимум двух состояниях, что, скорее всего, снизит эффективность модели 2) Вторая проблема вытекает из попытки решить первую: поиск весов для различных бумаг, причем эти весы могут меняться с течением времени

Учитывая данные обстоятельства можно прийти к выводу, что использование состояния, которое определяется ценой одного актива, является наиболее оптимальным. Этот факт относится и к различным ценам одного актива (открытия, закрытия и др.). В этом случае различие в динамике цен схоже с наличием шумового процесса, что снижает эффективность прогноза.

Похожие статьи




Выбор рассматриваемых котировок, Составные части состояний - Применение скрытого марковского процесса для прогноза на фондовом рынке

Предыдущая | Следующая