Прогноз кассовых сборов фильмов, Первый этап прогноза кассовых сборов фильмов - Разработка подхода для опережающего прогнозирования кассовых сборов фильмов для России

Данная глава будет посвящена прогнозу кассовых сборов фильмов. Прогноз кассовых сборов производился в два этапа.

На первом этапе был сделан опережающий прогноз динамики кассовых сборов фильмов, результаты первого этапа описаны в начале главы.

Далее сформулирована и описана статическая модель с корректировкой Хекмана общих кассовых сборов фильмов, так мы учтем несовершенство данных использованных при анализе динамики кассовых сборов.

В конце главы приводятся результаты второго этапа опережающего прогноза кассовых сборов фильмов.

Первый этап прогноза кассовых сборов фильмов

Динамический прогноз кассовых сборов фильмов

Перед проверкой прогноза, необходимо определиться с тем какой уровень точности прогноза считать хорошим, а какой плохим применительно к задаче прогноза кассовых сборов фильмов.

Большинство авторов научных работ на тему кассовых сборов фильмов ограничиваются указанием качества линейной аппроксимации моделей, либо не указывают точность прогноза либо предпочитают в принципе не делать реального прогноза. Так например:

- в работе [2] анализ ранних (за месяц) данных мониторинга сайта Википедии позволил достичь значения коэффициента детерминации модели общих кассовых сборов ;

- анализ отзывов критиков [3] позволяет добиться для модели общих кассовых сборов;

- анализ сценария [4] позволяет добиться для модели общих кассовых сборов;

- в работе [13] достигнут коэффициент детерминации для модели кассовых сборов первой недели;

- в работе [5] можно найти значения коэффициента детерминации промежуточных моделей кассовых сборов первой недели.

Все перечисленные меры качества линейной аппроксимации взяты из моделей кассовых сборов в логарифмах. Предполагая структуру Российских данных о кассовых сборах, то модели с подобным уровнем аппроксимации имели бы ошибки лог-модели 0.38 / 0.73 / 0.99 для работ об общих кассовых сборов фильма и 0.63 / 0.90 для работ о кассовых сборах первой недели, соответственно.

Зная ошибки предложенных моделей, мы можем сделать вывод, что ошибки прогноза будут превосходить соответствующие ошибки моделей, но будут схожи им по масштабу.

Отдельно стоит отметить статью [1], в ней не приводится качество линейной аппроксимации модели, поскольку в данной работе в принципе не использовались линейные меры точности прогноза. В данной работе прогноз кассовых сборов осуществлялся с помощью обученной нейронной сети, которая классифицировала фильм в одну из групп - сформированных по шкале кассовых сборов. В работе приводится шкала кассовых сборов, по которой были сформированы группы, и приводится полная матрица попаданий/ промахов прогноза. Таких данных достаточно чтобы грубо оценить ошибку прогноза нейронной сети 0.8 для логарифма общих кассовых сборов фильма - преодоление данного уровня ошибки прогноза будем считать нашей целью.

В качестве периода для сверки прогноза были взяты шесть недель проката с 21 февраля 2013 по 3 апреля 2013 года. Прогноза строился исключительно по данным собранным до начала анализируемого периода (в период с 14 февраля по 20 февраля). В анализируемом периоде вышло в прокат 73 фильма, из которых только 17 продержались в списке двадцати самых успешных более двух недель.

В Приложении на [Диаграмме 6] приводятся результаты оценки точности прогноза динамической модели кассовых сборов, также приводятся оценками точности прогноза количества копий и индекса цен. Из диаграммы видно что точность прогноза количества копий стремительно падает от недели к неделе, что исключает возможность долгосрочных прогнозов - по крайней мере при текущем качестве априорных данных о предстоящих релизах фильмов. Точность прогноза индекса цен стабильна и находится на приемлемом уровне. Точность прогнозов кассовых сборов недели удовлетворительна и находится на уровне 0.9 (что соответствует точности 0.65 прогноза общей суммы сборов фильма), для фильмов, оказавшихся в действительности "успешными". Но априорно мы не знаем какие фильмы окажутся успешными.

Точность прогноза кассовых сборов недели для всех фильмов находится на не удовлетворительном уровне 1.1. Динамический прогноз кассовых сборов всех фильмов по общей сумме спрогнозированных кассовых сборов превысил реальную сумму кассовых сборов на 47%. Столь низкое качество прогноза связано с уже упомянутым ранее "смешением самоотбора". Наша динамическая модель, обученная на данных "успешных" фильмов, не знает о существовании "не успешных" фильмов, поэтому при прогнозе значительно преувеличивает их кассовые сборы.

Для учета эффекта "смешением самоотбора". Была построена дополнительная модель.

Похожие статьи




Прогноз кассовых сборов фильмов, Первый этап прогноза кассовых сборов фильмов - Разработка подхода для опережающего прогнозирования кассовых сборов фильмов для России

Предыдущая | Следующая