Заключение - Исследование алгоритмов

В настоящей выпускной квалификационной работе была исследована процедура обучения каскадного классификатора с целью повышения точности и вычислительной эффективности алгоритмов детектирования текстурированных объектов на видео для мобильных платформ. Данная проблема была рассмотрена как с теоретической точки зрения, обращаясь к математическим основам, так и с практической - применительно к задаче детектирования пешеходов в реальном времени.

Задачи, поставленные в рамках исследования, были решены. Результаты выглядят следующим образом:

    1) Произведен обзор литературы, в ходе которого рассмотрены существующие методы классификации и проанализирована предметная область; 2) Изученный метод обучения каскадного классификатора был реализован в виде приложения для платформы Android; 3) Для разработанного приложения проведена серия экспериментальных тестов по детектированию пешеходов в реальных условиях.

Работа по реализации метода была произведена в несколько этапов, на каждом из которых были предложены подходы к решению существующих проблем детектирования.

Первый этап предусматривал подготовку обучающей выборки изображений. На данном шаге были устранены основные трудности, которые представляет предметная область:

    1) Во-первых, была ослаблена проблема отсутствия эталонного образа человека и наличия существенных различий в представлении пешехода. Решением этой проблемы стало комбинирование готовых реалистичных баз изображений и кадров подлинных записей с видеорегистратора, сделанных в реальной среде при различных степенях освещенности и в разное время года; 2) Во-вторых, была ослаблена проблема, касающаяся трудностей, которые представляет среда нахождения детектируемых объектов. Обозначенная проблема была решена путем использования частей позитивных изображений, на которых отсутствует объект, в качестве негативных; 3) В-третьих, была ослаблена проблема многообразия пространственного расположения объекта, зависимости от ориентации и масштаба. Положительная выборка была подготовлена таким образом, что на каждом обучающем положительном образце находился один только объект, по размеру совпадающий с размером изображения; для этого создано дополнительное приложение для быстрой обрезки полного набора позитивных изображений вручную. Такие меры также способствуют снижению длительности обучения классификатора и увеличению точности обучения каскадов.

Вторым этапом была проведена процедура тренировки классификаторов. На этом шаге экспериментальным путем были подобраны оптимальные параметры обучения, что позволило обучить классификаторы наиболее точно и эффективно.

На третьем этапе было реализовано полноценное приложение-детектор для платформы Android, обладающее удобным ннтерфейсом, правильной архитектурой и способное работать с обученными каскадами обоих типов. Структура приложения такова, что в нем можно реализовать любой другой метод детектирования объектов без существенного изменения кода. Так, был имплементирован метод HOG. Эта мера была необходима для сравнения методов, использующих каскадные классификаторов Haar и LBP, с другими способами классификации.

На финальном этапе была предложена экспериментальная система оценки качества работы приложения. Она включает в себя два теста, условия проведения которых были максимально приближены к реальным: детектирование одного объекта и детектирование множества объектов.

На основе результатов экспериментального анализа были сделаны выводы о проведенной работе в целом, а также о рациональности применения каждого из алгоритмов в задаче детектирования текстурированных объектов на видео, что и было основной целью в рамках данного исследования. Эти выводы таковы:

    1) Каскадный классификатор, обученный на признаках Хаара, дает хорошие практические результаты и пригоден для детектирования пешеходов в реальном времени благодаря внедрению новых решений в стандартную процедуру обучения; 2) Метод Haar является более предпочтительным для использования в задаче детектирования пешеходов, чем метод HOG, так как он обеспечивает более высокий процент верно классифицированных положительных примеров, что является ключевым фактором в выборе метода; 3) Каскадный классификатор, обученный на локальных бинарных шаблонах, не показал удовлетворительных результатов и потому не годится для детектирования объектов на видео в реальном времени. В работе сделаны предположения о том, как можно уйти от этой проблемы.

Данное исследование может считаться хорошей базой для дальнейшего изучения проблем детектирования объектов. Также идеи, представленные в работе, следует совершенствовать и в других направлениях. Дальнейшую работу можно проводить в нескольких направлениях. Наиболее перспективными можно назвать трекинг и предсказание направления движения объекта. Существует множество алгоритмов и методов, которые можно применить как к трекингу (Lucas-Kanade, Tomasi-Kanade, Shi-Tomasi-Kanade и др.), так и к предсказанию (например, использование рекурсивных байесовских фильтров), а значит, целью будущей работы может стать выбор, модификация и реализация одного из них применительно к некой практически важной задаче.

Похожие статьи




Заключение - Исследование алгоритмов

Предыдущая | Следующая