Выбор предметной области и обзор реализаций методов машинного обучения с учителем в этой области - Исследование алгоритмов

В работе возникает необходимость выбора предметной области, в которой будет тестироваться каскадный классификатор. Главными вопросами на данном этапе являются:

    1) Актуальность предметной области; 2) Уровень проработанности предметной области; решенные и нерешенные задачи по этой тематике; методы, примененные для решения этих задач.

В качестве предметной области было выбрано детектирование пешеходов. Детектирование людей остается одной самых популярных областей распознавания, а детектирование пешеходов, в частности, - еще и коммерчески выгодной. Это обосновывается все возрастающей потребностью общества получить средство защиты и обеспечения максимальной безопасности человека на проезжей части. Анализируя ситуацию на современных дорогах России в целом, стоит отметить тенденцию усиления интенсивности движения, возрастающее число субъектов дорожного движения на дороге, и, соответственно, увеличение процента дорожно-транспортных происшествий. Статистика Данные с официального сайта ГИБДД РФ, URL::http://www. gibdd. ru/stat/charts/ представлена на рис. 1.4.

Если говорить о мерах снижения риска для людей, то становится очевидным, что меры по обеспечению физической безопасности принимаются в основном в отношении водителей. Данное положение вещей объясняется тем, что такие инициативы исходят от автомобильных компаний, прибыль которых зависит от реализации подобного рода проектов. Безопасность же пешехода целиком и полностью зависит от человеческого фактора, что совершенно недопустимо.

В последнее время развитие получила концепция, решающая обозначенную проблему. Речь идет именно о системах автоматического распознавания пешеходов.

статистика дтп

Рисунок 1.4. Статистика ДТП

Программный уровень реализации таких систем работает непосредственно с задачей детектирования. Для решения данной задачи предложено множество методов, каждый из которых обеспечивает разное качество распознавания и служит для применения в конкретных подзадачах, начиная с самых примитивных, как, например, простое обнаружение пешехода, определение расстояния до него и обозначение контура пешехода на фоне, и заканчивая сложными, к примеру, предсказанием траектории движения пешехода.

В таблице 1.1 содержится информация о работах, в которых решается задача детектирования пешеходов с применением методов машинного обучения с учителем. Эти данные могут помочь проанализировать, есть ли нерешенные проблемы в данной предметной области и существует ли пространство для оптимизации в данной сфере.

Таблица 1.1

Применение алгоритмов контролируемого обучения в выбранной предметной области

Примеры алгоритмов

Работы

Достоинства метода

Недостатки метода

Алгоритмы на основе гистограмм (Lin. R?HOG, C?HOG, EC?HOG и др.)

[6], [30], [9], [8]

    - Возможна работа алгоритма в режиме реального времени; - Возможность обучить такой распознаватель, который был бы устойчив ко всем факторам изменяющейся среды
    - В большинстве случаев обучение занимает много времени; - Необходимость подготовки обучающих выборок; - Зависимость качества обучения от обучающей выборки

Метод опорных векторов (SVM)

[30], [8], [33]

Бустинг

[28], [11], [33], [8], [36]

Баггинг (Random Forest)

[25]

Нейросети

[12], [7], [34]

Если предпринять попытку проанализировать содержание ячеек таблицы, можно сделать выводы о том, что предметная область активно прорабатывается, в частности, написано много трудов по бустингу и обучению классификаторов. Однако сами авторы этих работ подчеркивают, что обучение каскадных классификаторов имеет ряд существенных недостатков, с последствиями которых не всегда удается справиться. Таким образом, работа с каскадными классификаторами применительно к задаче детектирования пешеходов является необходимой и практически полезной.

Для того, чтобы объективно оценить результаты работы с каскадным классификатором, на данном этапе исследования было принято решение дополнительно реализовать другой метод классификации. Такая мера поможет сравнить результаты детектирования, чтобы определить, превосходит ли разрабатываемый метод уже существующие, и если да, то насколько.

Выбор пал на метод HOG (Histogram of Oriented Gradients, гистограмма направленных градиентов) [7], так как он изначально был разработан именно для детектирования пешеходов и в настоящий момент в том или ином виде используется в большинстве современных детекторов.

Основная идея, лежащая в основе HOG, заключается в том, что внешний вид и форма части объекта могут быть достаточно хорошо описаны распределением градиентов интенсивности пикселей, соответствующих данной части, без точной информации о градиентах в каждой точке. Под градиентом здесь понимается аппроксимация градиента функции интенсивности (яркости), которая предполагается дифференцируемой, но известной лишь в узлах равномерной сетки - пикселях, в заданной точке с помощью некоторой разностной схемы.

Базовой единицей HOG-дескриптора является блок (block) - прямоугольная область пикселей изображения заданных размеров. Блок состоит из ячеек (cells), в свою очередь состоящих из пикселей. Каждой ячейке ставится в соответствие гистограмма ориентаций (углов наклона относительно горизонтали) градиентов из заданного количества полос (bins), при этом направление считается "беззнаковым", т. е. угол в и считаются эквивалентными.

Магнитуда градиента в некотором пикселе дает вклад в полосы гистограммы ячейки, которой принадлежит данный пиксель, а также в гистограммы соседних ячеек. При этом используется линейная интерполяция по углу наклона (полосам одной гистограммы), и билинейная по пространственному расположению (по гистограммам соседних ячеек). Также возможно взвешивание магнитуд градиентов с помощью гауссиана с центром, совпадающим с центром блока. После вычисления гистограмм в каждой ячейке блока, они конкатенируются в одну гистограмму, тем самым образуя вектор признаков блока.

Полученный вектор подвергается нормализации по яркости ( или норма):

,

Где - некая малая константа. Таким образом, данный описатель содержит пространственную информацию о фрагменте и инвариантен к освещению.

Такие признаковые описания вычисляются для всех блоков, не выходящих за пределы изображения, с координатами левого верхнего пикселя кратными заданным шагам по вертикали и горизонтали. Причем данные шаги, как правило, задаются так, что блоки перекрываются, т. е. градиент пикселя учитывается при вычислении признаковых описаний нескольких блоков. HOG-описание изображения получается путем конкатенации векторов признаков всех блоков.

При вычислении градиентов производится свертка изображения с ядрами и, в результате чего образуются две матрицы и производных вдоль осей ?? и ?? соответственно. Эти матрицы используются для вычисления углов и величин (модулей) градиентов в каждой точке изображения.

Пусть множество углов (???, ??] разбивается на ?? равных интервалов вида, где ?? = {1, . . . , ??}. Каждому интервалу ставится в соответствие бин гистограммы. Тогда гистограмма ячейки заполняется так, что величина градиента в каждой внутренней его точке добавляется к величине бина, соответсвующего интервалу, содержащему угол данного градиента [5].

Обычно ячейки, так же, как и сами фрагменты, имеют прямоугольную форму, которая позволяет применять технику интегральных изображений.

Итак, на данном этапе исследования тема была рассмотрена с математической точки зрения: описана общая формальная задача классификации, даны определения ключевым понятиям (признаки Хаара и локальные бинарные шаблоны), представлен алгоритм AdaBoost, основанный на использовании признаков Хаара, также дополнительно изучен метод HOG. Изучение теоретической составляющей алгоритмов необходимо для их грамотной реализации, которая имеет место быть в данной работе. Также на данном шаге была выбрана предметная область, открытая для применения изученных методов.

Похожие статьи




Выбор предметной области и обзор реализаций методов машинного обучения с учителем в этой области - Исследование алгоритмов

Предыдущая | Следующая