Выбор предметной области и обзор реализаций методов машинного обучения с учителем в этой области - Исследование алгоритмов
В работе возникает необходимость выбора предметной области, в которой будет тестироваться каскадный классификатор. Главными вопросами на данном этапе являются:
- 1) Актуальность предметной области; 2) Уровень проработанности предметной области; решенные и нерешенные задачи по этой тематике; методы, примененные для решения этих задач.
В качестве предметной области было выбрано детектирование пешеходов. Детектирование людей остается одной самых популярных областей распознавания, а детектирование пешеходов, в частности, - еще и коммерчески выгодной. Это обосновывается все возрастающей потребностью общества получить средство защиты и обеспечения максимальной безопасности человека на проезжей части. Анализируя ситуацию на современных дорогах России в целом, стоит отметить тенденцию усиления интенсивности движения, возрастающее число субъектов дорожного движения на дороге, и, соответственно, увеличение процента дорожно-транспортных происшествий. Статистика Данные с официального сайта ГИБДД РФ, URL::http://www. gibdd. ru/stat/charts/ представлена на рис. 1.4.
Если говорить о мерах снижения риска для людей, то становится очевидным, что меры по обеспечению физической безопасности принимаются в основном в отношении водителей. Данное положение вещей объясняется тем, что такие инициативы исходят от автомобильных компаний, прибыль которых зависит от реализации подобного рода проектов. Безопасность же пешехода целиком и полностью зависит от человеческого фактора, что совершенно недопустимо.
В последнее время развитие получила концепция, решающая обозначенную проблему. Речь идет именно о системах автоматического распознавания пешеходов.
Рисунок 1.4. Статистика ДТП
Программный уровень реализации таких систем работает непосредственно с задачей детектирования. Для решения данной задачи предложено множество методов, каждый из которых обеспечивает разное качество распознавания и служит для применения в конкретных подзадачах, начиная с самых примитивных, как, например, простое обнаружение пешехода, определение расстояния до него и обозначение контура пешехода на фоне, и заканчивая сложными, к примеру, предсказанием траектории движения пешехода.
В таблице 1.1 содержится информация о работах, в которых решается задача детектирования пешеходов с применением методов машинного обучения с учителем. Эти данные могут помочь проанализировать, есть ли нерешенные проблемы в данной предметной области и существует ли пространство для оптимизации в данной сфере.
Таблица 1.1
Применение алгоритмов контролируемого обучения в выбранной предметной области
Примеры алгоритмов |
Работы |
Достоинства метода |
Недостатки метода |
Алгоритмы на основе гистограмм (Lin. R?HOG, C?HOG, EC?HOG и др.) |
[6], [30], [9], [8] |
|
|
Метод опорных векторов (SVM) |
[30], [8], [33] | ||
Бустинг |
[28], [11], [33], [8], [36] | ||
Баггинг (Random Forest) |
[25] | ||
Нейросети |
[12], [7], [34] |
Если предпринять попытку проанализировать содержание ячеек таблицы, можно сделать выводы о том, что предметная область активно прорабатывается, в частности, написано много трудов по бустингу и обучению классификаторов. Однако сами авторы этих работ подчеркивают, что обучение каскадных классификаторов имеет ряд существенных недостатков, с последствиями которых не всегда удается справиться. Таким образом, работа с каскадными классификаторами применительно к задаче детектирования пешеходов является необходимой и практически полезной.
Для того, чтобы объективно оценить результаты работы с каскадным классификатором, на данном этапе исследования было принято решение дополнительно реализовать другой метод классификации. Такая мера поможет сравнить результаты детектирования, чтобы определить, превосходит ли разрабатываемый метод уже существующие, и если да, то насколько.
Выбор пал на метод HOG (Histogram of Oriented Gradients, гистограмма направленных градиентов) [7], так как он изначально был разработан именно для детектирования пешеходов и в настоящий момент в том или ином виде используется в большинстве современных детекторов.
Основная идея, лежащая в основе HOG, заключается в том, что внешний вид и форма части объекта могут быть достаточно хорошо описаны распределением градиентов интенсивности пикселей, соответствующих данной части, без точной информации о градиентах в каждой точке. Под градиентом здесь понимается аппроксимация градиента функции интенсивности (яркости), которая предполагается дифференцируемой, но известной лишь в узлах равномерной сетки - пикселях, в заданной точке с помощью некоторой разностной схемы.
Базовой единицей HOG-дескриптора является блок (block) - прямоугольная область пикселей изображения заданных размеров. Блок состоит из ячеек (cells), в свою очередь состоящих из пикселей. Каждой ячейке ставится в соответствие гистограмма ориентаций (углов наклона относительно горизонтали) градиентов из заданного количества полос (bins), при этом направление считается "беззнаковым", т. е. угол в и считаются эквивалентными.
Магнитуда градиента в некотором пикселе дает вклад в полосы гистограммы ячейки, которой принадлежит данный пиксель, а также в гистограммы соседних ячеек. При этом используется линейная интерполяция по углу наклона (полосам одной гистограммы), и билинейная по пространственному расположению (по гистограммам соседних ячеек). Также возможно взвешивание магнитуд градиентов с помощью гауссиана с центром, совпадающим с центром блока. После вычисления гистограмм в каждой ячейке блока, они конкатенируются в одну гистограмму, тем самым образуя вектор признаков блока.
Полученный вектор подвергается нормализации по яркости ( или норма):
,
Где - некая малая константа. Таким образом, данный описатель содержит пространственную информацию о фрагменте и инвариантен к освещению.
Такие признаковые описания вычисляются для всех блоков, не выходящих за пределы изображения, с координатами левого верхнего пикселя кратными заданным шагам по вертикали и горизонтали. Причем данные шаги, как правило, задаются так, что блоки перекрываются, т. е. градиент пикселя учитывается при вычислении признаковых описаний нескольких блоков. HOG-описание изображения получается путем конкатенации векторов признаков всех блоков.
При вычислении градиентов производится свертка изображения с ядрами и, в результате чего образуются две матрицы и производных вдоль осей ?? и ?? соответственно. Эти матрицы используются для вычисления углов и величин (модулей) градиентов в каждой точке изображения.
Пусть множество углов (???, ??] разбивается на ?? равных интервалов вида, где ?? = {1, . . . , ??}. Каждому интервалу ставится в соответствие бин гистограммы. Тогда гистограмма ячейки заполняется так, что величина градиента в каждой внутренней его точке добавляется к величине бина, соответсвующего интервалу, содержащему угол данного градиента [5].
Обычно ячейки, так же, как и сами фрагменты, имеют прямоугольную форму, которая позволяет применять технику интегральных изображений.
Итак, на данном этапе исследования тема была рассмотрена с математической точки зрения: описана общая формальная задача классификации, даны определения ключевым понятиям (признаки Хаара и локальные бинарные шаблоны), представлен алгоритм AdaBoost, основанный на использовании признаков Хаара, также дополнительно изучен метод HOG. Изучение теоретической составляющей алгоритмов необходимо для их грамотной реализации, которая имеет место быть в данной работе. Также на данном шаге была выбрана предметная область, открытая для применения изученных методов.
Похожие статьи
-
Заключение - Исследование алгоритмов
В настоящей выпускной квалификационной работе была исследована процедура обучения каскадного классификатора с целью повышения точности и вычислительной...
-
Введение - Исследование алгоритмов
С недавнего времени такая область кибернетики, как создание искусственных систем распознавания образов, стала представлять особый интерес. Потребность в...
-
Метод конечных элементов (МКЭ) жесткости возник в аэрокосмической отрасли. Исследователи рассматривали различные подходы к анализу сложных частей...
-
Выводы по результатам тестирования - Исследование алгоритмов
По полученным в ходе анализа данным сделать вывод о качестве обученных каскадных классификаторов и о причинах таких результатов, а также выяснить, какие...
-
Каскадный классификатор - Исследование алгоритмов
В настоящее время метод Виолы-Джонса является самым популярным методом для детектирования в силу своей высокой скорости и эффективности. В 2001 году П....
-
Технические требования Техническое задание данной работы требует разработать программу для визуального редактирования HTML-кода. Программа должна быть...
-
Обучение с учителем и формальная запись задачи классификации Теория машинного обучения решает задачи предсказания будущего поведения сложных систем в том...
-
9. Антиалиасинг - Компьютерная графика и ее аппаратная реализация (обзор видеокарт)
Ну и напоследок о том, о чем мы упомянули в начале, о том красивом слове, которым очень часто любят щегольнуть игроки, причем далеко не всегда понимая...
-
Программа экспериментальных исследований В предыдущей главе была описана процедура создания приложения, а также его структура и интерфейс. В данной главе...
-
В данной главе описан процесс создания Android-приложения, способного детектировать пешеходов в видеопотоке, используя обученный каскадный классификатор....
-
Предложенный подход к решению задач исследования Используя в качестве основы присутствующее в наличии программное обеспечение, которое применимо к...
-
Разработаем алгоритм одного из основных методов, используемого в данной программе. Private void pictureBox1_MouseDown(objects sender, MouseEventArgs e)...
-
Методы изображение алгоритмов - Алгоритм
На практике наиболее распространены следующие формы представления алгоритмов: 12. словесная (записи на естественном языке); 13. графическая (изображения...
-
Описание предметной области ООО ИСК "Волгастройинвест" является официальным представителем ряда отечественных и зарубежных фирм, предлагающих на...
-
Приложение, которое необходимо разработать, должно производить геометрическую реконструкцию сцены и вычисление цвета вершин модели. Для геометрической...
-
Выбор мобильной платформы и изучение инструментов разработки - Исследование алгоритмов
Практическая реализация алгоритмов, представленных в предыдущих пунктах, предполагает: 1) Выбор мобильной платформы; 2) Изучение соответствующей среды...
-
Моделирование предметной области Этапом проектирования базы данных любого типа начинается с анализа предметной области, который заканчивается построением...
-
В качестве доступного инструментария были рассмотрены две открытые кроссплатформенные библиотеки для разработки C++ приложений WxWidgets и Boost ,...
-
Свойства алгоритмов - Алгоритм
Данное выше определение алгоритма нельзя считать строгим - не вполне ясно, что такое "точное предписание" или "последовательность действий,...
-
Основные направления исследований в области искусственного интеллекта - Искусственный интеллект
Искусственный интеллект языковой визуальный Интеллектуальные информационные системы проникают во все сферы нашей жизни, поэтому трудно провести строгую...
-
Описание классов и методов - Обзор проблематики и теоретических основ электронного документооборота
В данной работе реализован один публичный класс Form1, в котором и происходит основной функционал программы, посредством выполнения методов по кнопкам....
-
Исходя из контекста решаемой задачи, для сравнительного анализа рассмотренных математических моделей обнаружения аномалий можно выбрать следующие...
-
Графика в компьютере - Компьютерная графика и ее аппаратная реализация (обзор видеокарт)
Представление данных на мониторе компьютера в графическом виде впервые было реализовано в середине 50-х годов для больших ЭВМ, применявшихся в научных и...
-
Онлайн исследования в социологии: новые методы анализа данных - Распространение новостной информации
На сегодняшний день анализ социальных сетей и медиа, Интернет-сообществ, пользователей в целом используется в основном в маркетинге. Компания может...
-
Метод конечных элементов является численным методом для нахождения приближенных решений физических задач. В основе этого метода лежит разделение...
-
Теоретические аспекты поставленной задачи В этой части проекта будут объяснены этапы применения МКЭ для плоской фермы. В первой главе было рассмотрено...
-
Входная информация разделяется на условно-постоянную и оперативно-учетную информацию. - Условно-постоянная информация включает в себя справочные данные о...
-
В качестве предметной области для дипломного проекта была выбрана организация МКДОУ детский сад №85 "Почемучка". Описание и основные виды деятельности...
-
Обучение каскадного классификатора - Исследование алгоритмов
В OpenCV есть два приложения для тренировки каскадов URL: http://docs. opencv. org/modules/objdetect/doc/cascade_classification. html?...
-
Современные технологии обработки Больших данных Большой проект бюджетирование автоматизация С приходом новых технологий, инструментов и средств...
-
Для решения трехмерной задачи упругости с помощью метода конечных элементов были заданы следующие основные параметры: [1]. Количество секций. [2]....
-
ИИС "Шлаковые расплавы" позволяет вести моделирование КЭ в нескольких "режимах", с полным набором получаемых свойств. 1. Моделирование комплекса свойств...
-
Области применения ЭС - Теоретические основы информационных технологий
ЭС в задачах интерпретации , как правило, используют информацию от датчиков для описания ситуации. В качестве примера приведем интерпретацию показаний...
-
Теоретическая основа линейного программирования, Симплекс метод - Линейное программирование
Симплекс метод Симплекс метод - метод линейного программирования, который реализует рациональный перебор базисных допустимых решений, в виде конечного...
-
Построение модели предметной области с помощью описания структур данных и программного кода является классическим подходом в разработке ИС. Зачастую...
-
Image-based Content Creation В работе Lalonde Lalonde J. F. et al. Photo clip art //ACM Transactions on Graphics (TOG). - ACM, 2007. - Т. 26. - №. 3. -...
-
Шестой метод - построение суффиксных деревьев. Среди большого количества методов анализа текста метод аннотированного суффиксного дерева выделяется тем,...
-
Общее описание программного обеспечения, реализующего разработанный алгоритм Основной идеей дипломного проекта, является реализация алгоритма...
-
Обоснование выбранного метода При дизайне системы согласно требованиям или при оптимизации существующей необходимо ввести модель, позволяющую не только...
-
Для осуществления первой задачи данной работы был проведен проведение подробный анализ семи наиболее распространенных технологий работы с Большими...
Выбор предметной области и обзор реализаций методов машинного обучения с учителем в этой области - Исследование алгоритмов