Обучение нейронной сети - Исследование метода обратного распространения ошибки для обучения нейронной сети

Самым важным свойством нейронных сетей является их способность обучаться на основе данных окружающей среды и в результате обучения повышать свою производительность. Обучение нейронной сети происходит посредством интерактивного процесса корректировки синаптических весов и порогов.

Существуют два концептуальных подхода к обучению нейронных сетей: обучение с учителем и обучение без учителя. В данной курсовой работе используется метод обучения с учителем.

Обучение нейронной сети с учителем предполагает, что для каждого входного вектора из обучающего множества существует требуемое значение выходного вектора, называемого целевым. Эти вектора образуют обучающую пару. Веса сети изменяют до тех пор, пока для каждого входного вектора не будет получен приемлемый уровень отклонения выходного вектора от целевого.

Алгоритм обратного распространения ошибки:

Инициализировать синаптические веса маленькими случайными значениями.

Выбрать очередную обучающую пару из обучающего множества; подать входной вектор на вход сети.

Вычислить выход сети.

Вычислить разность между выходом сети и требуемым выходом (целевым вектором обучающей пары).

Подкорректировать веса сети для минимизации ошибки (как см. ниже).

Повторять шаги с 2 по 5 для каждого вектора обучающего множества до тех пор, пока ошибка на всем множестве не достигнет приемлемого уровня.

Рассмотрим подробней 5 шаг - корректировка весов сети. Здесь следует выделить два нижеописанных случая.

Случай 1. Корректировка синаптических весов выходного слоя

Определимся, что индексом p будем обозначать нейрон, из которого выходит синаптический вес, а q - нейрон в который входит.

Введем величину д, которая равна разности между требуемым и реальным выходами, умноженной на производную функции активации:

(9)

Тогда, веса выходного слоя после коррекции будут равны:

(10)

Где:

I - номер текущей итерации обучения;

- величина синаптического веса, соединяющего нейрон p с нейроном q;

- коэффициент "скорости обучения", позволяет управлять средней величиной изменения весов;

- выход нейрона.

Случай 2. Корректировка синаптических весов скрытого слоя.

(11)

Где:

- сумма от 1 по N, N - количество нейронов выходного слоя.

Тогда, веса скрытого слоя после коррекции будут равны:

(12)

В этом алгоритме происходит распространение ошибки от выходов НС ко входам, то есть в направлении обратном распространению сигналов обычном режиме работы. Согласно методу наименьших квадратов, минимизируемой целевой функцией ошибки НС является величина:

(13)

Где реальное выходное состояние нейрона выходного слоя N нейронной сети при подаче на ее входы - го образа; - желаемое (идеальное) выходное состояние этого нейрона. Суммирование происходит по всем нейронам выходного слоя и по всем обрабатываемым сетью образам.

Чтобы определить оптимальные параметры обучения нейросети данным методом, такие как количество шагов обучения, скорость обучения и коэффициент сигмоида, мы будем анализировать величину ошибки (13). Для этого мы будем использовать среду Matlab.

Мы должны сначала составить таблицы значений ошибки обучения, как функции от 3-х параметров: шага обучения, скорости обучения и коэффициента а в функции активации (7).

План эксперимента:

Коэффициент сигмоиды изменяется от 0 до 10 с шагом 0,1;

Количество шагов обучения - 100;

Так как поверхность является функцией от двух переменных, коэффициент скорости обучения должен быть константой. Поэтому его возьмем равным 3 конкретным значениям: 0,5; 1; 1,5. Тогда функция ошибки будет зависеть от двух параметров, и мы сможем построить ее график.

Анализируя графики, мы сможем выбрать оптимальные значения этих параметров.

Похожие статьи

Искусственные нейронные сети - Исследование метода обратного распространения ошибки для обучения нейронной сети

Несмотря на большое разнообразие вариантов нейронных сетей, все они имеют общие черты. Так, все они, так же, как и мозг человека, состоят из большого...
Введение, Разработка алгоритма - Исследование метода обратного распространения ошибки для обучения нейронной сети

В данной курсовой работе необходимо разработать алгоритм и программу на языке С# вычислительного процесса (двухслойная нейросеть). В наши дни возрастает...
Алгоритмы детектирования объектов на видео для мобильных платформ, Обучение с учителем и формальная запись задачи классификации - Исследование алгоритмов

Обучение с учителем и формальная запись задачи классификации Теория машинного обучения решает задачи предсказания будущего поведения сложных систем в том...
Решение нелинейных дифференциальных уравнений, описывающих распространение вируса с помощью метода Рунге-Кутты 4-го порядка точности - Исследование модели распространения вирусных атак в социальных сетях на основе эпидемиологической модели SEIR

Методы Рунге-- Кутты-- важное семейство численных алгоритмов решения обыкновенных дифференциальных уравнений и их систем. Данные итеративные методы...
Примеры сетей и алгоритмов их обучения, Сети Хопфилда - Функциональные модели универсального нейрокомпьютера

В этом разделе намеренно допущено отступление от общей методики - не смешивать разные компоненты. Это сделано для облегчения демонстрации построения...
Лабораторная работа №4, Цель работы, Теоретическое введение - Интеллектуальные информационные системы

Обучение нейронной сети Цель работы Изучить принципы проектирования и обучения нейронных сетей с помощью пакета Matlab. Изучить на практике работу...
ОПИСАНИЕ РАБОТЫ С СИСТЕМОЙ МОНИТОРИНГА СОЦИАЛЬНЫХ СЕТЕЙ В КАЧЕСТВЕ МЕТОДА СБОРА ДАННЫХ - Распространение новостной информации

Система мониторинга социальных сетей предоставляет исследователю возможность собрать интересующие его упоминания в социальных сетях по какой-либо...
Выбор предметной области и обзор реализаций методов машинного обучения с учителем в этой области - Исследование алгоритмов

В работе возникает необходимость выбора предметной области, в которой будет тестироваться каскадный классификатор. Главными вопросами на данном этапе...
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ, Актуальность, Цель работы, Задачи работы - Исследование модели распространения вирусных атак в социальных сетях на основе эпидемиологической модели SEIR

Актуальность Сегодня всемирная популярность социальных информационных сетей продолжает набирать обороты, все большее пользователей не может отказать себе...
Методика проведения и результаты тестирования, Методы и способы устранения ошибок, Отладка выявленных ошибок, обнаруженных при тестировании - Выбор оптимального маршрута для строительства дороги

При разработке данной программы были допущены следующие синтаксические ошибки: - неправильное использование операторов присваивания; - неверное...
Исследование сетевой топологии и технологии передачи и обмен данными в компьютерной сети - Разработка программного продукта "Учет курсантов" для автошколы

Непременным атрибутом офиса любой современной компании являются компьютеры. При наличии нескольких компьютеров практически всегда их объединяют в...
Обучение каскадного классификатора - Исследование алгоритмов

В OpenCV есть два приложения для тренировки каскадов URL: http://docs. opencv. org/modules/objdetect/doc/cascade_classification. html?...
Построение системы ОДУ для вероятностей состояний и среднего относительного числа заявок в системах сети - Анализ НМ-сети с разнотипными заявками в нестационарном режиме и ее применение

Рассмотрим замкнутую сеть массового обслуживания с разнотипными заявками, которая является вероятностной моделью обслуживания заявок в УП "Проектный...
Методы оптимизации проектирования, Основные понятия и определения - Разработка модуля для комплекса многокритериальной и многопараметрической оптимизации "CADoptimizer"

Основные понятия и определения Прежде чем приступить к обсуждению вопросов оптимизации, введем ряд определений и рассмотрим основные понятия. Оптимизация...
Точка ветвления, Сумматор, Нелинейный Паде преобразователь, Нелинейный сигмоидный преобразователь, Адаптивный сумматор, Константа Липшица сигмоидной сети - Функциональные модели универсального нейрокомпьютера

Поскольку в точке ветвления не происходит преобразования сигнала, то константа Липшица для нее равна единице. Сумматор Производная суммы по любому из...
Структура и работа комплекса, Функции модуля пользовательского интерфейса, Функции модуля математической модели, Функции модуля библиотеки критериев, Функции модуля случайного поиска, Функции модуля прямого и градиентного поиска - Разработка модуля для комплекса многокритериальной и многопараметрической оптимизации "CADoptimizer"

Структура комплекса представлена на рисунке 3. Комплекс состоит из следующих модулей: - пользовательский интерфейс; - математическая модель; - библиотека...
Лабораторная работа № 3, Цель работы, Теоретическое введение - Интеллектуальные информационные системы

Знакомство с нейронными сетями Цель работы Ознакомление со структурой нейронных сетей. Получение навыка программирования нейронных сетей. Теоретическое...
ОСНОВНОЕ СОДЕРЖАНИЕ, Описание SEIR-модели эпидемии - Исследование модели распространения вирусных атак в социальных сетях на основе эпидемиологической модели SEIR

Описание SEIR-модели эпидемии Современные социальные информационные сети позволяют обмениваться различными видами мультимедийной информации среди ее...
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ, СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ - Исследование модели распространения вирусных атак в социальных сетях на основе эпидемиологической модели SEIR

В ходе выполнения курсовой работы на основе полученных знаний была решена система, описывающая модель SEIR распространения вирусов и проведено ее...
Онлайн исследования в социологии: новые методы анализа данных - Распространение новостной информации

На сегодняшний день анализ социальных сетей и медиа, Интернет-сообществ, пользователей в целом используется в основном в маркетинге. Компания может...
Результаты исследования - Реализация метода конечных элементов для расчета ферменных конструкций под ОС Android

Для решения трехмерной задачи упругости с помощью метода конечных элементов были заданы следующие основные параметры: [1]. Количество секций. [2]....
Модель исходной системы, Выбор методов для переноса - Система автоматизированного разделения кода прикладных программ

Данная методика рассчитана на приложения с трехуровневой архитектурой: клиент - сервер приложений - сервер базы данных. Так как программа нацелена на...
Конструирование нейронных сетей, Элементы нейронной сети - Функциональные модели универсального нейрокомпьютера

Впервые последовательное описание конструирования нейронных с Етей из элементов было предложено в книге А. Н. Горбаня [65]. Однако за прошедшее время...
МЕТОДЫ ДОСТУПА К ПЕРЕДАЮЩЕЙ СРЕДЕ В ЛВС - Компьютерные сети и телекоммуникации

Несомненные преимущества обработки информации в сетях ЭВМ оборачиваются немалыми сложностями при организации их защиты. Отметим следующие основные...
Физическая среда передачи в локальных сетях - Методы доступа к передающей среде в ЛВС

Весьма важный момент - учет факторов, влияющих на выбор физической среды передачи (в ЛВС - кабельной системы). Среди них можно перечислить следующие:...
Разработка сети абонентского доступа, Исходные данные для разработки, Основные сетевые решения - Сеть абонентского доступа

Исходные данные для разработки Сеть абонентского доступа разрабатывается согласно заданию на дипломный проект для территории, представленной на рисунке...
Постановка задачи дипломного проектирования, Анализ предпроектной ситуации - Исследование и модернизация локальной вычислительной сети

Методы разработки вычислительной сети: 1. Экспериментальный метод - персонал предприятия закупает "новинки" рынка компьютерной техники. Такой метод -...
Нейронные сети и СК-анализ, Графическое отображение нейронов и Паррето-подмножеств нелокальной нейронной сети - Системная теория информации и семантическая информационная модель

Известные в литературе нейронные сети, в отличие от предлагаемой семантической информационной модели и нелокальных нейронных сетей, не обеспечивают...
Основные определения и способы реализации МКЭ - Реализация метода конечных элементов для расчета ферменных конструкций под ОС Android

Метод конечных элементов является численным методом для нахождения приближенных решений физических задач. В основе этого метода лежит разделение...
Геометрический метод, Двойственная задача - Линейное программирование

Применяется для задач с двумя переменными. Метод решения состоит в следующем: На плоскости строятся прямые, которые задают соответствующие ограничения:...
Простейшая предобработка числовых признаков, Оценка способности сети решить задачу - Функциональные модели универсального нейрокомпьютера

Как уже отмечалось в разделе "Различимость входных данных" числовые сигналы рекомендуется масштабировать и сдвигать так, чтобы весь диапазон значений...
Порядок выполнения лабораторной работы, Написать программу на С++ моделирующую двухслойную нейронную сеть структуры согласно варианту, указанному в таблице 4., Контрольные вопросы, Оформление отчета по лабораторной работе - Интеллектуальные информационные системы

Написать программу на С++ моделирующую двухслойную нейронную сеть структуры согласно варианту, указанному в таблице 4. Таблица 4 Варианты заданий для...
Решение системы, Исследование модели вирусных атак в социальных сетях на основе эпидемиологической модели SEIR - Исследование модели распространения вирусных атак в социальных сетях на основе эпидемиологической модели SEIR

Введем начальные условия, необходимые для реализации метода Рунге-Кутта 4-го порядка: S(0)=100, E(0)=1, I(0)=0,R(0)=0, t=[0,30]. Параметры Sigma = 0.5 ;...
Сети Петри и классификация - Разработка программы для реализации редактора временных графов синхронизации

Сеть Петри это двудольный направленный граф с маркировкой, ребра которого задают причинно-следственные отношения "события-условия" и именуются дугами....
Сущность и принципы работы школьной социальной сети, Организационные возможности школьной социальной сети для организации внеурочной деятельности учащихся - Школьная социальная сеть

Во второй главе магистерской диссертации обобщены результаты исследования, проведенного с целью выявления возможностей и сложностей работы школьной...
Тестирование и отладка системы - Исследование и модернизация локальной вычислительной сети

Тестирование системы является одной из завершающих стадий в процессе проектирования. На этом этапе проверяется соответствие созданной распределенной...
Применение технологии HDSL для уплотнения АЛ офисов - Разработка корпоративной сети на основе технологий xDSL

Малоканальные системы уплотнения абонентских линий (АЛ) основаны на технологии DSL со скоростью потока 160 кбит/с. В масштабах крупных офисов (чаще всего...
Проектная часть - Исследование и модернизация локальной вычислительной сети

Анализ возможных вариантов построения Прежде всего, при проектировании ЛВС следует выбрать сетевую архитектуру и топологию. Архитектура сети определяет...
Описание предметной области - Разработка локальной сети для ОАО "Корпорация Монстров"

Непременным атрибутом малого предприятия являются компьютеры. При наличии нескольких компьютеров практически всегда их объединяют в локальную сеть....
Разработка СППР на основе методов интеллектуального анализа данных, Предложенный подход к решению задач исследования - Интеллектуальный анализ данных, который способствует поддержке маркетинга в компании

Предложенный подход к решению задач исследования Используя в качестве основы присутствующее в наличии программное обеспечение, которое применимо к...

Обучение нейронной сети - Исследование метода обратного распространения ошибки для обучения нейронной сети

Предыдущая | Следующая