Построение оценки по интерпретатору - Функциональные модели универсального нейрокомпьютера

Если в качестве ответа нейронная сеть должна выдать число, то естественной оценкой является квадрат разности выданного сетью выходного сигнала и правильного ответа. Все остальные оценки для обучения сетей решению таких задач являются модификациями данной. Приведем пример такой модификации. Пусть при составлении задачника величина, являющаяся ответом, измерялась с некоторой точностью ?. Тогда нет смысла требовать от сети обучиться выдавать в качестве ответа именно величину. Достаточно, если выданный сетью ответ попадет в интервал. Оценка, удовлетворяющая этому требованию, имеет вид:

Эту оценку будем называть оценкой числа с допуском ?.

Для задач классификации также можно пользоваться оценкой типа суммы квадратов отклонений выходных сигналов сети от требуемых ответов. Однако, эта оценка плоха тем, что во-первых, требования при обучении сети не совпадают с требованиями интерпретатора, во-вторых - такая оценка не позволяет оценить уровень уверенности сети в выданном ответе. Достоинством такой оценки является ее универсальность. Опыт работы с нейронными сетями, накопленный красноярской группой НейроКомп, свидетельствует о том, что при использовании оценки, построенной по интерпретатору, в несколько раз возрастает скорость обучения. Рассмотрим построение оценок по интерпретатору для четырех рассмотренных в предыдущем разделе интерпретаторов ответа.

В ряде описаний оценки и ее производной, приведенных далее, используется следующая функция и ее производная:

1. Кодирование номером канала. Знаковый интерпретатор. Пусть для рассматриваемого примера правильным ответом является k-ый класс. Тогда вектор выходных сигналов сети должен удовлетворять следующей системе неравенств:

Где ?- уровень надежности.

Оценку, вычисляющую расстояние от точки ? в пространстве выходных сигналов до множества точек, удовлетворяющих этой системе неравенств, можно записать в виде:

Производная оценки по i-му выходному сигналу равна .

2. Кодирование номером канала. Максимальный интерпретатор. Пусть для рассматриваемого примера правильным ответом является k-ый класс. Тогда вектор выходных сигналов сети должен удовлетворять следующей системе неравенств:при. Оценкой решения сетью данного примера является расстояние от точки ??в пространстве выходных сигналов до множества точек, удовлетворяющих этой системе неравенств. Для записи оценки, исключим из вектора выходных сигналов сигнал, а остальные сигналы отсортируем по убыванию. Обозначим величину через, а вектор отсортированных сигналов через. Система неравенств в этом случае приобретает вид, при i>1. Множество точек удовлетворяющих этой системе неравенств обозначим через D. Очевидно, что если, то точка ??принадлежит множеству D. Если, то найдем проекцию точки ??на гиперплоскость. Эта точка имеет координаты. Если, то точка принадлежит множеству D. Если нет, то точку ? нужно проектировать на гиперплоскость. Найдем эту точку. Ее координаты можно записать в следующем виде. Эта точка обладает тем свойством, что расстояние от нее до точки ? минимально. Таким образом, для нахождения величины b достаточно взять производную от расстояния по b и приравнять ее к нулю:

Из этого уравнения находим b и записываем координаты точки :

Эта процедура продолжается дальше, до тех пор, пока при некотором l не выполнится неравенство или пока l не окажется равной N-1. Оценкой является расстояние от точки ? до точки. Она равна следующей величине

Производная оценки по выходному сигналу равна

Для перехода к производным по исходным выходным сигналам необходимо обратить сделанные на первом этапе вычисления оценки преобразования.

3. Двоичный интерпретатор. Оценка для двоичного интерпретатора строится точно также как и для знакового интерпретатора при кодировании номером канала. Пусть правильным ответом является k-ый класс, тогда обозначим через K множество номеров сигналов, которым в двоичном представлении k соответствуют единицы. При уровне надежности оценка задается формулой:

Производная оценки по i-му выходному сигналу равна:

4. Порядковый интерпретатор. Для построения оценки по порядковому интерпретатору необходимо предварительно переставить компоненты вектора ? в соответствии с подстановкой, кодирующей правильный ответ. Обозначим полученный в результате вектор через. Множество точек, удовлетворяющих условию задачи, описывается системой уравнений, где ? - уровень надежности. Обозначим это множество через D. Оценка задается расстоянием от точки ? до проекции этой точки на множество D. Опишем процедуру вычисления проекции.

Просмотрев координаты точки, отметим те номера координат, для которых нарушается неравенство.

Множество отмеченных координат либо состоит из одной последовательности последовательных номеров, или из нескольких таких последовательностей. Найдем точку, которая являлась бы проекцией точки на гиперплоскость, определяемую уравнениями, где i пробегает множество индексов отмеченных координат. Пусть множество отмеченных координат распадается на n последовательностей, каждая из которых имеет вид, где m - номер последовательности. Тогда точка имеет вид:

Точка является проекцией, и следовательно, расстояние от до должно быть минимальным. Это расстояние равно. Для нахождения минимума этой функции необходимо приравнять к нулю ее производные по. Получаем систему уравнений. Решая ее, находим.

Если точка удовлетворяет неравенствам, приведенным в первом пункте процедуры, то расстояние от нее до точки является оценкой. В противном случае, повторяем первый шаг процедуры, используя точку вместо ; Объединяем полученный список отмеченных компонентов со списком, полученным при поиске предыдущей точки; находим точку, повторяя все шаги процедуры, начиная со второго.

Отметим, что в ходе процедуры число отмеченных последовательностей соседних индексов не возрастает. Некоторые последовательности могут сливаться, но новые возникать не могут. После нахождения проекции можно записать оценку:

Обозначим через m-ую последовательность соседних координат, выделенную при последнем исполнении первого шага процедуры вычисления оценки: . Тогда производную оценки по выходному сигналу можно записать в следующем виде:

Таким образом, построение оценки по интерпретатору сводится к следующей процедуре.

Определяем множество допустимых точек, то есть таких точек в пространстве выходных сигналов, которые интерпретатор ответа будет интерпретировать как правильный ответ со стопроцентным уровнем уверенности.

Находим проекцию выданной сетью точки на это множество. Проекцией является ближайшая точка из множества.

Записываем оценку как расстояние от точки, выданной сетью, до ее проекции на множество допустимых точек.

Похожие статьи

Уровень уверенности - Функциональные модели универсального нейрокомпьютера

Часто при решении задач классификации с использованием нейронных сетей недостаточно простого ответа "входной вектор принадлежит k-му классу". Хотелось бы...
Простейшая предобработка числовых признаков, Оценка способности сети решить задачу - Функциональные модели универсального нейрокомпьютера

Как уже отмечалось в разделе "Различимость входных данных" числовые сигналы рекомендуется масштабировать и сдвигать так, чтобы весь диапазон значений...
Сигналы и параметры - Функциональные модели универсального нейрокомпьютера

При использовании контрастирования для изменения структуры сети и значений обучаемых параметров другим компонентам бывает необходим прямой доступ к...
Элементы самодвойственных сетей - Функциональные модели универсального нейрокомпьютера

Если при обратном функционировании самодвойственной сети на ее выход подать производные некоторой функции F по выходным сигналам сети, то в ходе...
Точка ветвления, Сумматор, Нелинейный Паде преобразователь, Нелинейный сигмоидный преобразователь, Адаптивный сумматор, Константа Липшица сигмоидной сети - Функциональные модели универсального нейрокомпьютера

Поскольку в точке ветвления не происходит преобразования сигнала, то константа Липшица для нее равна единице. Сумматор Производная суммы по любому из...
Предобработчик - Функциональные модели универсального нейрокомпьютера

Данная глава посвящена компоненту предобработчик [80, 150]. В ней рассматриваются различные аспекты предобработки входных данных для нейронных сетей....
Персептрон Розенблатта - Функциональные модели универсального нейрокомпьютера

Персептрон Розенблатта [147, 185] является исторически первой обучаемой нейронной сетью. Существует несколько версий персептрона. Рассмотрим классический...
Контрастирование и нормализация сети - Функциональные модели универсального нейрокомпьютера

В последние годы широкое распространение получили различные методы контрастирования или скелетонизации нейронных сетей. В ходе процедуры контрастирования...
Конструирование нейронных сетей, Элементы нейронной сети - Функциональные модели универсального нейрокомпьютера

Впервые последовательное описание конструирования нейронных с Етей из элементов было предложено в книге А. Н. Горбаня [65]. Однако за прошедшее время...
Запросы к компоненту интерпретатор ответа - Функциональные модели универсального нейрокомпьютера

Запросы к компоненту интерпретатор ответа можно разбить на пять групп: Интерпретация. Изменение параметров. Работа со структурой. Инициация редактора и...
Запрос к предобработчику, Запрос к исполнителю, Запросы к учителю, Запрос к контрастеру, Запрос к оценке, Запрос к интерпретатору ответа - Функциональные модели универсального нейрокомпьютера

Предобработчик сам никаких запросов не генерирует. Единственный запрос к предобработчику - "Предобработать пример" может быть выдан только задачником....
Нормализовать сеть (NormalizeNet) - Функциональные модели универсального нейрокомпьютера

Описание запроса: Pascal: Function NormalizeNet(Net : PString) : Logic; C: Logic NormalizeNet(PString Net) Описание аргумента: Net - указатель на строку...
Установить параметры сети (nwSetData) - Функциональные модели универсального нейрокомпьютера

Описание запроса: Pascal: Function nwSetData(Net : PString; DataType : Integer; Var Data : RealArray) : Logic; C: Logic nwSetData(PString Net, Integer...
Запросы к компоненту сеть - Функциональные модели универсального нейрокомпьютера

В данном разделе главы рассмотрены все запросы, исполняемые комп Онентом сеть. Прежде чем приступать к описанию стандарта запросов компонента сеть...
Запрос на интерпретацию, Интерпретировать массив сигналов (Interpretate) - Функциональные модели универсального нейрокомпьютера

Единственный запрос первой группы выполняет основную функцию компонента интерпретатор ответа - интерпретирует массив сигналов. Интерпретировать массив...
Правила остановки работы сети - Функциональные модели универсального нейрокомпьютера

При использовании сетей прямого распространения (сетей без циклов) вопроса об остановке сети не возникает. Действительно, сигналы поступают на элементы...
Состав данных задачника, Цвет примера и обучающая выборка - Функциональные модели универсального нейрокомпьютера

Компонент задачник является необходимой частью нейрокомпьютера вне зависимости от типа применяемых в нем нейронных сетей. Однако в зависимости от...
Примеры сетей и алгоритмов их обучения, Сети Хопфилда - Функциональные модели универсального нейрокомпьютера

В этом разделе намеренно допущено отступление от общей методики - не смешивать разные компоненты. Это сделано для облегчения демонстрации построения...
Функционирование сети - Функциональные модели универсального нейрокомпьютера

Таблица 1 Однородные и неоднородные сумматоры Название Однородный сумматор Неоднородный сумматор Обозначение Значение Обозначение Значение Обычный ?...
Неградиентные методы обучения, Метод случайной стрельбы - Функциональные модели универсального нейрокомпьютера

Создать_вектор В1 Создать_вектор В2 Вычислить_оценку О1 Сохранить_вктор В1 Установить_параметры В1 Случайный_вектор В2 Модификация_вектора В2, 0, 1...
Запросы к компоненту исполнитель, Позадачная обработка (TaskWork) - Функциональные модели универсального нейрокомпьютера

В данном разделе описаны запросы исполнителя с алгоритмами их исполнения. При описании запросов используется аргумент Instruct, являющийся целым числом,...
Исполнитель, Описание компонента исполнитель - Функциональные модели универсального нейрокомпьютера

Описание компонента исполнитель Компонент исполнитель является служебным. Это означает, что он универсален и невидим для пользователя. В отличие от всех...
Остальные запросы, Установить параметры (SetEstIntParameters), Ошибки компонента оценка - Функциональные модели универсального нейрокомпьютера

Ниже приведен список запросов, исполнение которых описано в разделе "Запросы общие для всех компонентов": EsSetCurrent - Сделать оценку текущим EsAdd -...
Запросы к задачнику - Функциональные модели универсального нейрокомпьютера

Запросы к задачнику позволяют последовательно перебирать все примеры обучающей выборки, обращаться непосредственно к любому примеру задачника и изменять...
Нелинейный сигмоидный преобразователь, Произвольный непрерывный нелинейный преобразователь - Функциональные модели универсального нейрокомпьютера

Рис. 11. Прямое (а) и обратное (б) функционирование нелинейного сигмоидного преобразователя Нелинейный сигмоидный преобразователь или сигмоидный элемент...
Классификация компонентов входных данных - Функциональные модели универсального нейрокомпьютера

Информация поступает к нейронной сети в виде набора ответов на некоторый список вопросов. Можно выделить три основных типа ответов (вопросов). Бинарный...
Запросы общие для всех компонентов, Стандарт типов данных - Функциональные модели универсального нейрокомпьютера

В этом разделе описаны запросы, выполняемых всеми компонентами, а также типы данных, используемые при описании запросов. Стандарт типов данных При...
Предопределенные константы - Функциональные модели универсального нейрокомпьютера

При описании различных компонентов возникает необходимость в использовании некоторого набора стандартизированных констант. Стандартность набора констант...
Оценить массив сигналов (Estimate) - Функциональные модели универсального нейрокомпьютера

Описание запроса: Pascal: Function Estimate( EstName : PString; Signals, Back, Answers, Reliability: PRealArray; Direv : Logic; Var Estim : Real ) :...
Составной предобработчик - Функциональные модели универсального нейрокомпьютера

Поскольку на вход нейронной сети обычно подается несколько входных сигналов, каждый из которых обрабатывается своим предобработчиком, то предобработчик...
Описание алгоритмов обучения - Функциональные модели универсального нейрокомпьютера

Все алгоритмы обучения сетей методом обратного распространения ошибки опираются на способность сети вычислять градиент функции ошибки по обучающим...
Сокращение описания сети - Функциональные модели универсального нейрокомпьютера

Предложенный в предыдущих разделах язык описания многословен. В большинстве случаев за счет хорошей структуризации сети можно опу Стить все разделы...
Язык описания нейронных сетей, Ключевые слова языка - Функциональные модели универсального нейрокомпьютера

Язык описания нейронных сетей предназначен для хранения сетей на диске. Следует отметить, что в отличии от таких компонентов, как предобработчик входных...
Введение - Функциональные модели универсального нейрокомпьютера

Общая характеристика работы Актуальность темы. В 80-е годы развитие информатики и средств вычислительной техники во многом определялось программой "Пятое...
Начало и конец сеанса, Начало сеанса (InitSession), Конец сеанса (EndSession) - Функциональные модели универсального нейрокомпьютера

К этой группе запросов относятся два запроса, открывающие и закрывающие сеансы работы с задачником. Начало сеанса (InitSession) Описание запроса: Pascal:...
Поля задачника - Функциональные модели универсального нейрокомпьютера

Далее будем полагать, что задачник является реляционной базой данных из одной таблицы или набора параллельных таблиц. Каждому примеру соответствует одна...
Составные элементы - Функциональные модели универсального нейрокомпьютера

Название "составные элементы" противоречит определению элементов. Это противоречие объясняется соображениями удобства работы. Введение составных...
Способ описания синтаксических конструкций - Функциональные модели универсального нейрокомпьютера

Для описания синтаксиса языков описаний компонентов использ Уется расширенная Бэкусова нормальная форма. Описание синтаксиса языка с помощью БНФ состоит...
Запросы, однотипные для всех компонентов - Функциональные модели универсального нейрокомпьютера

Таблица 5 Префиксы компонентов Префикс Компонент Запроса Ошибки Ex 0 Исполнитель Tb 1 Задачник Pr 2 Предобработчик Nn 3 Сеть Es 4 Оценка Ai 5...
Описание нейронных сетей - Функциональные модели универсального нейрокомпьютера

В первой части этой главы описана система построения сетей из элементов. Описаны прямое и обратное функционирование сетей и составляющих их элементов....

Построение оценки по интерпретатору - Функциональные модели универсального нейрокомпьютера

Предыдущая | Следующая