Построение оценки по интерпретаторуСтраница 1
Если в качестве ответа нейронная сеть должна выдать число, то естественной оценкой является квадрат разности выданного сетью выходного сигнала и правильного ответа. Все остальные оценки для обучения сетей решению таких задач являются модификациями данной. Приведем пример такой модификации. Пусть при составлении задачника величина
, являющаяся ответом, измерялась с некоторой точностью e. Тогда нет смысла требовать от сети обучиться выдавать в качестве ответа именно величину
. Достаточно, если выданный сетью ответ попадет в интервал
. Оценка, удовлетворяющая этому требованию, имеет вид:
Эту оценку будем называть оценкой числа с допуском e .
Для задач классификации также можно пользоваться оценкой типа суммы квадратов отклонений выходных сигналов сети от требуемых ответов. Однако, эта оценка плоха тем, что, во-первых, требования при обучении сети не совпадают с требованиями интерпретатора, во-вторых, такая оценка не позволяет оценить уровень уверенности сети в выданном ответе. Достоинством такой оценки является ее универсальность. Опыт работы с нейронными сетями, накопленный красноярской группой НейроКомп, свидетельствует о том, что при использовании оценки, построенной по интерпретатору, в несколько раз возрастает скорость обучения.
Для оценок, построенных по интерпретатору потребуется следующая функция оценки
и ее производная
Рассмотрим построение оценок по интерпретатору для четырех рассмотренных в предыдущем разделе интерпретаторов ответа.
1. Кодирование номером канала. Знаковый интерпретатор
. Пусть для рассматриваемого примера правильным ответом является k- ый класс. Тогда вектор выходных сигналов сети должен удовлетворять следующей системе неравенств:
где e — уровень надежности.
Оценку, вычисляющую расстояние от точки a в пространстве выходных сигналов до множества точек, удовлетворяющих этой системе неравенств, можно записать в виде:
Производная оценки по i- му выходному сигналу равна
2. Кодирование номером канала. Максимальный интерпретатор
. Пусть для рассматриваемого примера правильным ответом является k- ый класс. Тогда вектор выходных сигналов сети должен удовлетворять следующей системе неравенств: αk -e ≥αi при i≠k . Оценкой решения сетью данного примера является расстояние от точки a в пространстве выходных сигналов до множества точек, удовлетворяющих этой системе неравенств. Для записи оценки, исключим из вектора выходных сигналов сигнал αk , а остальные сигналы отсортируем по убыванию. Обозначим величину αk -e через β 0, а вектор отсортированных сигналов через β 1≥β 2≥…≥βN -1. Система неравенств в этом случае приобретает вид β 0≥βi , при i> 1. Множество точек удовлетворяющих этой системе неравенств обозначим через D
. Очевидно, что если β 0≥β 1, то точка b принадлежит множеству D
. Если β 0<β 1, то найдем проекцию точки b на гиперплоскость β 0=β 1. Эта точка имеет координаты
Если
, то точка β ¹ принадлежит множеству D
. Если нет, то точку b нужно проектировать на гиперплоскость β 0=β 1=β 2. Найдем эту точку. Ее координаты можно записать в следующем виде (b,b,b,β 3,…,βN -1). Эта точка обладает тем свойством, что расстояние от нее до точки b минимально. Таким образом, для нахождения величины b достаточно взять производную от расстояния по b и приравнять ее к нулю:
Другое по теме
13. Археологические методы датирования
«СРАЖЕНИЯ НЕ БЫЛО? Результаты раскопок,
проведенных в Италии швейцарским археологом Георгом Гловацки, оказались
сенсационными. Ученый установил, что в районе, где, по преданию, произошла
битва при Каннах, в которой войска Ганни ...