Основы теории нейронных сетей

       

Проблема функции ИСКЛЮЧАЮЩЕГО ИЛИ


Один из самых пессимистических результатов М.Л. Минского гласит, что однослойный персептрон не может воспроизвести такую простую функцию, как ИСКЛЮЧАЮЩЕЕ ИЛИ. Это функция от двух аргументов, каждый из которых может быть нулем или единицей. Она принимает значение единицы, когда один из аргументов равен единице (но не оба). Проблему можно проиллюстрировать с помощью однослойной однонейронной системы с двумя входами, показанной на рис. 2.3.


Рис. 2.3. 

Обозначим один вход через

, а другой через
, тогда все их возможные комбинации будут состоять из четырех точек на плоскости
, как показано на рис. 2.4. Например, точка
и

обозначена на рисунке как точка

. Табл. 2.1 показывает требуемую связь между входами и выходом, где входные комбинации, которые должны давать нулевой выход, помечены
и
, единичный выход -

и

.

Таблица 2.1.

ТочкиЗначения
Значения
Требуемый выход
000
101
011
110


Рис. 2.4. 

В сети на рис. 2.3 функция

является обычным порогом, так что OUT принимает значение 0, когда NET меньше 0,5, и 1 в случае, когда NET больше или равно 0,5. Нейрон выполняет следующее вычисление:

(1)

Никакая комбинация значений двух весов не может дать соотношения между входом и выходом, задаваемого табл. 2.1. Чтобы понять это ограничение, зафиксируем

на величине порога 0,5. Сеть в этом случае описывается уравнением (2). Это уравнение линейно по
и
, т. е. все значения по
и
, удовлетворяющие этому уравнению, будут лежать на некоторой прямой в плоскости
.

(2)

Любые входные значения для

и
на этой линии будут давать пороговое значение 0,5 для
. Входные значения с одной стороны прямой обеспечат значения
больше порога, следовательно,
. Входные значения по другую сторону прямой обеспечат значения NET меньше порога, делая
равным 0. Изменения значений
,
и порога будут менять наклон и положение прямой. Для того чтобы сеть реализовала функцию ИСКЛЮЧАЮЩЕЕ ИЛИ, заданную табл. 2.1, нужно расположить прямую так, чтобы точки
,

были с одной стороны прямой, а точки

,
— с другой. Попытавшись нарисовать такую прямую на рис. 2.4, убеждаемся, что это невозможно.




Это означает, что какие бы значения ни приписывались весам и порогу, сеть неспособна воспроизвести соотношение между входом и выходом, требуемое для представления функции ИСКЛЮЧАЮЩЕЕ ИЛИ. Взглянув на задачу с другой точки зрения, рассмотрим
как поверхность над плоскостью
. Каждая точка этой поверхности находится над соответствующей точкой плоскости
на расстоянии, равном значению
в этой точке. Можно показать, что наклон этой
-поверхности одинаков для всей поверхности
. Все точки, в которых значение
равно величине порога, проектируются на линию уровня плоскости
(см. рис.2.5).


Рис. 2.5. 

Ясно, что все точки по одну сторону пороговой прямой проецируются в значения
большие порога, а точки по другую сторону дадут меньшие значения
. Таким образом, пороговая прямая разбивает плоскость
на две области. Во всех точках по одну сторону пороговой прямой значение
равно единице, по другую сторону — нулю.


Содержание раздела