Background Image
Table of Contents Table of Contents
Previous Page  200 / 320 Next Page
Information
Show Menu
Previous Page 200 / 320 Next Page
Page Background

198

обучается именно тому, чего от неё хотел создатель. В связи

с вышеизложенным

возникает

проблема

выбора

оптимальной

нейросетевой архитектуры, подходящей для решения конкретной задачи.

С точки зрения математики в процессе настройки ИНС циклически

решаются однокритериальные задачи оптимизации [

Хайкин, 2006

].

Обучение нейронной сети характеризуется четырьмя специфическими

ограничениями, выделяющими обучение нейросетей из общих задач

оптимизации: большое число параметров, необходимость высокого

параллелизма при обучении, многокритериальность решаемых задач,

необходимость найти достаточно широкую область, в которой значения

всех минимизируемых функций близки к минимальным. В остальном

проблему обучения можно, как правило, сформулировать как задачу

минимизации оценки. Следует также отметить возможность переобучения

сети, что является скорее результатом ошибочного проектирования её

топологии. При слишком большом количестве нейронов теряется свойство

сети обобщать информацию. Весь набор образов, предоставленных

к обучению, будет выучен сетью, но любые другие образы, даже очень

похожие, могут быть обработаны неверно.

Поиск оптимальной нейросетевой модели выполняется в несколько

этапов. Во-первых, нужно выбрать, какие признаки использовать, сколько

и какие наблюдения надо провести. Первоначальный выбор признаков

осуществляется экспериментально на основе имеющегося опыта, который

может подсказать, какие признаки являются наиболее важными. Как

правило, сначала используют все признаки, которые, по мнению

аналитиков или экспертов, являются существенными. На последующих

этапах это множество должно быть сокращено. Во-вторых, решается

вопрос о том, сколько нужно иметь наблюдений для обучения сети.

Известен ряд эвристических правил, которые устанавливают связь между

количеством необходимых наблюдений и размерами сети. Простейшее из

них гласит, что количество наблюдений должно быть минимум в 10 раз

больше числа связей в сети. На самом деле это число зависит от сложности

того отображения, которое должна воспроизводить нейронная сеть.

Для большинства реальных задач бывает достаточно нескольких сотен или

тысяч наблюдений. Для сложных задач может потребоваться большее

количество. Очень редко встречаются задачи, где требуется менее

100 наблюдений. Если данных мало, то сеть не имеет достаточной