Студопедия

КАТЕГОРИИ:

АстрономияБиологияГеографияДругие языкиДругоеИнформатикаИсторияКультураЛитератураЛогикаМатематикаМедицинаМеханикаОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРиторикаСоциологияСпортСтроительствоТехнологияФизикаФилософияФинансыХимияЧерчениеЭкологияЭкономикаЭлектроника


Этапы решения задач




§ Сбор данных для обучения;

§ Подготовка и нормализация данных;

§ Выбор топологии сети;

§ Экспериментальный подбор характеристик сети;

§ Экспериментальный подбор параметров обучения;

§ Собственно обучение;

§ Проверка адекватности обучения;

§ Корректировка параметров, окончательное обучение;

§ Вербализация сети с целью дальнейшего использования.

Следует рассмотреть самый сложный этап решения задач – сбор данных для обучения.

Набор данных для обучения должен удовлетворять нескольким критериям:

§ Репрезентативность — данные должны иллюстрировать истинное положение вещей в предметной области;

§ Непротиворечивость — противоречивые данные в обучающей выборке приведут к плохому качеству обучения сети.

Исходные данные преобразуются к виду, в котором их можно подать на входы сети. Каждая запись в файле данных называетсяобучающей парой или обучающим вектором. Обучающий вектор содержит по одному значению на каждый вход сети и, в зависимости от типа обучения (с учителем или без), по одному значению для каждого выхода сети. Обучение сети на «сыром» наборе, как правило, не даёт качественных результатов. Существует ряд способов улучшить «восприятие» сети.

§ Нормировка выполняется, когда на различные входы подаются данные разной размерности. Например, на первый вход сети подаются величины со значениями от нуля до единицы, а на второй — от ста до тысячи. При отсутствии нормировки значения на втором входе будут всегда оказывать существенно большее влияние на выход сети, чем значения на первом входе. При нормировке размерности всех входных и выходных данных сводятся воедино;

§ Квантование выполняется над непрерывными величинами, для которых выделяется конечный набор дискретных значений. Например, квантование используют для задания частот звуковых сигналов при распознавании речи;

§ Фильтрация выполняется для «зашумленных» данных.

Кроме того, большую роль играет само представление как входных, так и выходных данных. Предположим, сеть обучается распознаванию букв на изображениях и имеет один числовой выход — номер буквы в алфавите. В этом случае сеть получит ложное представление о том, что буквы с номерами 1 и 2 более похожи, чем буквы с номерами 1 и 3, что, в общем, неверно. Для того, чтобы избежать такой ситуации, используют топологию сети с большим числом выходов, когда каждый выход имеет свой смысл. Чем больше выходов в сети, тем большее расстояние между классами и тем сложнее их спутать.

Некоторые классификации нейронных сетей.

По типу входной информации:

1. Аналоговые нейронные сети (используют информацию в виде действительных чисел);

2. Двоичные нейронные сети (оперируют с информацией, представленной в двоичном виде)

По характеру обучения:

1. Обучение с учителем – выходное пространство решений нейронной сети известно;

2. Обучение без учителя – нейронная сеть формирует выходное пространство решений только на основе входных воздействий. Такие сети называют самоорганизующимимся;

3. Обучение с подкреплением – система назначения штрафов и поощрений от среды.

По характеру настройки синапсов:

1. Сети с фиксированными связями (весовые коэффициенты нейронной сети выбираются сразу, исходя из условий задачи, при этом: , где W — весовые коэффициенты сети);

2. Сети с динамическими связями (для них в процессе обучения происходит настройка синаптических связей, то есть , где W — весовые коэффициенты сети).

Нейроуправление.

Нейронные сети успешно применяются для синтеза систем управления динамическими объектами. Нейросети обладают рядом уникальных свойств, которые делают их мощным инструментом для создания систем управления: способностью к обучению на примерах и обобщению данных, способностью адаптироваться к изменению свойств объекта управления и внешней среды, пригодностью для синтеза нелинейных регуляторов, высокой устойчивостью к повреждениям своих элементов в силу изначально заложенного в нейросетевую архитектуру параллелизма.

Нейроуправление (англ. Neurocontrol) — частный случай интеллектуального управления, использующий искусственные нейронные сети для решения задач управления динамическими объектами. Нейроуправление находится на стыке таких дисциплин, какискусственный интеллект, нейрофизиология, теория автоматического управления, робототехника. Нейронные сети обладают рядом уникальных свойств, которые делают их мощным инструментом для создания систем управления: способностью к обучению на примерах и обобщению данных, способностью адаптироваться к изменению свойств объекта управления и внешней среды, пригодностью для синтеза нелинейных регуляторов, высокой устойчивость к повреждениям своих элементов в силу изначально заложенного в нейросетевую архитектуру параллелизма. Термин «нейроуправление», впервые был использован одним из авторовметода обратного распространения ошибки Полом Дж. Вербосом в 1976 году Известны многочисленные примеры практического применения нейронных сетей для решения задач управление самолетом, вертолетом, автомобилем-роботом, скоростью вращения вала двигателя, гибридным двигателем автомобиля, электропечью, турбогенератором, сварочным аппаратом, пневмоцилиндром, системы управления вооружением легкобронированных машин, моделью перевернутого маятника.

Методы нейроуправления

Схема прямого нейроуправления с обратной связью. На такте k нейроконтроллер получает на вход уставочное значение r(k+1) и оценку текущего состояния объекта S(k) и генерирует управляющее воздействие u(k), переводя объект управления в новое положение y(k+1).

По способу использования нейронных сетей методы нейроуправления делятся на прямые методы и непрямые методы. В прямых методах нейронная сеть обучается непосредственно генерировать управляющие воздействия на объект, в непрямых методах нейронная сеть обучается выполнять вспомогательные функции: идентификация объекта управления, подавление шума, оперативная настройка коэффициентов ПИД-контроллера. В зависимости от числа нейросетей, составляющих нейроконтроллер, системы нейроуправления делятся на одномодульные и многомодульные. Системы нейроуправления, которые применяются совместно с традиционными регуляторами, называются гибридными.

 

Подражающее нейроуправление.

Охватывает системы нейроуправления, в которых нейроконтроллер обучается на примерах динамики обычного контроллера по обратной связи, построенного, например, на основе обычной ПИД-схемы управления. После обучения нейронная сеть в точности воспроизводит функции исходного контроллера. В качестве примеров динамики контроллера может быть использована запись поведения человека-оператора. Обычный контроллер по обратной связи (или человек-оператор) управляет объектом управления в штатном режиме. Значения величин на входе и выходе контролера протоколируются, и на основе протокола формируется обучающая выборка для нейронной сети, содержащая пар значений входа и ожидаемых реакций нейросети:

После обучения с помощью, например, метода обратного распространения ошибки, нейронная сеть подключается вместо исходного контроллера. Полученный нейроконтроллер может заменить человека в управлении устройством, а также быть более выгодным экономически, чем исходный контроллер.

Обобщённое инверсное нейроуправление.

В схеме обобщенного инверсного нейроуправления в качестве контроллера используется нейронная модель инверсной динамики объекта управления, называемаяинверсный нейроэмулятор. Инверсный нейроэмулятор представляет собой нейронную сеть, обученную в режиме офф-лайн имитировать обратную динамику объекта управления на основе записанных траекторий поведения динамического объекта. Для получения таких траекторий, на объект управления в качестве управляющего сигнала подают некоторый случайный процесс. Значения управляющих сигналов и ответных реакций объекта протоколируют и на этой основе формируют обучающую выборку.

В ходе обучения, нейронная сеть должна уловить и запомнить зависимость значений управляющего сигнала от последуюшего значения реакции объекта управления , находящегося перед этим в состоянии . При управлении объектом, инверсный нейроэмулятор подключается как контроллер, получая при этом на вход значения уставки и состояния объекта управления, поступающего по каналу обратной связи.

Предполагается, что сформированная при обучении инверсная модель объекта управления является адекватной, следовательно сигнал управления, выдаваемый нейронной сетью, обеспечит переход объекта в положение, заданное уставкой.

Метод обратного пропуска ошибки через прямой нейроэмулятор

 

Метод обратного пропуска ошибки через прямой нейроэмулятор основан на идее применения тандема из двух нейронных сетей, одна из которых выполняет функцию контроллера, а вторая — модели объекта управления, которая носит название прямой нейроэмулятор. Прямой нейроэмулятор служит для вычисления градиента ошибки нейроконтроллера в процессе его обучения и далее не используется. Можно сказать, что нейроконтроллер и нейроэмулятор представляют собой единую нейросеть, при этом, при обучении нейроконтроллера веса прямого нейроэмулятора «замораживаются». Прямой нейроэмулятор обучается первым. Для этого, на вход объекта управления подается случайный управляющий сигнал , изменяющий положение объекта управления , и формируется обучающая выборка :

Обучение прямого нейроэмулятора выполняется в режиме офф-лайн. Прямой нейроэмулятор считается обученным, если при одинаковых значениях на входах нейроэмулятора и реального объекта, отличие между значениями их выходов становится незначительным. После завершения обучения прямого нейроэмулятора, проводится обучение нейроконтроллера. Обучение выполняется в режиме он-лайн по такой же схеме, как и в случае специализированного инверсного нейроуправления. Сначала (на такте ) на вход нейроконтроллера поступает желаемое положение объекта управления для следующего такта . Нейроконтроллер генерирует сигнал управления , который поступает на входы объекта управления и нейроэмулятора. В результате, управляемый объект переходит в положение , а нейроэмулятор генерирует реакцию . Далее вычисляется ошибка управления и пропускается в обратном направлении по правилу обратного распространения. Весовые коэффициенты связей нейроэмулятора при этом не корректируются. Механизм обратного прохождения ошибки через прямой нейроэмулятор реализует локальную инверсную модель в текущей точке пространства состояний объекта управления. Пройдя через нейроэмулятор, ошибка далее распространяется через нейроконтроллер, но теперь ее прохождение сопровождается коррекцией весовых коэффициентов нейроконтроллера. Прямой нейроэмулятор при этом выполняет функции дополнительных слоев нейроной сети нейроконтроллера, в которых веса связей не корректируются.

Метод нейроуправления с эталонной моделью

Метод нейроуправления с эталонной моделью — вариант нейроуправления по методу обратного пропуска ошибки через прямой нейроэмулятор, с дополнительно внедренной в схему эталонной моделью динамической системы, имитировать поведение которой обучается нейроконтроллер. Это делается в целях повышения качества переходного процесса: в случае, когда переход объекта в целевое положение за один такт невозможен, траектория движения и время осуществления переходного процесса становятся плохо прогнозируемыми величинами и могут привести к неустойчивости переходного процесса. Для уменьшения этой неопределенности, вводится эталонная модель, представляющая собой, как правило, устойчивую линейную динамическую систему первого или второго порядка. В ходе обучения, эталонная модель на такте получает на вход уставку и генерирует опорную траекторию , которая сравнивается с положением объекта управления с целью получить ошибку управления , минимизировать которую обучается нейроконтроллер.

 

Метод нейросетевой фильтрации внешних возмущений

Метод нейросетевой фильтрации внешних возмущений служит для улучшения качества работы контроллера в цепи управления. Изначально, эта схема была предложена Б. Уидроу для использования совместно с нейроконтроллерами, обученными по методуобобщенного инверсного нейроуправления. В более поздней работе им были применены нейроконтроллеры, обученные по методу обратного распространения ошибки через прямой нейроэмулятор. В принципе, нейросетевую фильтрацию ошибок можно использовать для повышения качества работы контроллера любого типа, не обязательно нейросетевого. В этой схеме используется две предварительно обученных нейронных сети: инверсный нейроэмулятор, обученный так же, как это делается в методе обобщенного инверсного нейроуправления и прямой нейроэмулятор, обученный так же, как это делается в методе обратного распространения ошибки через прямой нейроэмулятор. Пусть на объект управления поступает управляющий сигнал , явившийся результатом суммирования сигнала контроллера и корректирующего сигнала системы фильтрации внешних возмущений , вычисленного на предыдущем такте. Сигнал направляется на прямой нейроэмулятор объекта управления, а реакция прямого нейроэмулятора сравнивается с реальным положением системы . Разница этих величин трактуется как нежелательное отклонение системы, вызванное внешним возмущением. Для подавления нежелательного эффекта, сигнал поступает на инверсный нейроэмулятор, который рассчитывает корректирующий сигнал для корректировки управляющего сигнала нейроконтроллера на следующем такте. Для использования этого метода, объект управления должен обладать обращаемой динамикой, а также необходимо иметь адекватную математическую или имитационную модель объекта управления для обучения прямого и инверсного нейроэмуляторов.

Прогнозирующее модельное нейроуправление

Прогнозирующее модельное нейроуправление минимизирует функционал стоимости интегральной ошибки , прогнозируемой на , тактов вперед:

Здесь — ошибка выхода системы, — вклад изменения управляющего сигнала в общий функционал стоимости . Для прогнозирования будущего поведения системы и вычисления ошибок используется прямой нейроэмулятор, обученный так же, как в методе обратного распространения ошибки через прямой нейроэмулятор. Примечательность рассматриваемого метода состоит в том, что в нем отсутствует обучаемый нейроконтроллер. Его место занимает оптимизационный модуль, работающий в режиме реального времени, в котором может быть использован, например, cимплекс-метод или квази-Ньютоновский алгоритм.

Оптимизационный модуль получает на такте целевую траекторию на тактов вперед, а если ее нет, то раз дублирует значение текущей уставки и использует это в качестве целевой траектории. Далее, для выбора оптимального управляющего воздействия, вычисления происходят во внутреннем цикле системы нейроуправления (его итерации обозначаются как ). За время одного такта управления оптимизационный модуль подает на вход нейроэмулятора серию различных воздействий , где — глубина прогнозирования, , получает различные варианты поведения системы, вычисляет для них функцию стоимости и определяет наилучшую стратегию управления . В итоге, на объект подается управляющий сигнал . На следующем такте стратегия пересчитывается заново.

 

 


Поделиться:

Дата добавления: 2015-08-05; просмотров: 133; Мы поможем в написании вашей работы!; Нарушение авторских прав





lektsii.com - Лекции.Ком - 2014-2024 год. (0.006 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав
Главная страница Случайная страница Контакты