Зачем нужна валидация нейросети

0
23

Искусственные нейронные сети управления технологическими процессами. Часть 2

Проверка качества входов

Напомним (см. ч. 1 ), персептрон, чтобы вычислить свой отклик, использует весовые коэффициенты и значения их смещения. Конечные значения генерируются посредством итеративного процесса обратного распространения. В процессе обучения значения показателей персептрона и их смещения корректируются так, чтобы свести к минимуму суммы квадратов ошибок (Sum Squared Error, SSE) между целевой функцией и моделью.

Как уже говорилось в первой части статьи, реальное пространство управления может привести к созданию недопустимой точки вектора внешнего управления пространством. Если входной вектор точки находится вне допустимого пространства управления, то должен быть введен заранее подготовленный план действий, направленный на смягчение воздействия от необученных результатов моделирования. Таким образом, здесь необходимо иметь некий альтернативный контроль или стратегию измерения. На рис. 2 представлена модель базовой стратегии контроллера, которая в случае возникновения ситуации, находящейся вне ее пространства управления, подает аварийные сигналы оператору, и система автоматически переключается на альтернативный алгоритм управления. Такое переключение также может быть оставлено на усмотрение оператора, если характеристики процесса являются, по его мнению, приемлемыми. Такая ситуация может иметь место потому, что имеются случайные флуктуации в части входного воздействия на модель, которые эффективно зажаты передаточной функцией скрытого слоя нейронной сети.

Нейронные сети могут решать чрезвычайно сложные задачи, потому что, когда они получают много входной информации, они «естественным» образом находят математические модели, как дети находят языковые модели. Но такой подход к обработке сигналов отнюдь не безошибочен.

Перед обучением может иметь место ситуация, когда нейроны сети должны быть инициализированы случайным посевом их значений (называемых еще весами) и их случайным смещением (т. е. разбросом, отклонением). Первоначальный случайный посев считается в этом случае наилучшим вариантом, потому что целевая функция нам неизвестна.

Если персептрон (разъяснение данного термина дано в ч.1 статьи ) использует сигмоидальную функцию, то нормализация осуществляется в промежутке между «0» и «1». При использовании в качестве передаточной сигмоидной функции в виде гиперболического тангенса (tansig) нормализация осуществляется в промежутке между «–1» и «+1». Таким образом, диапазон инженерных установок каждой переменной процесса масштабируется в заданных пределах нормирования.

Большинство программ обучения нейронной сети работают на настольных компьютерах, а основные платформы управления уже имеют весь необходимый набор команд для настройки модели нейронной сети. Там, где это возможно, кодирование нейронов на платформе управления должно быть выполнено в подпрограммах, позволяющих повторное использование кода на будущих моделях. В работающих моделях все входы должны быть проверены на соответствующие качественные показатели и допустимое пространство управления. Если входы находятся вне допустимого пространства управления, то должна предусматриваться альтернативная стратегия управления.

ЧИТАТЬ ТАКЖЕ:  Какие профессии заменит искусственный интеллект в ближайшее время

Пройдемся по терминологии

Например, НАСА опубликовало довольно длинный документ, озаглавленный «Verification & Validation of Neural Networks for Aerospace Systems». Если вы интересуетесь нейронными сетями больше, чем я, вы можете начать с этого документа. Если вы настоящий фанат V&V, вам следует посмотреть книгу «Methods and Procedures for the Verification and Validation of Artificial Neural Networks»; ее объем составляет 293 страницы и, безусловно, превышает мои знания по этой теме как минимум на три порядка.

Отчеты об обучении должны быть получены и проверены для всех моделей. Отчет должен включать в себя записи набора данных, архитектуру нейронной сети, финальный (окончательный) график обучения, а также данные по сокращению SSE на итерацию для обучения и тестовое подмножество для целей регулирования.

Выбор более ранней точки остановки — это стратегия подготовки цикла выхода из обучения. Она предназначена для обеспечения оптимального сокращения SSE от обучающих данных, при этом модель остается достаточно надежной и устойчивой, а ее перетренированность предотвращается.

Никто, конечно, не собирается осуждать четырехлетнего ребенка за то, что он сказал: «I goed to the park». Но если бы видный политик выступал с важной речью и неоднократно повторял «goed», «holded», «finded, «knowed» и т. д., аудитория была бы серьезно недовольна (или крайне озадачена), и политическая карьера спикера могла бы внезапно закончиться.

В рабочей модели испытание должно быть выполнено таким образом, чтобы доказать, что входы действительно соответствуют управлению пространством. Напомним (см. ч. 1, глава «Управление пространством»), что модель имеет лишь те знания, относящиеся к области управления пространством, где она проходила обучение. Эффективный метод тестирования — использование набора центроидов векторов точки (более известных как радиус-вектор, который описывает координаты точки в данной системе координат) с отклонениями. Центроиды и их отклонения генерируются исходя из распределения векторов точки.

Ребенок, который никогда даже не слышал слова «грамматика», может постоянно создавать правильные формы глаголов, потому что его или ее мозг естественным образом распознал и сохранил закономерности, содержащиеся в огромном количестве исходных лингвистических данных, которые дети получают от взрослых людей, с которыми они взаимодействуют.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь