искусственные нейронные сети

Искусственные нейронные сети управления технологическими процессами
Часть 1. Основные понятия

Опубликовано в номере:
PDF версия
Искусственные нейронные сети уже в течение многих лет с большим успехом используются в рамках стратегии управления технологическими процессами. В данной серии статей рассматривается процесс организации такой нейронной сети. В первой части описаны сетевая архитектура, управление пространством, типы данных, выбор набора данных и другие базовые положения создания нейронной модели.

Как следует уже из самого названия, искусственная нейронная сеть (ИНС) является построенной по принципу организации и функционирования биологических нейронных сетей математической моделью, а также ее программным или аппаратным воплощением. В ИНС нейрон, получивший свое название от своего биологического аналога, моделируется как небольшой сегмент компьютерного кода, который называется «персептрон». В ИНС отдельные нейроны соединяются между собой в сеть, которая посредством специального обучения определяет, как ей реагировать на те или иные раздражители. Этот процесс является интерактивным, так как необходимо представить определенные воздействия, сравнить реакцию на них и выполнить необходимую коррекцию для ответа. Способность к обучению ИНС дает большую гибкость для получения ответа, лежащего в основе функционирования процесса, даже с его атрибутами, которые не являются очевидными, такими как установка, возраст оборудования, накопленные в нем изменения или какой-либо иной не поддающийся численному измерению параметр.

Цели использования нейронных сетевых моделей вытекают из их возможностей:

  • моделирование линейных и нелинейных процессов;
  • моделирование сложных для понимания процессов;
  • имитация процессов, которые трудно смоделировать с помощью первопринципных уравнений;
  • моделирование процессов, основанных на не поддающихся измерению параметрах;
  • сокращение времени разработки модели для сложных процессов.

Как видно, есть несколько моментов, когда нейронные сетевые модели могут быть полезны для управления производственными технологическими процессами.

Например, они могут использоваться в приложениях, в которых модель предположительно получает не внушающие доверия данные измерений, что может повлиять на рентабельность производства. Или в тех случаях, когда требующим управления процессом из-за запаздывания в получении контрольных измерений можно манипулировать только в дискретные интервалы времени. Например, процесс в качестве обратной связи для управления может использовать данные лабораторных анализов. Однако лабораторные измерения имеют определенное запаздывание по времени, результаты не могут быть получены мгновенно. ИНС может обучаться по лабораторным данным для создания своеобразного виртуального инструмента, который можно использовать для управления процессом на постоянной основе. Модели на базе контроллеров могут использовать нейронные сетевые модели вместо первопринципных. Такой подход позволяет сократить время разработки и управлять процессом в том случае, когда требуется одновременно и заданное значение, и управление его изменением с использованием нескольких переменных управления. Кроме того, в производстве всегда есть такие процессы, которые весьма тяжелы для их понимания, они протекают либо слишком сложно, либо быстро меняются, чтобы для их описания можно было использовать первопринципные модели. ИНС могут преуспеть в поиске базовой реакции процесса как отклик на определенное входное воздействие.

 

Архитектура ИНС

Начиная с 80-х годов, были разработаны и проанализированы различные типы архитектуры обучающихся ИНС. Выбор типа архитектуры зависит от конкретного приложения. В приложениях промышленного управления, говоря в общем, модели стремятся имитировать функцию некоторого переменного процесса. Цель основана на базовых условиях этого процесса и данных, поступающих от его окружения. Самая простая архитектура для решения этой задачи — многослойная функционально-приближенная архитектура сети (рис. 1). Число нейронов в скрытом слое зависит от сложности целевой функции, но в целом они варьируются от трех до девяти.

искусственная нейронная сеть

Рис. 1. Упрощенное представление функционально-приближенной искусственной нейронной сети для четырех входов с тремя нейронами в скрытом слое

 

Управление пространством

Важным аспектом при разработке нейронных сетевых моделей является концепция измерения и управления пространством. Понятие «измерение пространства» — это многомерные пределы, определяемые диапазоном измерения для каждого входа, представляющего одно измерение. Массив входов называется «входным вектором». «Управление пространством» находится в пределах измерения пространства, а его пределы и формы зависят от распределения вектора точки записей данных входного вектора, используемых для обучения.

Рис. 2. Пример контроля пространства управления с двумя входами, используемыми для обучения: а) вектор точки, которая образована из записи 1; б) вектор точки, формируемый каждой записью; в) распределение векторов точек

Например, в модели может быть несколько независимых входов, p1…рk, и каждый из них будет формировать измерение в пространстве управления. Для простоты предположим, что мы имеем только два входа, то есть две записи данных (рис. 2).

Покрытие пространства управления определяется распределением вектора точки (рис. 3а). Если входы образуют вектор точки, находящийся вне пространства управления (рис. 3б), модель ИНС не может быть достоверной. Это происходит потому, что какого-либо ее обучения в этом пространстве не осуществлялось.

 

Выбор массива данных

Первостепенное значение при выборе записей для обучения ИНС имеет обеспечение такого набора записей, который охватывает не только заданный диапазон, но и целевой отклик по всему диапазону входного сигнала. Рис. 3в иллюстрирует, как целевой отклик на входы показывает его диапазон и функцию. Процесс формирования набора данных, подходящих для обучения ИНС, включает:

  • выбор целевой переменной;
  • выбор входного вектора элементов;
  • обработку типов данных;
  • исторический интеллектуальный анализ данных и/или параметрическое тестирование.

    Рис. 3. Графики показывают точки допустимого пространства управления (а), недопустимого пространства управления (б) и целевой диапазон (в)

Типы данных

Для функционально-приближенной архитектуры ИНС рекомендуется использовать данные в бинарном, целочисленном представлении, а также данные с плавающей запятой. Перечисления и строковый тип данных являются частными случаями, но они могут быть использованы, когда имеют место нарушения в данных от отдельных двоичных входов.

Выбор целевых элементов ввода переменной модели

Можно утверждать, что самой сложной задачей в моделировании ИНС является выбор технологических параметров, а именно, составляющих элементов вектора входных данных модели — p1…рk. Исходные данные модели должны быть представлены достоверными, надежными, независимыми переменными, которые оказывают наибольшее влияние на конечную цель. Когда процесс относительно прост, то наличие определенного опыта, как правило, является вполне достаточным, чтобы осуществить такой выбор. Тем не менее в некоторых случаях этот процесс может иметь больше чем несколько переменных, и выбор правильных элементов может оказаться весьма непростой задачей.

Кроме того, особое внимание должно быть уделено минимизации числа входов, поскольку каждый ненужный вход, который используется в модели, снижает ее устойчивость, добавляет помехи и увеличивает ее конечную стоимость. Чтобы помочь исключить менее значимые входы, существует несколько удобных инструментов.

Рис. 4. Причинно-следственная диаграмма Исикавы (а) показывает все возможные влияния, которые могут повлиять на целевое измерение. Произведенное сокращение переменных до тех, которые оказывают существенное влияние на цель (б)

На рис. 4а показана так называемая диаграмма типа «рыбьей кости»5 с описанием всех возможных воздействий, которые могли бы оказать влияние на целевое измерение. Исходя из этого необходимо стремиться уменьшить количество переменных таким образом, чтобы остались только те, которые оказывают существенное влияние на цель (рис. 4б). Сокращение переменных этим способом может привести к значительной экономии в стоимости процесса моделирования и потребности в измерительных приборах. Кроме того, это упрощает и саму модель.

Есть ряд программ, которые, чтобы определить значение каждой переменной по отношению к цели, выполняют анализ отклонений ANOVA

Рис. 5. График анализа значимости входов ИНС показывает входы, вклад которых выше нуля. Входы ниже нуля либо незначительны, либо находятся на уровне помехи

(от англ. ANalysis Of VAriance — Прим. перев.), направленный на поиск зависимостей в экспериментальных данных путем исследования значимости различий в средних значениях. Тем не менее если число переменных возрастает, то использовать механизм ANOVA становится намного сложнее. В одной из коммерчески доступных программ, предназначенных для определения актуальности значения входного параметра, применяется так называемый «подход дробовика», т. е., тактика широкого охвата в надежде, что туда попадется и желаемое. Как показано на рис. 5, программа использует набор данных, содержащий все входы, показанные на рис. 4а, и идентифицирует значимые данные, как это показано на рис. 4б.

Исторические данные и параметрическое тестирование

Чтобы приобрести необходимый для обучения набор данных, можно сделать интеллектуальный анализ ряда исторических данных (hystorian). Однако условия процесса и состояние системы не всегда известны именно с того момента, когда эти данные были сгенерированы. Поэтому здесь настоятельно рекомендуется создать перечень измерений и осуществить контроль исходных условий еще до формирования комплекта записи данных.

Для получения достоверных измерений и комплекта исходных данных необходимо выполнить калибровку всех передатчиков, используемых в качестве входных данных в модели, и убедиться, что все клапаны, приводы и нагреватели находятся в должном исправном рабочем состоянии.

До начала параметрического тестирования необходимо учесть некоторые условия, т. е., выполнить следующие шаги:

  • провести анализ всех опасных факторов еще до начала манипулирования процессом;
  • определить пределы открытия клапанов, установок регулятора скорости и так далее, которые будут использоваться при выполнении теста;
  • задать границы безопасного состояния, необходимые для того, чтобы успеть остановить процесс в случае возникновения непредвиденного развития событий;
  • записать все настройки фильтра ограничения помех;
  • определить время установки параметров после каждого параметрического испытательного маневра;
  • определить пределы безопасности и ограничения при выполнении параметрического тестирования;
  • обратить внимание на любые возможные и ожидаемые задержки в получении результатов измерений или задержки транспортирования;
  • убедиться, что все точки данных записываются в базу исторических данных;
  • убедиться, что все операции выполняются осознанно и в полном соответствии с процедурой испытания.

Рис. 6. Для новых или модернизируемых процессов наборы данных обычно генерируются в ходе работы системы во время параметрического тестирования после его запуска. Графики иллюстрируют манипулирование двумя клапанами (а) и тремя ответами для измерения расхода воды по показаниям трех расходомеров (б)

Для новых процессов или при модернизации имеющихся все наборы данных обычно генерируются в ходе работы системы параметрического тестирования сразу после запуска и настройки (рис. 6). Опыт показал, что наилучшие данные для модели можно получить, когда переменная достигла стационарного состояния после параметрического испытательного маневра. Следовательно, наборы данных, полученные еще до модернизации или изменения процесса, могут не дать ожидаемой производительности. Если производительность снижается, то может потребоваться повторное проведение параметрического теста.

Формирование записей обучающего набора данных

Когда параметрический тест завершен и данные хранятся уже в виде исторических, цель состоит в том, чтобы получить записи набора данных для обучения ИНС. На рынке есть несколько доступных пакетов программного обеспечения управления историческими данными. Многие из них имеют плагины для создания электронных таблиц. На рис. 7 показана предварительно разработанная электронная таблица.

Рис. 7. Фрагмент электронной таблицы с данными, полученными в ходе пробного тестирования и извлеченными из исторической базы

* * *

Во второй части статьи основное внимание будет уделено подготовке набора данных для обучения модели нейронной сети, самому процессу обучения, проверке модели, ее внедрению в платформу управления, а также требованиям к ИНС в части человеко-машинного интерфейса.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *