Стандарт COM-HPC

Качественное обслуживание пограничных серверов: новая спецификация COM-HPC

Опубликовано в номере:
PDF версия
Консорциум PICMG выпустил спецификацию интерфейса COM-HPC для управления платформами встраиваемых систем. Сделано это для того, чтобы помочь инженерам пограничных серверов управлять системами удаленно. Например, если система зависла, ИТ-администратор может перезапустить ее, нажав кнопку Reset с таким же эффектом, как если бы он лично пришел на завод или другой объект. Спецификация ориентирована на проектирование компьютеров на базе компьютеров-на-модулях (Computer-on-Modules) на основе стандарта COM-HPC и разработана для упрощения технической поддержки и повышения качества обслуживания.

Возможности удаленного управления, включая внеполосное управление, — стандартные функции для ИТ-администраторов. Эти возможности предусматривают функции мониторинга системы, установку новых обновлений и исправлений, а также устранение неполадок без физического присутствия специалиста в серверных комнатах.

Для многих поставщиков ИТ-услуг стандартной практикой является удаленный доступ к локальным серверам клиентов или размещение их в облаке. С появлением новой спецификации интерфейса PICMG COM-HPC возможности удаленного управления, поддерживающие эту испытанную годами процедуру, будут распространяться и на технологии уровня пограничных серверов и шлюзов (рис. 1). Удаленное управление требуется для того, чтобы преодолеть разрыв между ИТ-технологиями бизнес-уровня и производственными операционными технологиями (OT). Это необходимое условие для обеспечения оцифровки процессов и технологий на основе пограничного сервера и на уровне шлюза индустриального «Интернета вещей» — системы объединенных компьютерных сетей и подключенных к ним промышленных объектов со встроенными датчиками и программным обеспечением для сбора и обмена данными, с возможностью удаленного контроля и управления в автоматизированном режиме, без участия человека.

Стандарт COM-HPC разработан для нового распределенного уровня периферийных вычислений, поэтому поставщикам услуг для этого ИТ-уровня необходимы комплексные функции удаленного управления, аналогичные распределенному локальному или облачному оборудованию

Рис. 1. Стандарт COM-HPC разработан для нового распределенного уровня периферийных вычислений, поэтому поставщикам услуг для этого ИТ-уровня необходимы комплексные функции удаленного управления, аналогичные распределенному локальному или облачному оборудованию

Инженеры, проектирующие платформы пограничного уровня на основе компьютеров-на-модулях, обычно хотят реализовать эти возможности таким образом, чтобы адаптировать их к конкретным требованиям. Решая эту задачу, консорциум PICMG представил для управления системой дополнительную спецификацию COM-HPC. Чтобы не изобретать велосипед, части вспомогательной спецификации COM-HPC будут основаны на специ­фикации интерфейса интеллектуального управления платформой IPMI (Intelligent Platform Management Interface). Теперь, когда цели определены, а задачи поставлены, давайте глубже погрузимся в подспецификацию COM-HPC, посвященную интерфейсу управления системой, чтобы понять, какие преимущества он приносит в решения на основе COM-HPC.

Эта работа основана на спецификации IPMI еще и потому, что данная спецификация существует с 1998 г. и достигла стабильного состояния после внесения дополнительных изменений, опубликованных в 2001 и 2004 гг., кроме того, она пользуется всеобщим признанием. Подкомитет консорциума PICMG также использовал спецификацию Redfish, основанную на API передачи репрезентативного состояния (RESTful), и продолжает выпускать новые релизы с новыми функциями.

 

Долговечность и стабильность имеют значение

Спецификация IPMI определяет протоколы, интерфейсы и архитектуру для мониторинга и управления компьютерной подсистемой, стандартизирует формат описания низко­уровневого оборудования, а также формат отправки и получения сообщений от контроллера управления платой BMC (board management controller). Сообщения IPMI могут быть отправлены по сети на BMC удаленной системы или от BMC к локальной подсистеме, такой как источник питания (рис. 2). Эта универсальность в отношении отправки сообщений IPMI позволяет разделить сложные административные задачи на несколько составляющих. Сообщения могут запрашивать текущее состояние оборудования или указывать BMC на определенные действия. Например, указывать BMC на увеличение охлаждения системы либо системе на перезагрузку или считывать показания того или иного датчика. Включение передачи задач управления на выделенный физический аппаратный компонент снижает нагрузку на аппаратное обеспечение хоста и операционную систему в целом. Спецификация IPMI также отделяет управление системой от целевой платформы, так что функции управления системой могут быть запущены, даже если целевая платформа не работает. Все эти функции фактически превратили спецификацию IPMI в стандарт для управления серверным оборудованием. Долговечность спецификации обеспечивается тем, что ее разработчики предусмотрительно сделали все необходимые команды очень простыми, не оставляя места для конфликтов и недоразумений.

Вызовы IPMI могут быть отправлены по сети в удаленную систему или в локальную подсистему. В большинстве случаев причиной расширения функций IPMI на подсистемы, такие как компьютер-на модуле (Computer-on-Modules), является модульность системы

Рис. 2. Вызовы IPMI могут быть отправлены по сети в удаленную систему или в локальную подсистему. В большинстве случаев причиной расширения функций IPMI на подсистемы, такие как компьютер-на модуле (Computer-on-Modules), является модульность системы

Гибкая структура спецификации IPMI, помимо обязательных и дополнительных команд исходной спецификации, позволяет добавлять новые сетевые функции (NetFn) и инструкции. Различные отраслевые рабочие группы уже воспользовались этой предоставленной им свободой и определили собственные специфические сетевые функции и команды для работы с технологиями и функциями, о которых не думали при создании спецификации.

 

Множество вариантов удаленного управления

В системах типа «компьютер-на-модуле» гибкая структура упрощает внесение корректировок, необходимых для добавления удаленного управления. Одно изменение касалось встроенного электрически стираемого перепрограммируемого ПЗУ — EEPROM COM-HPC (EEEP). EEEP содержит информацию о поставщиках, слотах памяти, сетевых возможностях и многом другом. Большая часть этой информации аналогична той, что хранится в заменяемом на месте модуле IPMI (FRU, Field Replaceable Unit). Чтобы избежать дублирования этих данных, функции удаленного управления COM-HPC предусматривают рекомендации о том, как устройство IPMI должно заполнять FRU информацией, содержащейся в устройстве EEEP.

Учитывая широкий спектр рынков модулей COM-HPC, в том числе удаленные центры обработки данных, туманные/пограничные серверы и удаленные полевые установки, крайне важно иметь гибкий набор вариантов удаленного управления. Разработчики также должны принимать во внимание, что стандарт определяет весьма разные уровни зрелости поддержки IPMI для модулей и несущих плат (рис. 3). Уровни зрелости IPMI-модулей варьируются от неуправляемых модулей (unmanaged module — M.U) и базовых управляемых модулей (basic managed module — M.B) до полностью управляемых модулей (fully managed module — M.F). Уровни несущих плат варьируются от не­управляемых (unmanaged — C.U) до управляемых несущих плат (managed carrier board — C.M). Различия подробно объясняются в спецификации, но на этом этапе главное — знать, что все эти модули и несущие платы остаются совместимыми. Спецификация COM-HPC IPMI позволяет всем типам несущих плат правильно работать со всеми типами модулей.

Модули и несущие платы могут иметь разные уровни зрелости поддержки IPMI, но они остаются совместимыми между собой, что позволяет создавать различные конфигурации системы — от одной неуправляемой несущей платы с четырьмя управляемыми модулями до управляемой несущей платы с неуправляемым модулем

Рис. 3. Модули и несущие платы могут иметь разные уровни зрелости поддержки IPMI, но они остаются совместимыми между собой, что позволяет создавать различные конфигурации системы — от одной неуправляемой несущей платы с четырьмя управляемыми модулями до управляемой несущей платы с неуправляемым модулем

 

Ключевая черта — гибкость

В ходе поисков решения проблемы дистанционного управления подкомитет COM-HPC IPMI консорциума PICMG пришел к выводу, что различные сценарии, в которых необходимы разные базовые функции управления, не могут и не будут обслуживаться одним универсальным решением. Соответственно, для таких задач, как включение и выключение системы или указание системе получить информацию о сети, доступно несколько комбинаций конструкции модуля и несущей.

Например, при работе с одной несущей платой, содержащей до четырех модулей, более эффективно для каждого модуля иметь независимые возможности полного управления. Однако другой сценарий может выиграть от полноценной реализации IPMI на несущей плате, позволяющей настраивать определенные функции независимо от того, является ли модуль управляемым или неуправляемым. Кроме того, всегда существуют системные решения, которым просто не нужны функции управления. И всегда найдутся системные решения, которым необходимы минимальные возможности управления. Таким образом, было важно установить приоритет взаимодействия между всеми уровнями управления модулями.

 

Гибкое управление и контроль платформ

Чем больший доступ к системным ресурсам предоставляется, тем мощнее становится интерфейс интеллектуальной шины управления платформой IPMI. Эта взаимосвязь между доступом и мощностью является причиной того, что новая спецификация COM-HPC имеет некоторые особые интерфейсы, которые, собственно, и обеспечивают наиболее полные функции управления системой. Первый среди них — интерфейс интеллектуальной шины управления платформой, который позволяет несущей плате BMC получать доступ к контроллеру управления модулями MMC (Module Management Controller). Но эта шина не ограничивается спецификацией. Одним из новых интерфейсов, специально предназначенных для несущей платы BMC, стала выделенная линия PCI Express Lane, которая содержит графический контроллер и управляет им. Дополнительные интерфейсы, предназначенные для использования IPMI, — это интерфейс I2C, порты USB и кнопки питания. С помощью этих выделенных каналов IPMI, также доступных удаленно через BMC, системные администраторы могут контролировать поведение почти всей платформы, чтобы обеспечить наилучшее качество обслуживания, в том числе и удаленного, и минимизировать время простоя. Ниже приведено несколько примеров:

  • Для доступа к данным EEEP на модуле можно использовать интерфейс I2
  • Для эмуляции USB-устройств, таких как клавиатура и мышь или DVD-дисковод, можно задействовать порты
  • Для дистанционного включения/выключения системы можно использовать элементы управления питанием.
  • Пока BMC выполняет дополнительную инициализацию платформы для задержки загрузки системы, могут использоваться элементы управления питанием.

Таким образом, новая подспецификация PICMG COM-HPC открывает путь для комплексной функциональности управления платформой IPMI. Так что теперь для реализации возможностей, предоставляемых IPMI, инженеры-разработчики могут думать о схемах проектирования оборудования, а поставщики модулей и их партнеры — работать над реализациями BMC и MMC, например используя SP-X и/или открытое стандартное микропрограммное обеспечение, в частности OpenBMC.

OpenBMC — совместный проект с открытым исходным кодом Linux Foundation, целью которого является создание реализации с открытым исходным кодом стека прошивки контроллеров платы управления. Этот дистрибутив Linux может использоваться для контроллеров управления, установленных в серверах, коммутаторах в верхней части стойки и других устройствах. Например, в RAID-устройствах (Redundant Array of Independent Disks) — избыточных массивах независимых дисков по технологии виртуализации данных для объединения нескольких физических дисковых устройств в логический модуль для повышения отказоустойчивости и (или) производительности.

OpenBMC оптимален для систем на базе COM-HPC следующего поколения и использует Yocto, OpenEmbedded, systemd и D-Bus для легкой настройки платформ. Он полностью соответствует IPMI 2.0 и DCMI и имеет функции управления хостом, такие как питание, охлаждение, светодиоды, инвентаризация, события и сторожевой таймер. OpenBMC предлагает широкий выбор интерфейсов — от удаленного KVM, SOL на основе SSH и пользовательских веб-интерфейсов до интерфейсов на основе REST и D-Bus. При использовании OpenBMC инженеры-разработчики, кроме всего прочего, получают преимущества от моделирования оборудования, а также от функций автоматического тестирования. Последний набор функций дополняет поддержка обновления кода для нескольких образов BMC/BIOS.

 

Заключение

Для системных разработчиков и сборщиков систем основное преимущество состоит в том, что, хотя спецификация PICMG COM-HPC Computer-on-Modules и является совершенно новой, она включает проверенные технологии управления IPMI и Redfish, позволяющие легко внедрять инновации. Это несомненно придаст импульс принятию новой спецификации PICMG COM-HPC Computer-on-Modules.


Первые клиентские модули COM-HPC компании congatec, доступные на рынке, оснащены одиннадцатью вариантами процессоров Intel Xeon, Core и Celeron (кодовое название Tiger Lake U и Tiger Lake H). Стартовый комплект компании congatec с несущей платой и решением для охлаждения уже доступен функционально. Варианты реализации COM-HPC PMI для конкретных клиентов поддерживаются по запросу.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *