8 (495) 987 43 74 доб. 3304 Прием заявок на рассмотрение статей E-mail: evlasova@synergy.ru

Мы в соцсетях -              
Рус   |   Eng

Купить статью

Авторы: Катаев  А. А., Викулин  М. А.     Опубликовано в № 2(92) 30 апреля 2021 года
Рубрика: Программная инженерия

Опыт работы с системами управления и мониторинга используемых вычислительных ресурсов корпоративных высокопроизводительных вычислительных кластеров

В представленной статье рассматриваются современные системы мониторинга серверов. Обозреваемая предметная область касается контроля и управления высокопроизводительными вычислительными комплексами (ВВК). Данные системы применяются в различных отраслях науки и промышленности для проведения моделирования систем и их поведения в различных условиях. Скорость проведения моделирования зависит от применяемых технических решений в составе вычислительного комплекса. К ним относят тип внутренней сети, количество и разновидности вычислительных узлов. Для вычислительных узлов рассматривают такие параметры, как архитектура и модель процессора, количество оперативной памяти. Особенности, связанные с реализацией конкретных математических моделей, влияющие на скорость расчетов, в данной статье не рассматриваются. В работе проведен анализ существующих рыночных решений и основных применяемых концепций для систем управления и мониторинга подобных комплексов. Рассматриваемые системы оцениваются с экономической и технической точек зрения. Для доступных систем проводится натурное исследование способностей по управлению кластером и мониторингу состояния. Фиксируемый системой мониторинга набор параметров берется исходя из общей архитектуры ВВК и подхода к администрированию серверных систем. Практическая часть описывает опыт проектирования и реализации перспективной системы управления. В создаваемой системе основное внимание сосредоточено на создании системы управления. Обоснование необходимости отдельного программного продукта приведено по тексту статьи. Вопросы реализации в конкретном программном коде и системной среде опущены как зависимые от конкретного исполнения системы. Задача создания собственной системы мониторинга принята ничтожной при условии наличия существующих решений.

Ключевые слова

мониторинг, ВВК, управление кластером, HPC, SLURM

Автор статьи:

Катаев  А. А.

Ученая степень:

студент, кафедра 316 «Системное моделирование и автоматизированное проектирование», Институт № 3 «Системы управления, информатика и электроэнергетика», Московский авиационный институт (национальный исследовательский университет)

Местоположение:

г. Москва, Россия

Автор статьи:

Викулин  М. А.

Ученая степень:

преподаватель, кафедра 316 «Системное моделирование и автоматизированное проектирование», Институт № 3 «Системы управления, информатика и электроэнергетика», Московский авиационный институт (национальный исследовательский университет)

Местоположение:

г. Москва, Россия