8 (495) 987 43 74 доб. 3304 Прием заявок на рассмотрение статей E-mail: evlasova@synergy.ru

Мы в соцсетях -              
Рус   |   Eng

Авторы

Окунев Б. В.

Ученая степень
канд. техн. наук, доцент, кафедра информационных технологий в экономике и управлении, филиал Национального исследовательского университета «МЭИ» в г. Смоленске
E-mail
ok-bmv@rambler.ru
Местоположение
г. Смоленск, Россия
Статьи автора

Решение задачи препроцессинга календарных данных в ходе реализации технологии Data Mining

В настоящий момент «грязные» данные, то есть данные низкого качества, становятся одной из главных проблем эффективного решения задач Data Mining. Так как исходные данные аккумулируются из самых разных источников, то вероятность попадания «грязных» данных весьма высока. В связи с этим одной из важнейших задач, которую приходиться решать в ходе реализации Data Mining-процесса, является первоначальная обработка (очистка) данных, то есть препроцессинг. Необходимо заметить, что препроцессинг календарных данных является достаточно трудоемкой процедурой, которая может занимать до половины всего времени реализации технологии Data Mining. Сокращения времени, затрачиваемого на процедуру очистки данных, можно достичь, автоматизировав процесс с помощью специально разработанных инструментов (алгоритмов и программ). При этом следует помнить, что применение вышеуказанных элементов не гарантирует стопроцентную очистку «грязных» данных, а в некоторых случаях даже может приводить к появлению дополнительных ошибок в исходных данных. Авторами разработана модель автоматизированного препроцессинга календарных данных на основе синтаксического анализа и регулярных выражений. Предлагаемый алгоритм отличается гибкой настройкой параметров препроцессинга, достаточно простой реализуемостью и высокой интерпретируемостью результатов, что в свою очередь дает дополнительные возможности при анализе неудачных результатов применения технологии Data Mining. Несмотря на то, что предлагаемый алгоритм не является инструментом очистки абсолютно всех типов «грязных» календарных данных, он успешно функционирует в значительной части реальных практических ситуаций. Читать дальше...

Виртуализация контейнера тестирования уязвимостей информационных объектов на основе технологии DeX и нейронных сетей глубокого обучения

Современное развитие средств обеспечения информационной безопасности, наряду с усовершенствованием методик удаленного доступа, позволяет производить аудит программно-аппаратных компонентов без необходимости прямого доступа к тестируемой системе. В рамках данного направления развития выделяется подход, позволяющий интегрировать дистрибутивы на базе ядра Linux представлением виртуального контейнера chroot в системе на базе Android OS и, как следствие, осуществлять тестирование на проникновение без необходимости использования персональных компьютеров. Примером реализации данного подхода является дистрибутив Kali NetHunter, позволяющий за счет модуля KeX реализовать функционал удаленного администрирования системой. Кроме очевидных преимуществ KeX функционала также следует выделить ряд недостатков – низкая скорость обработки графической оболочки за счет трансляции на удаленных хост и необходимость поддержки трансляции на уровне операционной системы. Вторая проблема – затраты энергоресурсов при использовании возможностей рабочего стола в KeX модуле. Для решения указанных проблем была разработана система виртуализации энергоэффективного контейнера тестирования уязвимостей критически важных информационных объектов, основной принцип действия которой – мульти- контейнеризация. Программная составляющая представлена двумя элементами: модулем интеграции контейнера chroot в среду DeX и модулем обеспечения энергоэффективности за счет использования предиктивных моделей нейронных сетей. В результате сравнения эффективности существующих и реализованного подхода при тестировании на проникновение отмечено, что предлагаемая система может быть использована при тестировании безопасности различных информационных объектов. Читать дальше...

Нечеткологическая модель многостадийной химико-энерготехнологической системы переработки мелкодисперсного рудного сырья

Представлены результаты исследования, целью которого являлось построение программной модели многостадийной комплексной системы переработки мелкодисперсного рудного сырья. В роли такого сырья могут выступать отходы переработки на горно-обогатительных комбинатах апатит-нефелиновых и других видов руд, в больших объемах скапливающиеся в хвостохранилищах. Они создают значительную экологическую угрозу на прилегающих к комбинатам территориях за счет выветривания, пылеобразования, проникновения в почву и водоносные горизонты опасных для здоровья человека химических соединений и веществ. Поэтому совершенствование существующих производственных процессов, разработка новых технологических систем для горно-обогатительных комбинатов, включая применение принципов экономики замкнутого цикла, вторичной переработки отходов, обосновывает актуальность выбранного направления исследований. В основе предложенной программной модели лежит применение обучаемых деревьев систем (блоков) нечеткого вывода первого и второго типов. Такой подход позволил избежать излишнего усложнения баз правил нечеткого вывода при использовании только одного нечеткого блока при построении многопараметрической модели всей многостадийной комплексной системы. Применение нескольких блоков нечеткого вывода, описывающих поведение отдельных агрегатов системы и их конфигурирование в соответствии с физической структурой системы, позволяет использовать относительно простые наборы правил отдельных блоков. Совместный подбор их параметров при обучении дерева нечетких блоков позволяет достигать высокой точности получаемых решений. Новизну результатов исследования составляет предложенная программная нечеткологическая модель комплексной системы переработки мелкодисперсного рудного сырья. Представлены результаты имитационного эксперимента, проведенного в среде MatLab с использованием сгенерированного в Simulink синтетического набора данных. Результаты показали, что обученная нечеткологическая модель обеспечивает хорошую точность воспроизведения параметров и переменных из тестовой части синтетического набора. Научная новизна предлагаемого алгоритма заключается в расширении перцептивного поля для каждой из сетей за счет взаимного преобразования изображений и временных последовательностей друг в друга. За счет этого каждая из сетей обучается на большем объеме данных и выявляет больше закономерностей. Это в конечном итоге приводит к повышению качества классификации, что подтверждается результатами апробирования предложенного алгоритма с использованием разработанного в среде MatLab программного приложения. Читать дальше...