ИТ-менеджмент |
|
Управление эффективностью |
|
|
Линейный персонал занимает подавляющую часть должностей во многих организациях, что обуславливает важность своевременного и успешного закрытия подобных вакансий. Поиск кандидатов на такие должности происходит в рамках массового подбора, который характеризуется высокой трудоемкостью, бюджетными и временными ограничениями, необходимостью регулярного повторения из-за высоких показателей кадровой текучести. Отмеченные особенности делают выполнение этого процесса невозможным без применения современных программных средств. Поскольку массовый подбор не требует нахождения наилучшего кандидата для каждой вакансии, а ограничивается поиском специалистов по формальным признакам на основе их резюме, то основная доля трудовых и временных затрат приходится на первичный отбор кандидатов. Существующие программные средства не обладают достаточным функционалом для эффективной автоматизации указанного процесса, так как в условиях необходимости обработки больших объемов многомерных данных они не обеспечивают комплексный учет разнотипных характеристик кандидата и автоматическое подстраивание критериев отбора с учетом их приоритетности для заполняемой вакансии. Для решения указанной проблемы был разработан автоматизированный метод формирования набора кандидатов на линейные должности, основанный на комплексном использовании адаптивной нейро-нечеткой системы и биоинспирированного алгоритма, вдохновленного поведением косяка плавающих рыб. Разработанный гибридный метод был реализован в виде программы для ЭВМ с использованием языка Python. Результаты его тестирования показали сходимость оптимизационного алгоритма, а сравнение с ручным подбором – перспективность использования для решения задач массового подбора линейного персонала.
|
---|---|
Инструментальные средства |
|
|
В данной работе предложен метод анализа неполных и неточных данных с целью выявления факторов для прогнозирования объема селевых потоков. Анализ основан на данных кадастра селевой активности юга России, которые плохо формализованы, имеют отсутствующие значения в поле «типы селей», нуждаются в существенной дообработке. В связи с отсутствием сведений о типе селя в части записей кадастра первоочередной задачей исследования является разработка и применение методики классификации типов селевых потоков для восполнения недостающих данных. Для чего было выполнено сравнительное исследование методов машинного обучения, включая нейронные сети, метод опорных векторов и логистическую регрессию. Экспериментальные результаты свидетельствуют о том, что модель на основе нейронных сетей обладает наивысшей точностью предсказания среди рассмотренных методов. Однако метод опорных векторов продемонстрировал более высокий показатель чувствительности для классов, представленных небольшим количеством в тестовой выборке. В связи с чем был сделан вывод о целесообразности комплексного подхода, объединяющего сильные стороны обеих методик, что может способствовать повышению общей точности классификации в данной предметной области. Прогнозирование объема выноса материала и кластеризация данных показали наличие нелинейных зависимостей, неполноты и плохой структурированности данных даже после восполнения пропущенных значений типа селей, что потребовало перехода от числовых данных к категориальным. Такой переход повысил устойчивость модели к выбросам и шуму, позволив сделать прогноз о единовременном выносе с высокой точностью. Поскольку прогноз не раскрывает факторы, влияющие на его результат, был проведен анализ с целью выявления этих факторов и представления найденных закономерностей в виде логических правил. Формирование логических правил осуществлялось двумя методами: методом ассоциативного анализа и построением логического классификатора. В результате применения ассоциативного анализа были найдены правила, отражающие некоторые закономерности в данных, как оказалось, нуждающихся в существенной коррекции. Применение разработанных логических методов позволило уточнить и скорректировать закономерности, выявленные с использованием ассоциативных правил, что, в свою очередь, обеспечило определение комплекса факторов, влияющих на объем селевого потока.
|
Эффективные алгоритмы |
|
|
Предложены вероятностные модели прогнозирования и оценки достоверности навигационных параметров в интеллектуальных транспортных системах. Актуальность исследования обусловлена необходимостью повышения надежности роботизированных транспортных средств, работающих в динамически изменяющихся городских условиях. В таких средах возможны отказы датчиков, искажения сигналов и высокая степень неопределенности данных. Предложенный подход основан на применении методов вероятностного анализа и статистического контроля для выявления аномалий в навигационных параметрах, таких как координаты, скорость и ориентация. Введено понятие достоверности навигационных данных как количественного показателя, характеризующего степень соответствия измеренных параметров реальному состоянию системы. Определены ключевые критерии достоверности: доверительная вероятность, уровень значимости и доверительные коэффициенты. Для повышения надежности оценки параметров предложено сочетание статистических методов анализа и алгоритмов фильтрации. Прогнозирование включает предварительную обработку данных с целью сглаживания шумов и проверки их согласованности. Выявление выбросов осуществляется с помощью статистических методов, включая доверительные интервалы и минимизацию дисперсии. Разработана модель прогнозирования, основанная на фильтре Калмана и динамическом обновлении вероятностных оценок. Интеграция различных методов в единую систему позволяет минимизировать влияние случайных и систематических ошибок, обеспечивая более точную оценку навигационных параметров. Предложенный подход применим к разработке навигационных систем автономных роботов и беспилотного транспорта, позволяя им адаптироваться к внешним условиям без необходимости в точных априорных данных.
|
|
В условиях стремительного развития методов машинного обучения и причинно-следственных методов их интеграция в медицинские исследования приобретает особую актуальность. Внедрение подходящих методов в медицинскую область позволит проводить качественную оценку эффективности лечения на индивидуальном уровне. Цель настоящего исследования – проведение экспериментов на синтетических данных и оценка точности предсказания индивидуальных эффектов лечения с использованием методов T-learner и S-learner. В статье представлен интегрированный подход к анализу медицинских данных, сочетающий методы причинно-следственного анализа и алгоритмы машинного обучения. Впервые проведено комплексное сравнение эффективности методов T-learner и S-learner для оценки индивидуальных эффектов лечения. На основе симулированных данных экспериментально установлены условия оптимального применения этих методов в зависимости от характеристик клинических данных. По результатам проведенных экспериментов было установлено, что метод T-learner показал более высокую точность (87 %) по сравнению с S-learner (84 %), что делает его предпочтительным при существенных различиях между группами лечения и контроля. Однако метод S-learner показал более высокую обобщающую способность в условиях ограниченного объема данных. Для валидации предсказанных эффектов лечения применялся индекс c-for-benefit, результаты которого подтвердили высокую точность обоих методов. Полученные результаты подчеркивают потенциал интеграции методов машинного обучения и причинно-следственных методов для разработки персонализированных терапевтических стратегий и автоматизации анализа медицинских данных, позволяющих улучшить клинические исходы и качество лечения. Разработанный подход позволяет повысить точность прогнозирования результатов лечения на индивидуальном уровне и может быть интегрирован в системы поддержки принятия клинических решений. Полученные результаты предоставляют новые возможности для персонализации медицинской помощи и могут служить основой для последующих исследований в этой области.
|
Модели и методики |
|
|
Показатели достоверности функционирования характеризуют работоспособность системы «объект контроля – средство контроля» и существенно зависят от параметров надежности функционирования контролирующей аппаратуры. Следовательно, они могут служить критериями, по которым можно проводить выбор необходимых средств на этапе проектирования цифровых устройств и оценку их эффективности. В работе предлагаются количественные критерии оценки эффективности метода аппаратного контроля на основе предположения о том, что цифровое устройство выполняет некую обобщающую функцию, значения которой зависят от совокупности величин, отражающих отдельные режимы работы устройства, и могут классифицироваться как правильные только в случае отсутствия ошибок в работающем устройстве. Для количественной оценки достоверности функционирования аппаратуры предложено использовать значение вероятности того, что цифровое устройство в целом будет функционировать безошибочно при условии отсутствия обнаруживаемой неисправности. Рассчитанное значение оценки позволяет выбрать из нескольких возможных вариантов схемы контроля наилучший или синтезировать новый. Рассматриваются случаи организации процедур контроля на основе различных принципов и их сочетаний. Сформулирована оптимизационная задача размещения проверочных схем в контролируемом устройстве и предлагается методика ее решения в условиях наложения определенных ограничений. Отличительной особенностью предложенного подхода служит устранение необходимости применения значений условных вероятностей обнаруживаемых неисправностей, на использовании которых построены известные методы, хотя их практическое получение весьма трудоемко. Работа метода рационального размещения схем контроля иллюстрируется на примере блока управляющих сигналов.
|
Программная инженерия |
|
|
В статье исследуются способы повышения операционной эффективности ИТ-компаний за счет совершенствования подходов к решению задач на различных этапах жизненного цикла разработки программного обеспечения (SDLC). Показано, что наибольший потенциал роста операционной эффективности имеют задачи этапа работы с требованиями. Автоматизация таких задач с помощью инструментов искусственного интеллекта, в первую очередь основанных на больших языковых моделях (LLM), позволит существенно сократить время SDLC за счет уменьшения количества итераций по доработке и устранению ошибок. В работе проведен анализ возможностей подобных инструментов, а также сложностей, связанных с их внедрением, включая риск технологической зависимости, проблемы интеграции новых инструментов в текущий ИТ-ландшафт компаний, риски нарушения непрерывности процессов при внедрении, а также сложности оценки экономических эффектов. В заключении делается вывод о необходимости комплексного подхода к модернизации SDLC, который должен сочетать технологические инновации с организационными изменениями в виде трансформации корпоративной культуры и процессов, направленных на адаптацию к новым технологиям. Предлагаются направления для дальнейших исследований, включая разработку универсальных методик внедрения инструментов ИИ и моделей оценки их экономической эффективности.
|
Лаборатория |
|
Моделирование процессов и систем |
|
|
Статья посвящена решению задачи построения и использования моделей региональных экономических систем, учитывающих ситуационные аспекты управления. С учетом особенностей информации о функционировании указанных систем, которые вызывают затруднения при формировании аналитических и вероятно-статистических зависимостей, сделан вывод о перспективности применения для решения данной задачи нечетких ситуационных моделей на основе прецедентов. Предложена процедура построения нечетких ситуационно-прецедентных моделей региональных экономических систем, которая отличается наличием дополнительных переходов между узлами графа сети (состояниями) из-за наличия факторов неопределенности, приводящих к различным наблюдаемым реакциям системы на схожие управляющие воздействия. Процедура также позволяет использовать информацию на естественном языке, что значительно расширяет возможности по экономико-математическому моделированию ситуационных аспектов управления рациональными системами и процессами. Это обеспечивается путем применения онтологии предметной области для определения степени близости между элементами базы прецедентов и текущей ситуацией. Результаты применения разработанных программных средств, реализующих предложенную процедуру, для поддержки принятия решений по управлению региональным ИТ-кластером при осуществлении его участниками совместных программ показали достаточно высокую степень обоснованности предложенных рекомендаций.
|
|
Цифровая обработка сигналов в составе киберфизических технологических систем основывается на алгоритмах, оперирующих информацией, представленной в дискретизированном виде как по уровню, так и по времени. В последнем случае предполагается постоянство интервала временного квантования как одного из постулируемых условий для применения алгоритмов. В то же время на практике такое постоянство обеспечивается далеко не всегда, что приводит к пропуску отдельных отсчетов или даже к случайному характеру дискретизации. Поэтому актуальной исследовательской задачей становится разработка методов и алгоритмов обработки сигналов в условиях случайной дискретизации, в частности для восстановления непрерывных сигналов по их дискретным отсчетам, взятым с нарушением требований теоремы Котельникова – Шеннона. Если интервал дискретизации непрерывного сигнала рассчитан с учетом ее требований (то есть, дискретизация проведена с частотой не ниже частоты Найквиста), то допускается его точное восстановление по дискретным отсчетам, в противном случае это невозможно. Однако и для этой ситуации существуют подходы к восстановлению непрерывных сигналов, которые учитывают дополнительную априорную информацию о природе сигнала. Часть таких подходов основана на сложном математическом аппарате, что делает их трудно применимыми и неуниверсальными, другая часть использует глубокие модели машинного обучения, затратные в плане вычислительных ресурсов и требовательные к объемам обучающих данных. В этих условиях предложен метод восстановления сигнала с ограниченным спектром по дискретным отсчетам, временной интервал между которыми случаен, а его математическое ожидание больше величины, определяемой теоремой Котельникова – Шеннона для регулярной дискретизации. Новизна результатов исследования заключается в предложенном методе и алгоритме восстановления непрерывного сигнала, а также в результатах анализа численного эксперимента, проведенного с программной моделью, выполненной в среде MatLab и реализующей разработанный алгоритм.
|
|
Анализ и прогнозирование временных рядов потребления электроэнергии являются важными задачами для обеспечения эффективного управления энергетическими системами. Актуальность этого исследования обусловлена необходимостью получения точных прогнозов электропотребления для оптимизации работы энергетических сетей, планирования производства и распределения электроэнергии. В работе представлен сравнительный анализ моделей среднесрочного прогнозирования потребления электроэнергии с использованием программной среды R. Исследование охватывает классические модели прогнозирования, такие как SARIMA и ETS, а также менее распространенные в научной литературе машинно-ориентированные модели TBATS и Prophet. В работе подробно описаны функции R, необходимые для выполнения расчетов, а также приведен фрагмент программного кода, предназначенный для предварительного анализа данных и построения прогнозов. Все рассмотренные модели демонстрируют высокую точность в среднесрочном прогнозировании потребления электроэнергии. При этом наблюдается вариативность показателей качества подгонки моделей в зависимости от региональных филиалов Единой энергетической системы России. Применение алгоритмов ETS и бэггинга ETS обеспечивает наилучшие прогнозы с незначительной средней абсолютной ошибкой (немногим более 1 %) для России в целом, а также для объединенной энергосистемы Урала. Модель TBATS рекомендуется для предсказания электропотребления в зонах «Центр» и «Восток», а модель SARIMA – в зоне «Юг». Несмотря на то что модель Prophet продемонстрировала удовлетворительное качество прогнозов, проведенный анализ свидетельствует о том, что ее эффективность значительно возрастает при применении к данным с высокой частотой, таким как недельные или часовые временные ряды.
|