|
Ученая степень
|
эксперт по цифровым технологиям аудита, отдел аудита корпоративного бизнеса, ПАО Сбербанк России; магистрант, Институт информационных технологий и анализа данных, Иркутский национальный исследовательский технический университет
|
|
E-mail
|
aidereza@mail.ru
|
|
Местоположение
|
Иркутск, Россия
|
|
Статьи автора
|
Существующие подходы технологии при глубоком анализе бизнесс-процессов часто демонстрируют низкую устойчивость к распространенным проблемам реальных данных – наличию шумовых записей и неполноте журналов событий. Целью работы является разработка и верификация комплексного трехэтапного подхода, объединяющего статистическую фильтрацию аномалий, вероятностно-временное восстановление пропущенных событий и адаптивный синтез модели процесса. В рамках исследования решались следующие задачи: критический анализ классических алгоритмов Discovery, формализация методов фильтрации на основе Isolation Forest и восстановления событий с использованием вероятностных и временных метрик, а также предложен адаптивный механизм выбора порога шума на основе нормированной энтропии вариативности подпроцесса. Подход реализован в виде программного модуля на Python с использованием библиотек pm4py, scikit-learn и numpy. Эксперименты на синтетических данных, сгенерированных с варьируемым уровнем шума и долей пропущенных событий, подтвердили устойчивость метода. Результаты оценивались по метрикам Fitness, Generalization, Simplicity и F1-мера в сравнении с алгоритмами Alpha Miner, Heuristics Miner и Inductive Miner. Предложенный подход показал статистически значимое улучшение качества результирующих моделей в условиях высокой зашумленности и неполноты исходных данных. Результаты работы формируют основу для создания устойчивых систем анализа бизнес-процессов, способных работать с данными из реальных информационных систем.
Читать дальше...
|