Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Цифровой помощник для маневрового диспетчера

Цифровой помощник для маневрового диспетчера

Чаркин Евгений Игоревич, директор по информационным технологиям ОАО «Российские железные дороги»

Big Data & AI Conference 2020

September 17, 2020
Tweet

More Decks by Big Data & AI Conference 2020

Other Decks in Business

Transcript

  1. Технология ИИ Направление применения в РЖД Сфера применения Обработка естественного

    языка Разговорный ИИ Прием голосовых обращений, синтез речи Автоматизация ручной обработки типовых заявок, обращений Роботизация обработки заявок в техническую поддержку Интеллектуальная поддержка принятия решений Инфраструктура и подвижной состав Предиктивная диагностика, техническое обслуживание и ремонт Железнодорожная инфраструктура Предиктивная диагностика Управление перевозками Рекомендательный сервис Управление беспилотным транспортом Тяговый подвижной состав Управление локомотивом по безлюдным технологиям Программные роботы (RPA) Автоматизация рутинных операций Техническая поддержка, формирование отчетности, ведение нормативно-справочной информации 2 ПРОЕКТЫ ОАО «РЖД» С ИСПОЛЬЗОВАНИЕМ ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Смежные области применения ИИ
  2. 4 ЦЕЛЬ И ЗАДАЧИ ПРОЕКТА Цель – обеспечить полную проработку

    гипотезы проекта о возможности применения искусственных нейронных сетей для неалгоритмического решения задач планирования работы железнодорожных станций и возможности создания на их основе прототипа интеллектуального сервиса поддержки принятия решений о порядке роспуска составов с сортировочной горки Задачи проекта Площадка проведения исследования – сортировочная станция Челябинск-Главный Сформировать модель данных для тестирования гипотезы Подтвердить или опровергнуть гипотезу путем построения первичного прототипа рекомендательной модели Подтвердить эффективность комплексного подхода к проектированию систем Подтвердить эффективность Agile-подхода Экспертная группа: сотрудники станции, технологии, инженеры, руководители и специалисты ряда ИТ и производственных подразделений
  3. 5 ЭТАПЫ И ПОДХОД К РЕАЛИЗАЦИИ Полевые исследования работы маневровых

    диспетчеров Анализ нормативной документации Интервью с экспертами Изучение ИТ-ландшафта станции и анализ технической документации Модель данных для разработки рекомендательной системы: 1. Логическая модель данных, включая типизацию объектов, атрибутный состав и связи между объектами 2. Метамодель данных, включая разбивку по доменам данных и системам-источникам Этап 1 Первичный прототип рекомендательной модели, включая: 1. Препроцессинг 2. Предиктивная модель 3. Оптимизатор Этап 2 Agile Предпроектное обследование Проверка гипотезы Получение, анализ, интерпретация, извлечение и обработка данных Выявление неявных зависимостей Формирование итоговой выборки данных Математическая постановка оптимизационной задачи
  4. РЕЗУЛЬТАТЫ ПЕРВОГО ЭТАПА 6 • Формализация деятельности маневрового диспетчера, моделирование

    деятельности в привязке к сквозным и технологическим процессам, а также ландшафту информационных систем • Анализ, выбор и обоснование исчисляемых оптимизируемых показателей для модели • Сбор, сопоставление и описание информации по физическим ограничениям и условиям для решаемой задачи • Описание используемых ресурсов. Моделирование взаимозаменяемости и параллельного использования ресурсов на базе режимов работы и параметров их обслуживания • Моделирование атрибутного состава подвижных объектов и динамики загруженности технологических участков станции По результатам обследования работа станции была проанализирована и описана по следующим срезам: В результате проведенного анализа была сформирована модель данных, для которой был идентифицирован перечень: • Действующих ограничений (постоянных модели), например, временные ограничения на проведение технологических операций, инфраструктурные ограничения пропускной способности станции и пр. • Событий-предикторов (переменных модели), например, очередность подвода поездов на станцию, распределение подвижного состава по технологическим участкам станции • Оптимизируемых значений- показателей: простой транзитных вагонов с переработкой по четной системе, количество расформированных составов Процессная модель Ключевые показатели эффективности Модель подвижных объектов Ресурсно-сервисная модель Инфраструктурная модель
  5. 7 РЕКОМЕНДАТЕЛЬНАЯ МОДЕЛЬ (1/2) Первичный прототип рекомендательной модели, разработанный на

    базе технологии искусственного интеллекта, потенциально способен прогнозировать план порядка роспуска составов на 4 и 12 часов Блок препроцессинга данных обеспечивает формирование структуры исторических данных для обучения работы предиктивной модели В рамках подтверждения гипотезы построен первичный прототип рекомендательной модели в составе: Предиктивная модель по предсказанию времени простоя вагона (выбранный оптимизационный показатель) Оптимизатор, реализующий выбор оптимального порядка роспуска на основе предсказаний модели
  6. 8 РЕКОМЕНДАТЕЛЬНАЯ МОДЕЛЬ (2/2) Выбранная в ходе реализации проекта модель

    прогнозирования №3 принимает на вход последовательность из N поездов под расформирование. На выход модель выдает приблизительную оценку среднего времени простоя вагонов для одной последовательности. Цель – программная реализация алгоритмов машинного обучения Варианты реализации прототипа Значения метрик качества оценивались в часах среднего простоя вагонов для совокупности последовательностей тестовой выборки В рамках исследования было построено несколько вариаций предиктивных моделей с целью определить наиболее подходящую для проверки гипотезы. Для прогнозирования среднего простоя вагонов для одной тестовой последовательности поездов было опробовано три вида моделей машинного обучения: Модель LSTM, в которой входящая последовательность - это один поезд Модели градиентного бустинга, в которой на вход принимается один вагон Модель LSTM, в которой входящая последовательность - это последовательность N поездов
  7. 9 Из графика видно, что модель придает высокую значимость таким

    признакам, как: • номер пути, на который отправится вагон согласно сортировочному листу • специализация пути сортировочного парка • станция назначения вагона • имеющиеся нитки вариантного графика Вывод: модель при предсказании учитывает, что для минимизации среднего времени простоя необходимо как можно скорее сформировать новый состав и отправить его по ближайшей нитке вариантного графика ИНТЕРПРЕТАЦИЯ РАБОТЫ МОДЕЛИ ПО ПРЕДСКАЗАНИЮ СРЕДНЕГО ВРЕМЕНИ ПРОСТОЯ ВАГОНА Станция назначения вагона Номер поезда Код груза Вариантный график нитки отправления 1 Порядковый номер вагона Вариантный график, нитки отправления 2 Вариантный график, нитки отправления 3 Специализация пути сортировочного парка Вариантный график, нитки отправления 4 Вариантный график, нитки отправления 9 Вариантный график, нитки отправления 7 Вариантный график, нитки отправления 5 Вариантный график, нитки отправления 6 Вариантный график, нитки отправления 8 Путь сортировочного парка _41 Путь сортировочного парка _29 Срок доставки Путь сортировочного парка _40 Путь сортировочного парка _43 Путь сортировочного парка _22 Путь сортировочного парка _47 Путь сортировочного парка _24 Путь сортировочного парка _44 Путь сортировочного парка _36 Путь сортировочного парка _16 Путь сортировочного парка _10 Путь сортировочного парка _26 Путь сортировочного парка _21 Путь сортировочного парка _20 Путь сортировочного парка _25 Путь сортировочного парка _32 Путь сортировочного парка _30 Путь сортировочного парка _42 Путь сортировочного парка _34 Путь сортировочного парка _31 Путь сортировочного парка _38 Время совершения операции по поезду Путь сортировочного парка _23 Путь сортировочного парка _33 Путь сортировочного парка _39 Путь сортировочного парка _46 Путь сортировочного парка _28 Путь сортировочного парка _37 Путь сортировочного парка _27 Путь сортировочного парка _45 Путь сортировочного парка _19 Путь сортировочного парка _35 Признаки 21130 18278 11973 9293 5626 5458 4250 3594 2964 2845 2282 2148 1902 1884 1818 1689 1652 1625 1572 1510 1491 1490 1472 1458 1456 1443 1408 1393 1374 1338 1337 1325 1307 1301 1297 1285 1275 1274 1269 1267 1262 1261 1257 1240 1233 1230 1212 1206 1199 1172 1163 Путь сортировочного парка _17 Путь сортировочного парка _09 0 500 10000 15000 20000 Важность признаков Важность признаков Номер пути, на который отправился вагон Вариантный график, нитки отправления 0
  8. 10 По оси ординат (ось Y) на графике представлено время

    простоя Каждая точка на оси абсцисс (ось Х) соответствует одной последовательности поездов Зеленая линия на графике – действительное значение среднего времени простоя для указанной последовательности поездов Фиолетовая линия – предсказанное моделью значение времени простоя для указанной последовательности поездов ДОСТОВЕРНОСТЬ И НАДЕЖНОСТЬ РАБОТЫ ПРЕДИКТИВНОЙ МОДЕЛИ Порядковый номер последовательности: в начале – те, которые приехали раньше
  9. 11 РЕЗУЛЬТАТ РАБОТЫ РЕКОМЕНДАТЕЛЬНОЙ СИСТЕМЫ Для заданной последовательности поездов на

    выходе модель предоставляет набор вариантов сортировки последовательности в формате: • Возможный вариант сортировки • Среднее время простоя для указанного варианта сортировки Индекс поезда Время прибытия поезда Количество вагонов Путь прибытия Порядковый номер роспуска Исторические данные Рекомендация модели (оптимальный вариант по времени простоя) 65000078000 1:04 66 2 6 1 80210278000 0:19 51 17 10 2 80120798000 1:29 70 3 9 3 65732358000 23:59 74 9 7 4 65732348000 23:49 80 10 5 5 65000048000 23:17 48 11 3 6 61108598000 23:30 79 4 4 7 80538398000 0:51 51 12 8 8 61108608000 23:10 75 7 2 9 81000288000 23:02 61 14 1 10 Среднее время простоя вагонов для последовательности поездов 9,437 часа 7,463 часа
  10. 12 РЕЗУЛЬТАТЫ ПРОЕКТА Задача определения оптимального порядка роспуска составов является

    математически решаемой (подтверждена вычислимость задачи в терминах теории вычислимости) В рамках подтверждения гипотезы построен первичный прототип рекомендательной модели Проведенный анализ исторических данных и интерпретация значимых для рекомендательной модели факторов позволяет заключить, что модель соответствует постановке задачи и не противоречит технологическому процессу работы станции Предиктивная модель прогнозирования среднего простоя вагонов последовательности поездов на имеющемся наборе исторических данных демонстрирует хорошую предсказательную силу согласно значения метрик качества для модели Прототип рекомендательной модели обеспечивает нахождение порядка роспуска, который в среднем более чем на 20% снижает время простоя транзитного вагона с переработкой, относительно данного показателя для исторической выборки данных. Учет дополнительного критерия оптимизации (количество расформированных составов) в модели осуществляется косвенно за счет обучения на базе исторических данных Обучая модель на большем количестве признаков и вместе с тем увеличивая глубину выборки для обучения, можно добиться существенного увеличения качества модели и, как следствие, оптимального порядка роспуска, наилучшим образом соответствующего текущей оперативной обстановке на станции и не допускающего её ухудшения