Высокие требования к вычислительным ресурсам для выполнения даже типовых задач компьютерной лингвистики и большое время выполнения сложных алгоритмов существенно затрудняют разработку многопользовательских программных инструментов обработки текстов для массового использования.
В докладе представлена разработанная система диспетчеризации задач в комплексе инструментов автоматизированного анализа текстов для проведения исследований в области обработки естественно-языковых текстов, которая обеспечивает управление потоком задач, мониторинг ресурсов системы и построение очередей задач с учетом особенностей решения задач в области NLP.
Доклад рассчитан как на опытных архитекторов систем, выполняющих ресурсозатратные и разные по масштабу задачи, так и на разработчиков систем в области компьютерной лингвистики для их практического использования широким кругом пользователей.
Реализованная система может быть полезна при разработке других инструментов анализа текста на естественном языке при увеличении количества пользователей и/или решаемых задач, а также разработке любых многопользовательских систем со сложными и ресурсозатратными алгоритмами обработки данных.