SECR 2018
Полина Казакова
Интегрированные Системы
Наша работа посвящена применению текстовой сегментации в сфере информационного поиска. Мы исходим из предположения, что тематическая сегментация позволяет лучше моделировать структуру текста и, как следствие, язык сам по себе, что влияет на качество представления текста в векторном виде. Мы протестировали нашу гипотезу на датасете статей из arXiv и показали, что сегментация действительно в большинстве случаев улучшает качество поиска.