Slide 59
Slide 59 text
5. Выводы
59
Как можно быстро находить вхождения шаблонов в
повторяющихся текстовых данных большого размера:
● используйте суперсжатые полнотекстовые индексы
на основе структуры сдвига;
● размещайте таблицу сдвига в одном непрерывном
блоке памяти, чтобы уменьшить cache miss;
● используйте инструкции CPU для подгрузки
следующей строки таблицы заранее, чтобы скрыть
задержку памяти;