Задача поиска людей по фото — это вычислительно сложная задача нечеткого поиска. Для решения этой проблемы используются биометрические вектора, которые извлекаются из фотографий с помощью нейронных сетей. Однако, даже два вектора, полученные из разных фото одного человека, не совпадают на 100%. Поэтому, в отличие от поиска на точное совпадение, эта задача на порядки сложнее.
В докладе будет рассказано о том, как мы решили эту задачу и какие сложности пришлось преодолеть, учитывая жесткие требования по скорости ответа при высокой интенсивности запросов:
- Оптимизация поиска похожих биометрических векторов: сравнение инструментов и выбор наилучшего подхода.
- Как быстро загрузить базу клиентов в память модуля поиска: без C++ и перерасхода памяти.
- Как можно искать ещё быстрее? Индексирование базы векторов: подходы и методы для многократного ускорения поиска.
Доклад будет интересен не только тем, кто сталкивается с задачами нечеткого поиска по данным с большим количеством категорий, но и для разработчиков, которые заинтересованы в понимании особенностей работы Python при обработке больших объемов данных.
Видео: https://moscowpython.ru/admin/meetup/talk/254/change/
Moscow Python: http://moscowpython.ru
Курсы Learn Python: http://learn.python.ru
Moscow Python Podcast: http://podcast.python.ru
Заявки на доклады: https://bit.ly/mp-speaker