Илья Осиновсков —  Го обсудим: продакшен ML на Golang

Го обсудим: продакшен ML на Golang Осиновсков Илья Руководитель группы
Товарные рекомендации

Содержание Рекомендации в Ozon Оффлайн подход Реалтайм подход Инференс моделей
в реалтайме Итоги

Рекомендации в Ozon

Как у нас работало раньше? Spark джобы Item2item пересчитывались раз
в неделю Персональные рекомендации обновлялись раз в день

Как у нас работало раньше? •минимум затрат в момент рекомендации
•нет ограничений на сложность модели •время выполнения джобы растет с ростом айтемов/юзеров •считать рекомендации для всех пользователей накладно •не учитываем контекст текущей сессии пользователя

А давайте попробуем в реалтайме? •не нужно считать рекомендации для
всех пользователей •легко проводить аб-тесты •можем считать realtime фичи по последним действиям •сложность алгоритма рекомендаций ограничивается временем ответа от сервиса

Пайплайн рекомендательной системы

Индекс товаров Flatbuffer • Быстрый доступ к сериализованным данным •
Оптимальный по памяти • Гибкий для дополнения https://google.github.io/flatbuffers/

А давайте попробуем в реалтайме? На python + numba вышло
медленно Успеваем ранжировать всего 500 товаров для пользователя

А давайте попробуем в реалтайм на Golang? •параллелизация из коробки
•порог входа ниже чем в C++ •ограничения по встраиванию ML-моделей

Реалтайм инференс моделей https://github.com/bourbaki/catboost-go Через C api с помощью cgo
Docker контейнер с http/grpc интерфейсом

Архитектура решения

Итоги • В оффлайне строим индекс товаров • В реалтайме
считаем рекомендации только при открытии страницы • Для PoC python подойдет, если нет жестких требований по latency

Осиновсков Илья Спасибо за внимание! [email protected]

Илья Осиновсков —  Го обсудим: продакшен ML на ...

Илья Осиновсков —  Го обсудим: продакшен ML на Golang

Ozon Tech

More Decks by Ozon Tech

Other Decks in Technology

Featured

Transcript

Го обсудим: продакшен ML на Golang Осиновсков Илья Руководитель группы

Содержание Рекомендации в Ozon Оффлайн подход Реалтайм подход Инференс моделей

Рекомендации в Ozon

Рекомендации в Ozon

Как у нас работало раньше? Spark джобы Item2item пересчитывались раз

Как у нас работало раньше? •минимум затрат в момент рекомендации

А давайте попробуем в реалтайме? •не нужно считать рекомендации для

Пайплайн рекомендательной системы

Индекс товаров Flatbuffer • Быстрый доступ к сериализованным данным •

А давайте попробуем в реалтайме? На python + numba вышло

А давайте попробуем в реалтайм на Golang? •параллелизация из коробки

Реалтайм инференс моделей https://github.com/bourbaki/catboost-go Через C api с помощью cgo

Архитектура решения

Итоги • В оффлайне строим индекс товаров • В реалтайме

Осиновсков Илья Спасибо за внимание! [email protected]

Илья Осиновсков — Го обсудим: продакшен ML на ...

Илья Осиновсков — Го обсудим: продакшен ML на Golang

More Decks by Ozon Tech

Other Decks in Technology

Featured

Transcript

Илья Осиновсков —  Го обсудим: продакшен ML на ...

Илья Осиновсков —  Го обсудим: продакшен ML на Golang