Slide 1

Slide 1 text

Двусторонний websocket-роутинг Владислав Лаухин Аникин Денис

Slide 2

Slide 2 text

Владислав Лаухин 2 — разработчик в команде Chat, Raiffeisenbank — пилю чат и чатбота — развиваю с коллегами коммьюнити питонистов Райфа — питон, разработка, девопс

Slide 3

Slide 3 text

Аникин Денис 3 Вдруг кому-то важно кто я такой — team lead в команде Chat, Raiffeisenbank — community lead в Python Community — fullstack: разрабатываю на python и typescript — занимаюсь развитием DevOps практик — мой сайт: https://xfenix.ru/

Slide 4

Slide 4 text

В начале опишем контекст 4

Slide 5

Slide 5 text

Что мы делали? 5 — омниканальный чат со своей админкой

Slide 6

Slide 6 text

Что мы делали? 6 — омниканальный чат со своей админкой — систему, с которой работают и операторы и клиенты

Slide 7

Slide 7 text

Что мы делали? 7 — омниканальный чат со своей админкой — систему, с которой работают и операторы и клиенты — систему, в которой много вебсокет соединений, которые эксплуатируются в 2 направлениях

Slide 8

Slide 8 text

Что мы делали? 8 — омниканальный чат со своей админкой — систему, с которой работают и операторы и клиенты — систему, в которой много вебсокет соединений, которые эксплуатируются в 2 направлениях — нам нужно было держать нагрузку и достичь отказоустойчивости

Slide 9

Slide 9 text

Цели презентации 9 — В начале нашей разработки, в интернете не было информации по проблеме. Поэтому мы захотели поделиться

Slide 10

Slide 10 text

Цели презентации 10 — В начале нашей разработки, в интернете не было информации по проблеме. Поэтому мы захотели поделиться — Информации и сейчас немного

Slide 11

Slide 11 text

Цели презентации 11 — В начале нашей разработки, в интернете не было информации по проблеме. Поэтому мы захотели поделиться — Информации и сейчас немного — Хотелось показать, что в среде python разработки существуют не только REST’ы и CRUD’ы

Slide 12

Slide 12 text

Перейдём к делу 12

Slide 13

Slide 13 text

Шаг 0: готовые решения 13 Пытаемся понять — подходят ли они нам? Mercure: — нет четкой уверенности, что http2 + sse > websocket — менее популярное решение — меньше на слуху — у нас энтерпрайз J (лицензии?)

Slide 14

Slide 14 text

Шаг 0: готовые решения 14 Пытаемся понять — подходят ли они нам? Centrifugo: — соединение в одном направлении — канал «вниз» нужно делать самим Mercure: — нет четкой уверенности, что http2 + sse > websocket — менее популярное решение — меньше на слуху — у нас энтерпрайз J (лицензии?)

Slide 15

Slide 15 text

Ну раз нет, то… 15

Slide 16

Slide 16 text

16

Slide 17

Slide 17 text

Наш стек 17

Slide 18

Slide 18 text

Больше о проблеме вебсокетов 18 Роутинг необходимо осуществлять в двух направлениях 2 направления применительно к нашим условиям

Slide 19

Slide 19 text

Больше о проблеме вебсокетов 19 Роутинг необходимо осуществлять в двух направлениях 2 направления Роутинг «вверх» — сложная проблема (с ней мы и боремся в этом докладе) ↑ применительно к нашим условиям

Slide 20

Slide 20 text

Больше о проблеме вебсокетов 20 Роутинг необходимо осуществлять в двух направлениях 2 направления Роутинг «вверх» — сложная проблема (с ней мы и боремся в этом докладе) ↑ Решение необходимо горизонтально масштабировать ↔ применительно к нашим условиям

Slide 21

Slide 21 text

Но для начала поговорим как мы уже решали эту проблему в другом продукте 21

Slide 22

Slide 22 text

Подход к проблеме 1.0

Slide 23

Slide 23 text

Что за продукт связан с «проблемой 1.0»? 23 — чат-бот. Его задача — помогать клиентам решать типовые проблемы

Slide 24

Slide 24 text

Что за продукт связан с «проблемой 1.0»? 24 — чат-бот. Его задача — помогать клиентам решать типовые проблемы — обслуживает весь текстовый канал

Slide 25

Slide 25 text

Что за продукт связан с «проблемой 1.0»? 25 — чат-бот. Его задача — помогать клиентам решать типовые проблемы — обслуживает весь текстовый канал — частично обслуживает голос

Slide 26

Slide 26 text

Что за продукт связан с «проблемой 1.0»? 26 — чат-бот. Его задача — помогать клиентам решать типовые проблемы — обслуживает весь текстовый канал — частично обслуживает голос — в будущем будет сам звонить клиентам

Slide 27

Slide 27 text

Что за продукт связан с «проблемой 1.0»? 27 — чат-бот. Его задача — помогать клиентам решать типовые проблемы — обслуживает весь текстовый канал — частично обслуживает голос — в будущем будет сам звонить клиентам — имеет много интеграций

Slide 28

Slide 28 text

28 Набросок части архитектуры

Slide 29

Slide 29 text

29 Набросок части архитектуры

Slide 30

Slide 30 text

30 Набросок части архитектуры

Slide 31

Slide 31 text

31 Набросок части архитектуры ?

Slide 32

Slide 32 text

32 Набросок части архитектуры ? Вот и сложность канала «вверх»

Slide 33

Slide 33 text

Как же быть с каналом «вверх»? 33 Например, взять RabbitMQ. Но нет уверенности, что: — динамические подписки/отписки быстро работают — динамическое создание очередей быстро работает — что это все держит высокую нагрузку

Slide 34

Slide 34 text

34

Slide 35

Slide 35 text

Как же мы решили «проблему 1.0»? 35

Slide 36

Slide 36 text

36

Slide 37

Slide 37 text

37 Приблизительно так

Slide 38

Slide 38 text

38 Приблизительно так

Slide 39

Slide 39 text

39

Slide 40

Slide 40 text

Как устроен «фронт» 40 WAIT_TIMEOUT: Final[int] = 300 async def bot_request_handler(): #... inner_key: str = uuid4.uuid() # <-- вот он наш ключ await rabbitmq_connection.publish_message( 'sometopic', {'return_key': inner_key, 'message': 'Сообщение от пользователя'} ) #... while True: possible_result: bytes | None = await redis_connection.get(inner_key) # <-- вот он наш ключ if possible_result: await redis_connection.remove(inner_key) return JsonResponse({'answer': possible_result}) await asyncio.sleep(WAIT_TIMEOUT) # ... что-то про таймауты

Slide 41

Slide 41 text

Как устроен «бэк» (ml ядро) 41 MESSAGE_EXPIRATION: Final[int] = 600 async def ml_core_wannabe_answerer(): #... rabbit_listener: RabbitmqListener = rabbitmq_connection.subscribe('sometopic') while True: new_message: dict = await rabbit_listener.read_json() #... result_of_predict: dict = do_some_predict_magic(new_message) #... redis_connection.set( new_message['return_key'], # <-- вот он наш ключ json.encode(result_of_predict), MESSAGE_EXPIRATION)

Slide 42

Slide 42 text

Выводы по решению 1.0 42 ✅ ну… оно работает! ✅ сделано просто и понятно ✅ бизнес очень доволен

Slide 43

Slide 43 text

Выводы по решению 1.0 43 ✅ ну… оно работает! ✅ сделано просто и понятно ✅ бизнес очень доволен ❌ цикл со sleep ❌ редис неудобно масштабируется ❌ у нас «распределенный монолит», где несколько сервисов пользуются «shared DB»

Slide 44

Slide 44 text

Этот подход в ряде случаев имеет право на существование 44

Slide 45

Slide 45 text

Подход к проблеме 2.0

Slide 46

Slide 46 text

Что за продукт связан с «проблемой 2.0»? 46 — чат + чат-«админка», b2c

Slide 47

Slide 47 text

Что за продукт связан с «проблемой 2.0»? 47 — чат + чат-«админка», b2c — клиенты с текстовыми обращениями приходят сюда

Slide 48

Slide 48 text

Что за продукт связан с «проблемой 2.0»? 48 — чат + чат-«админка», b2c — клиенты с текстовыми обращениями приходят сюда — обслуживает мобильное приложение, виджет на сайте, мессенджеры и т.п.

Slide 49

Slide 49 text

Что за продукт связан с «проблемой 2.0»? 49 — чат + чат-«админка», b2c — клиенты с текстовыми обращениями приходят сюда — обслуживает мобильное приложение, виджет на сайте, мессенджеры и т.п. — имеет много интеграций, несколько своих фронтендов

Slide 50

Slide 50 text

Что за продукт связан с «проблемой 2.0»? 50 — чат + чат-«админка», b2c — клиенты с текстовыми обращениями приходят сюда — обслуживает мобильное приложение, виджет на сайте, мессенджеры и т.п. — имеет много интеграций, несколько своих фронтендов — активно разрабатывается, бизнес требует большого объема функциональности

Slide 51

Slide 51 text

А так же 51 — MSA архитектура («шареный» redis не пойдет) — Кубер

Slide 52

Slide 52 text

52 Общая архитектура В общих чертах

Slide 53

Slide 53 text

53 Общая архитектура В общих чертах

Slide 54

Slide 54 text

54 Общая архитектура В общих чертах

Slide 55

Slide 55 text

55 Общая архитектура В общих чертах

Slide 56

Slide 56 text

56 Общая архитектура В общих чертах

Slide 57

Slide 57 text

57 Общая архитектура В общих чертах

Slide 58

Slide 58 text

58 Общая архитектура В общих чертах

Slide 59

Slide 59 text

59 Общая архитектура В общих чертах

Slide 60

Slide 60 text

60 Общая архитектура В общих чертах

Slide 61

Slide 61 text

Канал «вниз» 61 Нам пришло сообщение от пользователя и мы… Валидируем JWT Валидируем структуры данных, формируем выходную структуру и сераилизуем в JSON Отправляем в Kafka Юзеры пишут JWT

Slide 62

Slide 62 text

Канал «вниз» 62 Нам пришло сообщение от пользователя и мы… Валидируем JWT Валидируем структуры данных, формируем выходную структуру и сераилизуем в JSON Отправляем в Kafka Юзеры пишут JWT Pydantic валидация

Slide 63

Slide 63 text

Канал «вниз» 63 Нам пришло сообщение от пользователя и мы… Валидируем JWT Валидируем структуры данных, формируем выходную структуру и сераилизуем в JSON Отправляем в Kafka Pydantic формируем выходную ст. Юзеры пишут JWT Pydantic валидация

Slide 64

Slide 64 text

Канал «вниз» 64 Нам пришло сообщение от пользователя и мы… Валидируем JWT Валидируем структуры данных, формируем выходную структуру и сераилизуем в JSON Отправляем в Kafka Pydantic формируем выходную ст. Юзеры пишут JWT Pydantic валидация Kafka

Slide 65

Slide 65 text

Вcё довольно просто, но дальше интереснее… 65

Slide 66

Slide 66 text

Основная проблема канала «вверх» 66 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 67

Slide 67 text

Основная проблема канала «вверх» 67 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 68

Slide 68 text

Основная проблема канала «вверх» 68 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 69

Slide 69 text

Основная проблема канала «вверх» 69 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 70

Slide 70 text

Основная проблема канала «вверх» 70 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 71

Slide 71 text

Основная проблема канала «вверх» 71 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 72

Slide 72 text

Основная проблема канала «вверх» 72 Сообщение приходит из недр системы (от оператора, например) и идет к пользователю

Slide 73

Slide 73 text

Написали свой сервис Как мы решали вопросы 73 1 Части сервиса общаются через ZeroMQ 5 Разделили на две части 2 Первая часть держит websocket соединение 3 Вторая роутит сообщения из кафки, «вверх» 4

Slide 74

Slide 74 text

Как назвали части: 1 — websocket сервер 2 — роутер 74

Slide 75

Slide 75 text

Почему ZeroMQ 75 Быстро! Pub фильтрация происходит тут Sub Sub Sub User ID 1 User ID 2 User ID 3

Slide 76

Slide 76 text

Почему ZeroMQ 76 Быстро! Нет брокера! (мы ленивые) Pub фильтрация происходит тут Sub Sub Sub User ID 1 User ID 2 User ID 3

Slide 77

Slide 77 text

Почему ZeroMQ 77 Быстро! Нет брокера! (мы ленивые) Есть куча механизмов и биндинги под python Pub фильтрация происходит тут Sub Sub Sub User ID 1 User ID 2 User ID 3

Slide 78

Slide 78 text

Архитектурная схема роутера 78 На базе ZeroMQ — В качестве ключа мы используем ID пользователя Coroutine 1 в любом поде или воркере Coroutine 2 в любом поде или воркере Router в любом поде или воркере Kafka

Slide 79

Slide 79 text

Архитектурная схема роутера 79 На базе ZeroMQ — В качестве ключа мы используем ID пользователя — Каждая корутина со ссылкой на вебсокет соединение «сабается» на наш роутер Coroutine 1 в любом поде или воркере Coroutine 2 в любом поде или воркере Router в любом поде или воркере Sub ZeroMQ Sub ZeroMQ Kafka

Slide 80

Slide 80 text

Архитектурная схема роутера 80 На базе ZeroMQ — В качестве ключа мы используем ID пользователя — Каждая корутина со ссылкой на вебсокет соединение «сабается» на наш роутер — Роутер паблишит «корутинам» по ключу с ID пользователя ✨✨✨ — Корутина получает нужное и отправляет пользователю Coroutine 1 в любом поде или воркере Coroutine 2 в любом поде или воркере Router в любом поде или воркере Sub ZeroMQ Sub ZeroMQ Pub ZeroMQ Pub ZeroMQ Kafka

Slide 81

Slide 81 text

Как устроена подписка на роутеры 81 Сначала делаем это Websocket worker 1 Router 1 Websocket worker 2 Router 2 Websocket worker 3

Slide 82

Slide 82 text

Роутер pub’лишит в websocket «сервер» (корутину) 82 Потом вот это Websocket worker 1 Router 1 Websocket worker 2 Router 2 Websocket worker 3 ❌ ❌ ✅ Решение ❌ или ✅ принимается тут ↓

Slide 83

Slide 83 text

83

Slide 84

Slide 84 text

Как устроен websocket сервер 84 async def wannabe_router(message_from_kafka: dict): zeromq_context = Context.instance() socket = zeromq_context.socket(PUB) socket.bind(f'tcp://{ZERO_MQ_HOST}:{ZERO_MQ_PORT}') await socket.send_multipart([b'user-id', json.dumps(message_from_kafka)])

Slide 85

Slide 85 text

Как устроен роутер 85 async def wannabe_websocket_server(websocket_client: WebSocket): zeromq_context = Context.instance() socket = zeromq_context.socket(SUB) socket.connect(f'tcp://{ZERO_MQ_HOST}:{ZERO_MQ_PORT}') socket.setsockopt(SUBSCRIBE, b'user-id') _, message = await socket.recv_multipart() await websocket_client.send_json(json.loads(message))

Slide 86

Slide 86 text

Планы на будущее 86 — добавить динамические ключи фильтрации в zeromq связку — возможно сделать это с помощью «pub/sub» с фронтенда (иметь возможность sub’атся с фронтенда на websocket сервер) — написать больше тестов 😏😏😏

Slide 87

Slide 87 text

Выводы по решению 2.0 87 ✅ горизонтально масштабируется ✅ больше нет никакой инфры, только код ✅ бизнес доволен ✅ запах распределенного монолита прошёл

Slide 88

Slide 88 text

Выводы по решению 2.0 88 ✅ горизонтально масштабируется ✅ больше нет никакой инфры, только код ✅ бизнес доволен ✅ запах распределенного монолита прошёл ❌ это сложно ❌ иногда нужна поясняющая бригада

Slide 89

Slide 89 text

Финальные выводы презентации 89 Возможно, вам подойдут готовые решения!

Slide 90

Slide 90 text

Финальные выводы презентации 90 Возможно, вам подойдут готовые решения! Если нет, то: — вы узнали как 2 способами решить проблему канала «вверх»

Slide 91

Slide 91 text

Финальные выводы презентации 91 Возможно, вам подойдут готовые решения! Если нет, то: — вы узнали как 2 способами решить проблему канала «вверх» — у нас есть простой способ, который подойдет там, где нас не смущает шареный редис

Slide 92

Slide 92 text

Финальные выводы презентации 92 Возможно, вам подойдут готовые решения! Если нет, то: — вы узнали как 2 способами решить проблему канала «вверх» — у нас есть простой способ, который подойдет там, где нас не смущает шареный редис — а так же есть сложный способ подойдет там, где есть MSA, k8s и настоящее горизонтальное масштабирование

Slide 93

Slide 93 text

https://linktr.ee/laukhin/ https://xfenix.ru/ Спасибо. С радостью ответим на вопросы!