Slide 1

Slide 1 text

[email protected] | [email protected] | +7 (812) 328-33-37 | dscs.pro ЛАБОРАТОРИЯ ТЕОРЕТИЧЕСКИХ И МЕЖДИСЦИПЛИНАРНЫХ ПРОБЛЕМ ИНФОРМАТИКИ

Slide 2

Slide 2 text

2/14 Размещение Вашего теста или опроса в нашем приложении ВКонтакте Статистика по приложению: • Всего более 123 000 пользователей • Добавлено 9 тестов • Посещаемость приложения доходит до 4 000 уникальных посетителей в сутки. • Больше 14000 завершённых прохождений тестов

Slide 3

Slide 3 text

3/14 Автоматизированный веб-скрейпинг Пример: оценка параметров (рискованного) поведения Парсинг данных различных сайтов для проведения Ваших маркетинговых исследований, анализа конкурентов и т.п. У нас есть опыт выгрузки больших объёмов данных с сайтов различного уровня защищённости. Пример результата работы: данные о продавцах Wildberries на 17.06.2022.

Slide 4

Slide 4 text

4/14 Статистический анализ данных, обработка данных, разработка моделей машинного обучения Пример: многоклассовой классификации постов пользователей в социальной сети Описание данных: • Количество постов: 1568 (1797) • Количество слов: 39628 • Самый длинный пост: 1539 • Самый короткий пост: 2 F1-микро F1-макро Точность RuBERT (усреднённый эмбеддинг) Информационные 0.5234 0.5156 0.5947 Эмоциональные 0.5175 0.4912 0.5455 Побудительно-деятельностные 0.6873 0.5721 0.7026 RuBERT (максимальный эмбеддинг) Информационные 0.4672 0,4390 0,5347 Эмоциональные 0.4569 0.4489 0.5726 Побудительно-деятельностные 0.6053 0.4875 0.6223 LSTM нейронная сеть Информационные 0.3587 0.3438 0.3587 Эмоциональные 0.3387 0.3452 0.3387 Побудительно-деятельностные 0.3863 0.3401 0.3863 Задача: - многозначная (multi-label) классификация + многоклассовая (multi-class) классификация - многоклассовая классификация Модели: - одна двухслойная нейронная сеть LSTM + три однослойных нейронных сетей LSTM - предобученный эмбеддинг RuBERT + трехслойная полносвязная сеть Реализация: TensorFlow + Python 3 + DeepPavlov Oliseenko V.D., Eirich M., Tulupyev A.L., Tulupyeva, T.V. BERT and ELMo in Task of Classifying Social Media Users Posts // International Conference on Intelligent Information Technologies for Industry. – Cham : Springer International Publishing. 2022. vol 566. P. 475–486. Doi: 10.1007/978-3-031-19620-1_45

Slide 5

Slide 5 text

5/14 Проведение поисковых научных исследований dscs.pro/publikacii

Slide 6

Slide 6 text

6/14 Проведение исследований с применением методов анализа данных Веб-сервис доступен по ссылке: leapp.dscs.pro Пример: оценка параметров (рискованного) поведения

Slide 7

Slide 7 text

7/14 Затраты Методы профилактики и лечения Оценка параметров поведения Респонденты Результаты опросов Данные об эпизодах поведения Оценка риска Пример: оценка параметров (рискованного) поведения Проведение исследований с применением методов анализа данных

Slide 8

Slide 8 text

8/14 Оценка выраженности личностных особенностей Пример: веб-сервис по анализу социальных сетей Комплекс sea.dscs.pro • Ведётся работа над комплексом на основе веб-фреймворка Django для агрегации сведений и анализа профилей пользователей в социальных сетях «ВКонтакте» • Внедрены в комплекс: o классификация текстовых постов пользователей как основа для оценки выраженности психологических особенностей пользователей o функциональность по визуализации и интерактивному взаимодействию с социальным графом пользователей с подсчётом метрик взаимодействия (количество общих друзей, подарков, лайков и комментариев)

Slide 9

Slide 9 text

9/14 Разработка web-сайтов любой сложности Калькулятор доставки груза Отслеживание посылок Расчёт стоимости поездки на машине Отслеживание морских контейнеров О проекте: Портал представляет собой набор инструментов, оптимизирующих деятельность компаний, осуществляющих коммерческие перевозки: автоматизированные трекинг контейнеров и поиск компаний- перевозчиков; оптимизация маршрутов перевозки и многое другое. Более 2000 посетителей в сутки. Портал доступен по ссылке сargotime.ru Пример: информационно-логистический портал Cargotime.ru

Slide 10

Slide 10 text

10/14 Разработка Telegram-ботов Как следует поступить в данной ситуации? Пример: QR Авто Бот — сервис для оповещения водителей

Slide 11

Slide 11 text

11/14 Вариант 1: утечка персональных данных Вариант 2: связь через безопасный QR-код Разработка Telegram-ботов Пример: QR Авто Бот — сберегаем персональные данные

Slide 12

Slide 12 text

12/14 @QRAutoBot Привет! Не могли бы Вы перепарковать машину?! Вместо номера телефона безопасный QR-код! Разработка Telegram-ботов Пример: QR Авто Бот — сервис для оповещения водителей

Slide 13

Slide 13 text

13/14 Символика лаборатории

Slide 14

Slide 14 text

14/14 dscs.pro Наши контакты @tics_lab @ticslabs