Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Case Study: TensorFlow для угадывания голосовой...
Search
Moscow Python Meetup
PRO
October 20, 2017
Programming
0
280
Case Study: TensorFlow для угадывания голосовой почты
Григорий Петров @ Moscow Python Conf 2017
Moscow Python Meetup
PRO
October 20, 2017
Tweet
Share
More Decks by Moscow Python Meetup
See All by Moscow Python Meetup
Moscow Python Meetup №104. Как научить Алису рецептам дореволюционной кухни
moscowdjango
PRO
0
12
Moscow Python Meetup №104. Оптимизация сервиса АБ тестирования или как уйти от Django ORM к Fastapi query builder
moscowdjango
PRO
0
20
Moscow Python Meetup №104. CI/CD Pytest для тестирования качества данных здравоохр. в Великобритании
moscowdjango
PRO
0
9
Moscow Python Meetup №103. Станислав Коленский (Самозанятый, репетитор). Как учат программированию в школьный период и на сколько можно готовить кадры с подросткового возраста
moscowdjango
PRO
0
34
Moscow Python Meetup №103. Мария Рубаненко (Fintech AI / Tech lead DS). Суперсжатие на строках
moscowdjango
PRO
0
67
Moscow Python Meetup №103. Михаил Попов (Assigna Python Backend Developer). Vibe coding. Очевидные преимущества и непоправимые угрозы
moscowdjango
PRO
0
29
Moscow Python Meetup №102 Михаил Васильев (старший специалист по машинному обучению). Поиск аномалий в данных, алгоритмы KNN и LOF
moscowdjango
PRO
0
50
Пётр Андреев (МФТИ, лектор по курсу Advanced Python). Дебри Python или как работает повседневный Python: что происходит на самом деле
moscowdjango
PRO
0
41
Moscow Python Meetup №102. Дарья Шпак (RW TECH, Руководитель группы разработчиков). Как Python каждый день выпускает кота
moscowdjango
PRO
0
48
Other Decks in Programming
See All in Programming
請來的 AI Agent 同事們在寫程式時,怎麼用 pytest 去除各種幻想與盲點
keitheis
0
100
Navigating Dependency Injection with Metro
zacsweers
3
220
Tool Catalog Agent for Bedrock AgentCore Gateway
licux
6
2.3k
Improving my own Ruby thereafter
sisshiki1969
1
160
Rancher と Terraform
fufuhu
2
240
go test -json そして testing.T.Attr / Kyoto.go #63
utgwkk
3
280
Zendeskのチケットを Amazon Bedrockで 解析した
ryokosuge
3
290
サーバーサイドのビルド時間87倍高速化
plaidtech
PRO
0
720
Namespace and Its Future
tagomoris
6
700
Flutter with Dart MCP: All You Need - 박제창 2025 I/O Extended Busan
itsmedreamwalker
0
150
機能追加とリーダー業務の類似性
rinchoku
2
1.2k
testingを眺める
matumoto
1
140
Featured
See All Featured
Making Projects Easy
brettharned
117
6.4k
Automating Front-end Workflow
addyosmani
1370
200k
Making the Leap to Tech Lead
cromwellryan
135
9.5k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.7k
The Language of Interfaces
destraynor
161
25k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
126
53k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
The Cost Of JavaScript in 2023
addyosmani
53
8.9k
Context Engineering - Making Every Token Count
addyosmani
1
27
Transcript
Григорий Петров Voximplant Голосовая почта, Python и TensorFlow
Что сейчас будет? Рассказывает Григорий Петров Специализация Руководство разработкой Чем
занимается Технический евангелист Опыт Более 15 лет Время выступления 10 минут Вопросы В конце выступления, 5 минут
Как вообще работает телефония?
Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608 SIP, RTP, E1...
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер.
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер. Звонящий оператор платит оператору, который обслуживает номер.
Техническая деталь: early media - Пока входящий не "принят", он
бесплатен - Можно играть гудки или автоответ - Обычно завершают секунд через 40 - Такие звонки никто не любит
Следите за руками - "Принимаем" звонок - Играем запись "оставьте
сообщение" - 20 секунд записываем что-нибудь - Все это время оно тарифицируется - Профит!Голосовая почта
Голосовая почта - Она у всех разная - Стандартный гудок
мало кто отправляет
А не обучить ли нам нейросеть?
Данных слишком много - Голос в 8кГц - это очень
много данных - Для очень большой сети - А для большой сети нужно много семплов
Данные нужно подготовить
Данные нужно подготовить - В Python все хорошо. Особенно с
FFI - SWIG, и у нас есть либы - Чтобы вытащить Mel-frequency cepstrum - И другие страшные слова!
Данные нужно классифицировать - Можно автоматически, но много категорий -
Можно вручную
Результат - Это work in progress :) - Очень хорошо
детектится голос - Выбирать модели - это шаманство - Рекуррентные сети или Гауссианы
Это все на сегодня Теперь можно задавать вопросы. Рассказывал и
показывал Григорий Петров
[email protected]
http://facebook.com/grigoryvp