Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Case Study: TensorFlow для угадывания голосовой...
Search
Moscow Python Meetup
PRO
October 20, 2017
Programming
0
280
Case Study: TensorFlow для угадывания голосовой почты
Григорий Петров @ Moscow Python Conf 2017
Moscow Python Meetup
PRO
October 20, 2017
Tweet
Share
More Decks by Moscow Python Meetup
See All by Moscow Python Meetup
Moscow Python Meetup №105. Кирилл Гладких (ООО Штаб, Python разработчик). Как вайбкодить по-сениорски
moscowdjango
PRO
0
68
Moscow Python Meetup №105. Пётр Андреев (МФТИ, лектор по курсу Advanced Python). Дотянуться до кремния. HighLoad Python: SIMD, GPU
moscowdjango
PRO
0
24
Moscow Python Meetup №105. Антон Важнецов (K2 Cloud, Тимлид). Подход к глубоким изменениям. Миграция SDN в боевом облаке на Python
moscowdjango
PRO
0
18
Moscow Python Meetup №104. Как научить Алису рецептам дореволюционной кухни
moscowdjango
PRO
0
26
Moscow Python Meetup №104. Оптимизация сервиса АБ тестирования или как уйти от Django ORM к Fastapi query builder
moscowdjango
PRO
0
41
Moscow Python Meetup №104. CI/CD Pytest для тестирования качества данных здравоохр. в Великобритании
moscowdjango
PRO
0
26
Moscow Python Meetup №103. Станислав Коленский (Самозанятый, репетитор). Как учат программированию в школьный период и на сколько можно готовить кадры с подросткового возраста
moscowdjango
PRO
0
46
Moscow Python Meetup №103. Мария Рубаненко (Fintech AI / Tech lead DS). Суперсжатие на строках
moscowdjango
PRO
0
80
Moscow Python Meetup №103. Михаил Попов (Assigna Python Backend Developer). Vibe coding. Очевидные преимущества и непоправимые угрозы
moscowdjango
PRO
0
42
Other Decks in Programming
See All in Programming
Go言語の特性を活かした公式MCP SDKの設計
hond0413
1
450
CSC305 Lecture 06
javiergs
PRO
0
270
What's new in Spring Modulith?
olivergierke
1
170
TransformerからMCPまで(現代AIを理解するための羅針盤)
mickey_kubo
6
3.8k
AkarengaLT vol.38
hashimoto_kei
1
110
NIKKEI Tech Talk#38
cipepser
0
140
Devvox Belgium - Agentic AI Patterns
kdubois
1
140
kiroとCodexで最高のSpec駆動開発を!!数時間で web3ネイティブなミニゲームを作ってみたよ!
mashharuki
0
870
開発組織の戦略的な役割と 設計スキル向上の効果
masuda220
PRO
8
1.2k
Vueのバリデーション、結局どれを選べばいい? ― 自作バリデーションの限界と、脱却までの道のり ― / Which Vue Validation Library Should We Really Use? The Limits of Self-Made Validation and How I Finally Moved On
neginasu
2
490
Google Opalで使える37のライブラリ
mickey_kubo
3
130
Go言語はstack overflowの夢を見るか?
logica0419
0
520
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.5k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
3.7k
Fireside Chat
paigeccino
40
3.7k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
4 Signs Your Business is Dying
shpigford
185
22k
Testing 201, or: Great Expectations
jmmastey
45
7.7k
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3k
How to Ace a Technical Interview
jacobian
280
24k
A better future with KSS
kneath
239
18k
Speed Design
sergeychernyshev
32
1.2k
Transcript
Григорий Петров Voximplant Голосовая почта, Python и TensorFlow
Что сейчас будет? Рассказывает Григорий Петров Специализация Руководство разработкой Чем
занимается Технический евангелист Опыт Более 15 лет Время выступления 10 минут Вопросы В конце выступления, 5 минут
Как вообще работает телефония?
Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608 SIP, RTP, E1...
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер.
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер. Звонящий оператор платит оператору, который обслуживает номер.
Техническая деталь: early media - Пока входящий не "принят", он
бесплатен - Можно играть гудки или автоответ - Обычно завершают секунд через 40 - Такие звонки никто не любит
Следите за руками - "Принимаем" звонок - Играем запись "оставьте
сообщение" - 20 секунд записываем что-нибудь - Все это время оно тарифицируется - Профит!Голосовая почта
Голосовая почта - Она у всех разная - Стандартный гудок
мало кто отправляет
А не обучить ли нам нейросеть?
Данных слишком много - Голос в 8кГц - это очень
много данных - Для очень большой сети - А для большой сети нужно много семплов
Данные нужно подготовить
Данные нужно подготовить - В Python все хорошо. Особенно с
FFI - SWIG, и у нас есть либы - Чтобы вытащить Mel-frequency cepstrum - И другие страшные слова!
Данные нужно классифицировать - Можно автоматически, но много категорий -
Можно вручную
Результат - Это work in progress :) - Очень хорошо
детектится голос - Выбирать модели - это шаманство - Рекуррентные сети или Гауссианы
Это все на сегодня Теперь можно задавать вопросы. Рассказывал и
показывал Григорий Петров
[email protected]
http://facebook.com/grigoryvp