Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Case Study: TensorFlow для угадывания голосовой...
Search
Moscow Python Meetup
PRO
October 20, 2017
Programming
0
290
Case Study: TensorFlow для угадывания голосовой почты
Григорий Петров @ Moscow Python Conf 2017
Moscow Python Meetup
PRO
October 20, 2017
Tweet
Share
More Decks by Moscow Python Meetup
See All by Moscow Python Meetup
Moscow Python Meetup №108. Воркшоп "Построение AI-агента: Говори с данными на языке бизнеса"
moscowdjango
PRO
0
40
Moscow Python Meetup №108. Gather. Inspire. Deliver.
moscowdjango
PRO
0
32
Moscow Python Meetup №107. Бесшовные релизы глазами разработчика: обновляем код Облака без API
moscowdjango
PRO
0
39
Moscow Python Meetup №107. Django Blue-Green Migrations
moscowdjango
PRO
0
30
Moscow Python Meetup №107. Суперсжатые полнотекстовые индексы
moscowdjango
PRO
0
52
Moscow Python Meetup №106. Евгений Блинов (The Mutating Company, Founder). Суперфункции
moscowdjango
PRO
0
110
Moscow Python Meetup №106. Валерий Карпузов (SmartFX, Team Lead). Пиши, сокращай — Code Golf на Python
moscowdjango
PRO
0
120
Moscow Python Meetup №106. Николай Казак (Технический лидер роботизации бизнес-процессов, МТС Финтех). RPA по-взрослому
moscowdjango
PRO
0
62
Moscow Python Meetup №105. Кирилл Гладких (ООО Штаб, Python разработчик). Как вайбкодить по-сениорски
moscowdjango
PRO
0
150
Other Decks in Programming
See All in Programming
AI 開発合宿を通して得た学び
niftycorp
PRO
0
160
車輪の再発明をしよう!PHP で実装して学ぶ、Web サーバーの仕組みと HTTP の正体
h1r0
2
300
へんな働き方
yusukebe
5
2.8k
Takumiから考えるSecurity_Maturity_Model.pdf
gessy0129
1
150
Feature Toggle は捨てやすく使おう
gennei
0
240
脱 雰囲気実装!AgentCoreを良い感じにWEBアプリケーションに組み込むために
takuyay0ne
3
380
Rで始めるML・LLM活用入門
wakamatsu_takumu
0
200
Rethinking API Platform Filters
vinceamstoutz
0
140
Vuetify 3 → 4 何が変わった?差分と移行ポイント10分まとめ
koukimiura
0
170
エンジニアの「手元の自動化」を加速するn8n 2026.02.27
symy2co
0
180
CSC307 Lecture 15
javiergs
PRO
0
260
仕様漏れ実装漏れをなくすトレーサビリティAI基盤のご紹介
orgachem
PRO
7
2.9k
Featured
See All Featured
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
340
Everyday Curiosity
cassininazir
0
170
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
[RailsConf 2023] Rails as a piece of cake
palkan
59
6.4k
Between Models and Reality
mayunak
2
240
Thoughts on Productivity
jonyablonski
75
5.1k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
190
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
150
Unsuck your backbone
ammeep
672
58k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
230
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.5k
Tell your own story through comics
letsgokoyo
1
870
Transcript
Григорий Петров Voximplant Голосовая почта, Python и TensorFlow
Что сейчас будет? Рассказывает Григорий Петров Специализация Руководство разработкой Чем
занимается Технический евангелист Опыт Более 15 лет Время выступления 10 минут Вопросы В конце выступления, 5 минут
Как вообще работает телефония?
Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608 SIP, RTP, E1...
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер.
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер. Звонящий оператор платит оператору, который обслуживает номер.
Техническая деталь: early media - Пока входящий не "принят", он
бесплатен - Можно играть гудки или автоответ - Обычно завершают секунд через 40 - Такие звонки никто не любит
Следите за руками - "Принимаем" звонок - Играем запись "оставьте
сообщение" - 20 секунд записываем что-нибудь - Все это время оно тарифицируется - Профит!Голосовая почта
Голосовая почта - Она у всех разная - Стандартный гудок
мало кто отправляет
А не обучить ли нам нейросеть?
Данных слишком много - Голос в 8кГц - это очень
много данных - Для очень большой сети - А для большой сети нужно много семплов
Данные нужно подготовить
Данные нужно подготовить - В Python все хорошо. Особенно с
FFI - SWIG, и у нас есть либы - Чтобы вытащить Mel-frequency cepstrum - И другие страшные слова!
Данные нужно классифицировать - Можно автоматически, но много категорий -
Можно вручную
Результат - Это work in progress :) - Очень хорошо
детектится голос - Выбирать модели - это шаманство - Рекуррентные сети или Гауссианы
Это все на сегодня Теперь можно задавать вопросы. Рассказывал и
показывал Григорий Петров
[email protected]
http://facebook.com/grigoryvp