Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Case Study: TensorFlow для угадывания голосовой...
Search
Moscow Python Meetup
PRO
October 20, 2017
Programming
300
0
Share
Case Study: TensorFlow для угадывания голосовой почты
Григорий Петров @ Moscow Python Conf 2017
Moscow Python Meetup
PRO
October 20, 2017
More Decks by Moscow Python Meetup
See All by Moscow Python Meetup
Moscow Python Meetup №111. Как мы изобретали Temporal, пытаясь просто создать приложение
moscowdjango
PRO
0
28
Moscow Python Meetup №110. Артём Тарасов (Альфа-Банк, Senior Engineer). Менторство как допинг: Как прокачать свои хард-скиллы, обучая других
moscowdjango
PRO
0
36
Moscow Python Meetup №110. Алёна Тямейкина (Островок.ру, Python Developer). Автоматизации процессов разработки
moscowdjango
PRO
0
48
Moscow Python Meetup №110. Адриан Макриденко (ГК Астра Линукс, разработчик серверной части). Токены авторизации: почему JWT легко использовать неправильно и как это исправляет PASETO?
moscowdjango
PRO
0
49
Moscow Python Meetup №109. Георгий Дьячков (Альфа банк, Главный разработчик). Векторные базы в агентной архитектуре и как изменятся вопросы на собеседованиях в 2026
moscowdjango
PRO
0
67
Moscow Python Meetup №109. Евгений Блинов (The Mutating Company). Ближайшее будущее мутационного тестирования на Python
moscowdjango
PRO
0
63
Moscow Python Meetup №108. Воркшоп "Построение AI-агента: Говори с данными на языке бизнеса"
moscowdjango
PRO
0
100
Moscow Python Meetup №108. Gather. Inspire. Deliver.
moscowdjango
PRO
0
82
Moscow Python Meetup №107. Бесшовные релизы глазами разработчика: обновляем код Облака без API
moscowdjango
PRO
0
90
Other Decks in Programming
See All in Programming
CSC307 Lecture 17
javiergs
PRO
0
310
AIチームを指揮するOSS「TAKT」活用術 / How to Use “TAKT,” an OSS Tool for Orchestrating AI Teams
nrslib
6
820
Why Laravel apps break—Mastering the fundamentals to keep them maintainable
kentaroutakeda
1
340
Modding RubyKaigi for Myself
yui_knk
0
890
柔軟なPDFレイアウトエディタを支える型システム設計 — Discriminated UnionとConditional Typeの実践
minako__ph
4
1.4k
プラグインで拡張される Context をtype-safe にする難しさと設計判断
kazupon
2
580
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.2k
正しくソフトウェアを作る、前提を疑うための認知の視点 / doubt-premise
minodriven
17
5.8k
作って学ぶ、 JSX (TSX) ランタイムの基本
syumai
7
1.5k
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
140
ユニットテストの先へ:テスト技法で要求・仕様を整理するJava開発実践 / Beyond_Unit_Testing_Practical_Java_Development_Techniques_for_Organizing_Requirements_and_Specifications
shimashima35
0
350
TypeSpec で繋ぐ複数プロダクトの型安全
maroon8021
1
370
Featured
See All Featured
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
How to Talk to Developers About Accessibility
jct
2
220
Designing Experiences People Love
moore
143
24k
The World Runs on Bad Software
bkeepers
PRO
72
12k
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
520
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8.2k
Faster Mobile Websites
deanohume
310
31k
The Pragmatic Product Professional
lauravandoore
37
7.3k
BBQ
matthewcrist
89
10k
Making Projects Easy
brettharned
120
6.7k
Paper Plane
katiecoart
PRO
1
51k
Transcript
Григорий Петров Voximplant Голосовая почта, Python и TensorFlow
Что сейчас будет? Рассказывает Григорий Петров Специализация Руководство разработкой Чем
занимается Технический евангелист Опыт Более 15 лет Время выступления 10 минут Вопросы В конце выступления, 5 минут
Как вообще работает телефония?
Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608
Телеком оператор Как вообще работает телефония? +79262251608 SIP, RTP, E1...
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер.
Как вообще работает телефония Оператор обрабатывает входящие звонки от авторизованных
пользователей на обслуживаемый им номер. Звонящий оператор платит оператору, который обслуживает номер.
Техническая деталь: early media - Пока входящий не "принят", он
бесплатен - Можно играть гудки или автоответ - Обычно завершают секунд через 40 - Такие звонки никто не любит
Следите за руками - "Принимаем" звонок - Играем запись "оставьте
сообщение" - 20 секунд записываем что-нибудь - Все это время оно тарифицируется - Профит!Голосовая почта
Голосовая почта - Она у всех разная - Стандартный гудок
мало кто отправляет
А не обучить ли нам нейросеть?
Данных слишком много - Голос в 8кГц - это очень
много данных - Для очень большой сети - А для большой сети нужно много семплов
Данные нужно подготовить
Данные нужно подготовить - В Python все хорошо. Особенно с
FFI - SWIG, и у нас есть либы - Чтобы вытащить Mel-frequency cepstrum - И другие страшные слова!
Данные нужно классифицировать - Можно автоматически, но много категорий -
Можно вручную
Результат - Это work in progress :) - Очень хорошо
детектится голос - Выбирать модели - это шаманство - Рекуррентные сети или Гауссианы
Это все на сегодня Теперь можно задавать вопросы. Рассказывал и
показывал Григорий Петров
[email protected]
http://facebook.com/grigoryvp