Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Look mom, no hands! (Web Speech API)
Search
Yuri Malheiros
February 26, 2014
Programming
1
110
Look mom, no hands! (Web Speech API)
Palestra sobre Web Speech API no Paraiba.js
Yuri Malheiros
February 26, 2014
Tweet
Share
More Decks by Yuri Malheiros
See All by Yuri Malheiros
Aprendizagem de Máquina - Programando com o poder dos dados
yurimalheiros
0
67
A Method to Develop Description Logic Ontologies Iteratively Based on Competency Questions: an Implementation
yurimalheiros
0
130
Uma Ferramenta para Análise de Sentimentos em Redes Sociais Utilizando o SenticNet
yurimalheiros
7
390
Produzindo ideias
yurimalheiros
1
130
Criando comunidades bem-sucedidas
yurimalheiros
1
120
As máquinas que sentem
yurimalheiros
5
220
Other Decks in Programming
See All in Programming
JETLS.jl ─ A New Language Server for Julia
abap34
2
450
perlをWebAssembly上で動かすと何が嬉しいの??? / Where does Perl-on-Wasm actually make sense?
mackee
0
120
Cap'n Webについて
yusukebe
0
150
Jetpack XR SDKから紐解くAndroid XR開発と技術選定のヒント / about-androidxr-and-jetpack-xr-sdk
drumath2237
1
190
Graviton と Nitro と私
maroon1st
0
130
C-Shared Buildで突破するAI Agent バックテストの壁
po3rin
0
410
フルサイクルエンジニアリングをAI Agentで全自動化したい 〜構想と現在地〜
kamina_zzz
0
280
脳の「省エネモード」をデバッグする ~System 1(直感)と System 2(論理)の切り替え~
panda728
PRO
0
120
これならできる!個人開発のすゝめ
tinykitten
PRO
0
130
リリース時」テストから「デイリー実行」へ!開発マネージャが取り組んだ、レガシー自動テストのモダン化戦略
goataka
0
140
AIコーディングエージェント(Gemini)
kondai24
0
270
ZJIT: The Ruby 4 JIT Compiler / Ruby Release 30th Anniversary Party
k0kubun
0
270
Featured
See All Featured
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.7k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
My Coaching Mixtape
mlcsv
0
13
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
120
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
130
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
94
Six Lessons from altMBA
skipperchong
29
4.1k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
100
AI: The stuff that nobody shows you
jnunemaker
PRO
1
17
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
230
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
170
Transcript
look mom, no hands! web speech api
yuri malheiros professor da ufpb pesquisador em inteligência artificial doutorando
no cin-ufpe
telas, mouses e teclados
as coisas evoluíram…
mas nem tanto
inovações!
inovações!
inovações!
digitar e apontar usando uma ferramenta não necessariamente é
a forma mais natural de executar uma tarefa
interações via voz e a web speech api
web speech api entrada via voz transformação de texto em
voz
web speech api server side client side
var recognition = new webkitSpeechRecognition();
recognition. continuos [true|false] interimResults [true|false] onstart [function] onresult [function] onerror
[function] onend [function]
recognition.start()
recognition.onresult = function(e) { var interimTranscript = ""; var finalTranscript
= ""; ! for (var i = e.resultIndex; i < e.results.length; i++) { if (event.results[i].isFinal) { finalTranscript += e.results[i][0].transcript; } else { interimTranscript += e.results[i][0].transcript; } } console.log(interimTranscrip); console.log(finalTranscript); };
como isso é possível?
o chrome envia o áudio para os servidores do google,
processa o sinal para reconhecer padrões e retorna a resposta para o navegador
demo (6)
web speech api é uma forma acessível e simples de
detectar voz diretamente no navegador
com o avanço da tecnologia nós podemos e devemos experimentar
novos tipos de interações entre humanos e máquinas
obrigado @yurimalheiros yurimalheiros.com