Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Look mom, no hands! (Web Speech API)
Search
Yuri Malheiros
February 26, 2014
Programming
1
110
Look mom, no hands! (Web Speech API)
Palestra sobre Web Speech API no Paraiba.js
Yuri Malheiros
February 26, 2014
Tweet
Share
More Decks by Yuri Malheiros
See All by Yuri Malheiros
Aprendizagem de Máquina - Programando com o poder dos dados
yurimalheiros
0
64
A Method to Develop Description Logic Ontologies Iteratively Based on Competency Questions: an Implementation
yurimalheiros
0
120
Uma Ferramenta para Análise de Sentimentos em Redes Sociais Utilizando o SenticNet
yurimalheiros
7
390
Produzindo ideias
yurimalheiros
1
120
Criando comunidades bem-sucedidas
yurimalheiros
1
120
As máquinas que sentem
yurimalheiros
5
220
Other Decks in Programming
See All in Programming
旅行プランAIエージェント開発の裏側
ippo012
1
600
Namespace and Its Future
tagomoris
6
690
時間軸から考えるTerraformを使う理由と留意点
fufuhu
9
3.8k
AIレビュアーをスケールさせるには / Scaling AI Reviewers
technuma
2
240
【第4回】関東Kaggler会「Kaggleは執筆に役立つ」
mipypf
0
1k
CJK and Unicode From a PHP Committer
youkidearitai
PRO
0
100
さようなら Date。 ようこそTemporal! 3年間先行利用して得られた知見の共有
8beeeaaat
0
250
OSS開発者という働き方
andpad
5
1.6k
コンテキストエンジニアリング Cursor編
kinopeee
1
740
250830 IaCの選定~AWS SAMのLambdaをECSに乗り換えたときの備忘録~
east_takumi
0
370
レガシープロジェクトで最大限AIの恩恵を受けられるようClaude Codeを利用する
tk1351
4
1.6k
Ruby Parser progress report 2025
yui_knk
1
260
Featured
See All Featured
Facilitating Awesome Meetings
lara
55
6.5k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
910
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Typedesign – Prime Four
hannesfritz
42
2.8k
KATA
mclloyd
32
14k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
507
140k
Embracing the Ebb and Flow
colly
87
4.8k
It's Worth the Effort
3n
187
28k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
Site-Speed That Sticks
csswizardry
10
800
Transcript
look mom, no hands! web speech api
yuri malheiros professor da ufpb pesquisador em inteligência artificial doutorando
no cin-ufpe
telas, mouses e teclados
as coisas evoluíram…
mas nem tanto
inovações!
inovações!
inovações!
digitar e apontar usando uma ferramenta não necessariamente é
a forma mais natural de executar uma tarefa
interações via voz e a web speech api
web speech api entrada via voz transformação de texto em
voz
web speech api server side client side
var recognition = new webkitSpeechRecognition();
recognition. continuos [true|false] interimResults [true|false] onstart [function] onresult [function] onerror
[function] onend [function]
recognition.start()
recognition.onresult = function(e) { var interimTranscript = ""; var finalTranscript
= ""; ! for (var i = e.resultIndex; i < e.results.length; i++) { if (event.results[i].isFinal) { finalTranscript += e.results[i][0].transcript; } else { interimTranscript += e.results[i][0].transcript; } } console.log(interimTranscrip); console.log(finalTranscript); };
como isso é possível?
o chrome envia o áudio para os servidores do google,
processa o sinal para reconhecer padrões e retorna a resposta para o navegador
demo (6)
web speech api é uma forma acessível e simples de
detectar voz diretamente no navegador
com o avanço da tecnologia nós podemos e devemos experimentar
novos tipos de interações entre humanos e máquinas
obrigado @yurimalheiros yurimalheiros.com