Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Look mom, no hands! (Web Speech API)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Yuri Malheiros
February 26, 2014
Programming
1
110
Look mom, no hands! (Web Speech API)
Palestra sobre Web Speech API no Paraiba.js
Yuri Malheiros
February 26, 2014
Tweet
Share
More Decks by Yuri Malheiros
See All by Yuri Malheiros
Aprendizagem de Máquina - Programando com o poder dos dados
yurimalheiros
0
70
A Method to Develop Description Logic Ontologies Iteratively Based on Competency Questions: an Implementation
yurimalheiros
0
130
Uma Ferramenta para Análise de Sentimentos em Redes Sociais Utilizando o SenticNet
yurimalheiros
7
400
Produzindo ideias
yurimalheiros
1
130
Criando comunidades bem-sucedidas
yurimalheiros
1
120
As máquinas que sentem
yurimalheiros
5
230
Other Decks in Programming
See All in Programming
Smart Handoff/Pickup ガイド - Claude Code セッション管理
yukiigarashi
0
140
LLM Observabilityによる 対話型音声AIアプリケーションの安定運用
gekko0114
2
430
プロダクトオーナーから見たSOC2 _SOC2ゆるミートアップ#2
kekekenta
0
220
Automatic Grammar Agreementと Markdown Extended Attributes について
kishikawakatsumi
0
200
AWS re:Invent 2025参加 直前 Seattle-Tacoma Airport(SEA)におけるハードウェア紛失インシデントLT
tetutetu214
2
120
生成AIを使ったコードレビューで定性的に品質カバー
chiilog
1
270
Package Management Learnings from Homebrew
mikemcquaid
0
230
AIによるイベントストーミング図からのコード生成 / AI-powered code generation from Event Storming diagrams
nrslib
2
1.9k
AIと一緒にレガシーに向き合ってみた
nyafunta9858
0
250
HTTPプロトコル正しく理解していますか? 〜かわいい猫と共に学ぼう。ฅ^•ω•^ฅ ニャ〜
hekuchan
2
690
KIKI_MBSD Cybersecurity Challenges 2025
ikema
0
1.3k
16年目のピクシブ百科事典を支える最新の技術基盤 / The Modern Tech Stack Powering Pixiv Encyclopedia in its 16th Year
ahuglajbclajep
5
1k
Featured
See All Featured
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
51
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
410
The Cult of Friendly URLs
andyhume
79
6.8k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
54
WCS-LA-2024
lcolladotor
0
450
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Become a Pro
speakerdeck
PRO
31
5.8k
How Software Deployment tools have changed in the past 20 years
geshan
0
32k
Building AI with AI
inesmontani
PRO
1
700
How to build a perfect <img>
jonoalderson
1
4.9k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Transcript
look mom, no hands! web speech api
yuri malheiros professor da ufpb pesquisador em inteligência artificial doutorando
no cin-ufpe
telas, mouses e teclados
as coisas evoluíram…
mas nem tanto
inovações!
inovações!
inovações!
digitar e apontar usando uma ferramenta não necessariamente é
a forma mais natural de executar uma tarefa
interações via voz e a web speech api
web speech api entrada via voz transformação de texto em
voz
web speech api server side client side
var recognition = new webkitSpeechRecognition();
recognition. continuos [true|false] interimResults [true|false] onstart [function] onresult [function] onerror
[function] onend [function]
recognition.start()
recognition.onresult = function(e) { var interimTranscript = ""; var finalTranscript
= ""; ! for (var i = e.resultIndex; i < e.results.length; i++) { if (event.results[i].isFinal) { finalTranscript += e.results[i][0].transcript; } else { interimTranscript += e.results[i][0].transcript; } } console.log(interimTranscrip); console.log(finalTranscript); };
como isso é possível?
o chrome envia o áudio para os servidores do google,
processa o sinal para reconhecer padrões e retorna a resposta para o navegador
demo (6)
web speech api é uma forma acessível e simples de
detectar voz diretamente no navegador
com o avanço da tecnologia nós podemos e devemos experimentar
novos tipos de interações entre humanos e máquinas
obrigado @yurimalheiros yurimalheiros.com