Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
たどころくん1号を支える技術
Search
ikuma-t
September 17, 2023
Programming
1
190
たどころくん1号を支える技術
社内LT会の資料
ikuma-t
September 17, 2023
Tweet
Share
More Decks by ikuma-t
See All by ikuma-t
いまさらのStorybook
ikumatadokoro
0
41
これで最後にしたい! Astroと立ち向かう 6度目の個人ブログ再開発
ikumatadokoro
3
290
Panda CSS と Ark UI ではじめる個人開発
ikumatadokoro
2
770
見た目から始める生産性向上
ikumatadokoro
10
5.2k
ぼくが 美容師さんに伝えたかった バンドの話
ikumatadokoro
0
110
Railsアプリをコスパよく読むための環境整備
ikumatadokoro
2
750
HTTPを手で書いて学ぶ ファイルアップロードの仕組み
ikumatadokoro
72
26k
なんだか うまくいっている を 自分たちの いつもどおり に 定着させるためのチーム戦略
ikumatadokoro
4
620
プロダクト開発を支えるペースメーカー
ikumatadokoro
1
270
Other Decks in Programming
See All in Programming
/←このスケジュール表に立ち向かう フロントエンド開発戦略 / A front-end development strategy to tackle a single-slash schedule.
nrslib
1
590
Tuning GraphQL on Rails
pyama86
2
900
Googleのテストサイズを活用したテスト環境の構築
toms74209200
0
250
cXML という電子商取引の トランザクションを支える プロトコルと向きあっている話
phigasui
2
2k
CPython 인터프리터 구조 파헤치기 - PyCon Korea 24
kennethanceyer
0
230
Boost Performance and Developer Productivity with Jakarta EE 11
ivargrimstad
0
510
約9000個の自動テストの 時間を50分->10分に短縮 Flakyテストを1%以下に抑えた話
hatsu38
21
9.8k
Prompt Engineering for Developers @ AWS Community Day Adria 2024
slobodan
0
120
Go言語でターミナルフレンドリーなAIコマンド、afaを作った/fukuokago20_afa
monochromegane
2
140
Re:proS_案内資料
rect
0
270
のびしろを広げる巻き込まれ力:偶然を活かすキャリアの作り方/oso2024
takahashiikki
1
360
LLM生成文章の精度評価自動化とプロンプトチューニングの効率化について
layerx
PRO
2
100
Featured
See All Featured
Learning to Love Humans: Emotional Interface Design
aarron
272
40k
Fireside Chat
paigeccino
32
3k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
106
49k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
280
13k
StorybookのUI Testing Handbookを読んだ
zakiyama
26
5.2k
Building Your Own Lightsaber
phodgson
102
6k
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
The Cost Of JavaScript in 2023
addyosmani
45
6.5k
The Cult of Friendly URLs
andyhume
78
6k
A Modern Web Designer's Workflow
chriscoyier
692
190k
[RailsConf 2023] Rails as a piece of cake
palkan
51
4.8k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
25
1.8k
Transcript
たどころくん 1 号を支える技術 ikuma-t むせていたって喋りたい! エンペイてくtech 大LT 大会 ver 0.1.0
2023-09-15
ikuma-t IkumaTadokoro ikumatdkr ikuma-t.com ikumatadokoro 株式会社エンペイで働く、フロントエンドが好きなエンジニア。 表情パターンは9 割笑顔、1 割(´ ・ω
・`) なやさおです。
コロナ後で声がうまく出せない 状況を技術でどう乗り切ったか 今回のテーマ
製品紹介
たどころくん 1 号 ローカルで動く機械音声通話アプリ ブラウザさえあれば動作する 搭載している機能 発話 ピッチ調整 プリセット機能 履歴機能
竹村さん腹筋崩壊機能
導入実績 開発チームの日常におけるコミュニケーション:導入事例多数 イベントファシリテーション:多くのデイリースクラムでご利用いただいてます! 登壇: 重要なイベントでも肉声による発表と一切遜色なく遂行した実績あり ライトなLT イベントでもご利用いただいてます 竹村さんの腹筋を崩壊させた数:プライスレス 様々なシーンでご利用いただいてます
技術紹介
SpeechSynthesisUtterance 音声読み上げのコアとなる技術 SpeechSynthesisUtterance はウェブ音声 API のインターフェイスで、発話リクエストを表します。 これには、発話サービスが読み上げ るコンテンツと、その読み上げ方についての情報(言語、音の高低、音量)が含まれます。 これだけで機械音声による読み上げが実装できます。 ちなみに「Synthesis
」は「合成」、「Utterance 」は「発声」という意味です(合成音声読み上げAPI ) ブラウザ標準の音声合成API const uttr = new SpeechSynthesisUtterance(" ずんだもんだぞ"); window.speechSynthesis.speak(uttr);
たどころくん 1 号の正体 … 実際にブラウザで確認してみます たどころくん 1 号の正体は ... 「
Kyoko 」! 見た目は機械音声、中身は… const voices = window.speechSynthesis.getVoices() // 日本語向けの音声を確認する const locale = 'ja-JP' const japaneseVoices = voices.filter((voice) => voice.lang === locale) // これが機械音声を喋っている人の真の名前... japaneseVoices[0].name
履歴管理 永続化にはlocalStorage を使用しています。プレゼンもこれで乗り切ります。 意外と便利
システム音声を通話アプリに載せる 1. (スピーカーに漏れ出る前にキャッチ)Blackhole でシステム音を拾えるようにする 2. (正直よくわからん)Audio MIDI 設定でBlackhole と音声出力デバイスを合成した装置を作る 3.
(システム音声を外部にむける)通話アプリのマイクをBlackhole にする 試行錯誤してM1 Mac だとこれでできたってやつ
開発小話 開発リポジトリの名前は「 bossun 」 機械音声といえば、ということで「スイッチ」と名付けようとしたが、「switch 」 がプログラミングとしては汎用的な名前すぎて、ネタアプリに使うのは微妙という ことで、同じSKET DANCE から「ボッスン」を採用
制作は高速、されど仕事は進まず 「明日は復帰できるかな?」と思った日に勢いで1h もかからないでアプリ実装。 実装は高速で終わったものの、体調が万全でない中無理をしたため、翌日は一日中 頭がぼーっとして仕事どころではなかったです。
喋らなくていいおかげで肺の負担は下げられたし、 皆さんにも楽しんでいただけたようでなによりです おわり
ありがとうございました! Slides on ikuma-t.com