Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
たどころくん1号を支える技術
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
ikuma-t
September 17, 2023
Programming
1
330
たどころくん1号を支える技術
社内LT会の資料
ikuma-t
September 17, 2023
Tweet
Share
More Decks by ikuma-t
See All by ikuma-t
Querying Design System デザインシステムの意思決定を支える構造検索
ikumatadokoro
1
1.3k
Make Impossible States Impossibleを 意識してReactのPropsを設計しよう
ikumatadokoro
0
980
いまさらのStorybook
ikumatadokoro
0
850
これで最後にしたい! Astroと立ち向かう 6度目の個人ブログ再開発
ikumatadokoro
6
2.1k
Panda CSS と Ark UI ではじめる個人開発
ikumatadokoro
4
2.7k
見た目から始める生産性向上
ikumatadokoro
12
6k
ぼくが 美容師さんに伝えたかった バンドの話
ikumatadokoro
0
290
Railsアプリをコスパよく読むための環境整備
ikumatadokoro
2
1.3k
HTTPを手で書いて学ぶ ファイルアップロードの仕組み
ikumatadokoro
81
32k
Other Decks in Programming
See All in Programming
AI前提で考えるiOSアプリのモダナイズ設計
yuukiw00w
0
220
フロントエンド開発の勘所 -複数事業を経験して見えた判断軸の違い-
heimusu
7
2.7k
なるべく楽してバックエンドに型をつけたい!(楽とは言ってない)
hibiki_cube
0
140
ZJIT: The Ruby 4 JIT Compiler / Ruby Release 30th Anniversary Party
k0kubun
1
390
責任感のあるCloudWatchアラームを設計しよう
akihisaikeda
3
140
TerraformとStrands AgentsでAmazon Bedrock AgentCoreのSSO認証付きエージェントを量産しよう!
neruneruo
4
2.7k
副作用をどこに置くか問題:オブジェクト指向で整理する設計判断ツリー
koxya
1
570
2年のAppleウォレットパス開発の振り返り
muno92
PRO
0
200
AI 駆動開発ライフサイクル(AI-DLC):ソフトウェアエンジニアリングの再構築 / AI-DLC Introduction
kanamasa
11
6.2k
Package Management Learnings from Homebrew
mikemcquaid
0
170
Grafana:建立系統全知視角的捷徑
blueswen
0
320
それ、本当に安全? ファイルアップロードで見落としがちなセキュリティリスクと対策
penpeen
7
2.4k
Featured
See All Featured
The Curious Case for Waylosing
cassininazir
0
230
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2k
Large-scale JavaScript Application Architecture
addyosmani
515
110k
The Cult of Friendly URLs
andyhume
79
6.8k
Utilizing Notion as your number one productivity tool
mfonobong
2
210
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
GraphQLとの向き合い方2022年版
quramy
50
14k
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
270
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
400
Getting science done with accelerated Python computing platforms
jacobtomlinson
1
110
Navigating Algorithm Shifts & AI Overviews - #SMXNext
aleyda
0
1.1k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
9.8k
Transcript
たどころくん 1 号を支える技術 ikuma-t むせていたって喋りたい! エンペイてくtech 大LT 大会 ver 0.1.0
2023-09-15
ikuma-t IkumaTadokoro ikumatdkr ikuma-t.com ikumatadokoro 株式会社エンペイで働く、フロントエンドが好きなエンジニア。 表情パターンは9 割笑顔、1 割(´ ・ω
・`) なやさおです。
コロナ後で声がうまく出せない 状況を技術でどう乗り切ったか 今回のテーマ
製品紹介
たどころくん 1 号 ローカルで動く機械音声通話アプリ ブラウザさえあれば動作する 搭載している機能 発話 ピッチ調整 プリセット機能 履歴機能
竹村さん腹筋崩壊機能
導入実績 開発チームの日常におけるコミュニケーション:導入事例多数 イベントファシリテーション:多くのデイリースクラムでご利用いただいてます! 登壇: 重要なイベントでも肉声による発表と一切遜色なく遂行した実績あり ライトなLT イベントでもご利用いただいてます 竹村さんの腹筋を崩壊させた数:プライスレス 様々なシーンでご利用いただいてます
技術紹介
SpeechSynthesisUtterance 音声読み上げのコアとなる技術 SpeechSynthesisUtterance はウェブ音声 API のインターフェイスで、発話リクエストを表します。 これには、発話サービスが読み上げ るコンテンツと、その読み上げ方についての情報(言語、音の高低、音量)が含まれます。 これだけで機械音声による読み上げが実装できます。 ちなみに「Synthesis
」は「合成」、「Utterance 」は「発声」という意味です(合成音声読み上げAPI ) ブラウザ標準の音声合成API const uttr = new SpeechSynthesisUtterance(" ずんだもんだぞ"); window.speechSynthesis.speak(uttr);
たどころくん 1 号の正体 … 実際にブラウザで確認してみます たどころくん 1 号の正体は ... 「
Kyoko 」! 見た目は機械音声、中身は… const voices = window.speechSynthesis.getVoices() // 日本語向けの音声を確認する const locale = 'ja-JP' const japaneseVoices = voices.filter((voice) => voice.lang === locale) // これが機械音声を喋っている人の真の名前... japaneseVoices[0].name
履歴管理 永続化にはlocalStorage を使用しています。プレゼンもこれで乗り切ります。 意外と便利
システム音声を通話アプリに載せる 1. (スピーカーに漏れ出る前にキャッチ)Blackhole でシステム音を拾えるようにする 2. (正直よくわからん)Audio MIDI 設定でBlackhole と音声出力デバイスを合成した装置を作る 3.
(システム音声を外部にむける)通話アプリのマイクをBlackhole にする 試行錯誤してM1 Mac だとこれでできたってやつ
開発小話 開発リポジトリの名前は「 bossun 」 機械音声といえば、ということで「スイッチ」と名付けようとしたが、「switch 」 がプログラミングとしては汎用的な名前すぎて、ネタアプリに使うのは微妙という ことで、同じSKET DANCE から「ボッスン」を採用
制作は高速、されど仕事は進まず 「明日は復帰できるかな?」と思った日に勢いで1h もかからないでアプリ実装。 実装は高速で終わったものの、体調が万全でない中無理をしたため、翌日は一日中 頭がぼーっとして仕事どころではなかったです。
喋らなくていいおかげで肺の負担は下げられたし、 皆さんにも楽しんでいただけたようでなによりです おわり
ありがとうございました! Slides on ikuma-t.com