Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
writer.appを支える技術
Search
Yohei Isokawa
July 21, 2018
Programming
1.1k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
writer.appを支える技術
2018/07/21 上越TechMeetup#2
Yohei Isokawa
July 21, 2018
More Decks by Yohei Isokawa
See All by Yohei Isokawa
今どきのWebアニメーション実装
yuhiisk
0
950
これからはじめるシングルページアプリケーション
yuhiisk
0
820
小学校段階からのプログラミング教育ってどうなる
yuhiisk
0
410
SPA実装最前線 ~今どきのJSフレームワーク選び~
yuhiisk
2
5.1k
Critical CSS
yuhiisk
1
13k
Other Decks in Programming
See All in Programming
AI 輔助遺留系統現代化的經驗分享
jame2408
1
780
「なぜそう決めたのか」を残し続ける仕組み ― Notion AI カスタムエージェント × Slack連携による設計判断の自動記録 - NIKKEI Tech Talk #47
niftycorp
PRO
0
210
技術記事、 専門家としてのプログラマ、 言語化
mizchi
13
6.2k
Observability in Practice:Grafana 與 Edge Device SRE 的那些事
blueswen
0
170
Performance Engineering for Everyone
elenatanasoiu
0
180
その問い、本当に正しいですか?AI時代のエンジニアに必要な哲学と認知科学 / ai-philosophy-cognitive-science
minodriven
11
5.9k
ふつうのFeature Flag実践入門
irof
8
4.1k
Language Server 使ってる? 〜VSCode と Zed の場合〜 / Are you using a Language Server? ~For VS Code and Zed~
handlename
0
790
TSKaigi Night Talks 2026_TypeScriptでサプライチェーンの整合性を型に閉じ込める
geekplus_tech
0
400
Lessons from Spec-Driven Development
simas
PRO
0
210
そのテスト、説明できますか?~LWテスト戦略FW~のご紹介
nakahara
0
150
Contextとはなにか
chiroruxx
1
330
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.8k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
180
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
430
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
10k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.4k
GraphQLとの向き合い方2022年版
quramy
50
15k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
1
260
Gemini Prompt Engineering: Practical Techniques for Tangible AI Outcomes
mfonobong
2
440
Accessibility Awareness
sabderemane
1
140
It's Worth the Effort
3n
188
29k
Transcript
writer.appを⽀える技術 五⼗川 洋平 (POPCORN) 2018.07.21 上越TechMeetup#2
⾃⼰紹介 • 五⼗川 洋平(イソップ) - 上越TechMeetup主催 - 上越市在住のフリーランスエンジニア • 趣味:ヨーヨー、バス釣り
• Twitter:@yuhiisk • イソップブログ(http://blog.yuhiisk.com)
writer.app
間に合いませんでした… (ヽ´ω`)
だが⾔わせてくれ • 開発の経緯
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介 • 今後の野望
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる)
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。 • じゃあちょっと作りますか。
プロトタイプ期
Twitterでの反応
Twitterでの反応
Twitterでの反応
SPA移⾏期
裏技による⾃動⽂字起こし https://note.mu/yriica/n/n3050888696ab
• writer.appとSoundflower(Mac)を組み合わせて ⾃動で⽂字起こしができる。 裏技による⾃動⽂字起こし
本腰⼊れてアップデート期
• 外部のアプリケーションを使わない。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 • もっと使いやすく。 本当の⾃動化を実現する(WIP)
開発版デモ
主な機能 • ⾳声ファイル再⽣での⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし • ドキュメントの保存
Google Speech-to-Text
Google Speech APIによる⾳声認識
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。 • 公開されているため現実的な選択。
Google Speech APIによる⾳声認識 ストリーミング
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API • Websocket (VMインスタンスを利⽤)
Google Speech APIによる⾳声認識 ⾳声ファイルをアップロード
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3)
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3) • Compute
Engine ( ≒ AWS EC2)
これまでは • Web Speech API
これまでは • Web Speech API • Chromeのみ(Firefoxは開発フラグをONにすれば)
Firebaseで開発を加速
Firebaseで開発を加速 • サイトデータのホスティング • ユーザー認証 • リアルタイムデータベース(NoSQL) • Google Cloud
Platformとの統合, etc
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage Firebase Cloud Messagingで
完了を通知
Firebaseで開発を加速 • Notification API(ブラウザ)
有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 • 定期課⾦・従量課⾦ 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
有料化に伴う決済処理
有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある • ⽇本のカスタマーサポート 有料化に伴う決済処理
有料化に伴う決済処理
有料化に伴う決済処理 ① Plans
有料化に伴う決済処理 ① Plans ② Customer
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription ※めっちゃ使えます
今後の野望
• ⽂字起こし機能の強化 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 • 最終的に統合アプリケーションを⽬指す
今後の野望
アップデートリリースをお待ち下さい