Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
writer.appを支える技術
Search
Yohei Isokawa
July 21, 2018
Programming
0
1k
writer.appを支える技術
2018/07/21 上越TechMeetup#2
Yohei Isokawa
July 21, 2018
Tweet
Share
More Decks by Yohei Isokawa
See All by Yohei Isokawa
今どきのWebアニメーション実装
yuhiisk
0
880
これからはじめるシングルページアプリケーション
yuhiisk
0
770
小学校段階からのプログラミング教育ってどうなる
yuhiisk
0
400
SPA実装最前線 ~今どきのJSフレームワーク選び~
yuhiisk
2
5k
Critical CSS
yuhiisk
1
13k
Other Decks in Programming
See All in Programming
Cell-Based Architecture
larchanjo
0
150
안드로이드 9년차 개발자, 프론트엔드 주니어로 커리어 리셋하기
maryang
1
140
Developing static sites with Ruby
okuramasafumi
0
330
Rubyで鍛える仕組み化プロヂュース力
muryoimpl
0
220
マスタデータ問題、マイクロサービスでどう解くか
kts
0
150
組み合わせ爆発にのまれない - 責務分割 x テスト
halhorn
1
170
AIの誤りが許されない業務システムにおいて“信頼されるAI” を目指す / building-trusted-ai-systems
yuya4
6
4k
ゆくKotlin くるRust
exoego
1
170
Basic Architectures
denyspoltorak
0
130
著者と進める!『AIと個人開発したくなったらまずCursorで要件定義だ!』
yasunacoffee
0
170
PostgreSQLで手軽にDuckDBを使う!DuckDB&pg_duckdb入門/osc25hi-duckdb
takahashiikki
0
210
AtCoder Conference 2025「LLM時代のAHC」
imjk
2
600
Featured
See All Featured
Into the Great Unknown - MozCon
thekraken
40
2.2k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Crafting Experiences
bethany
0
23
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.2k
Technical Leadership for Architectural Decision Making
baasie
0
190
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Keith and Marios Guide to Fast Websites
keithpitt
413
23k
Building Experiences: Design Systems, User Experience, and Full Site Editing
marktimemedia
0
350
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
Writing Fast Ruby
sferik
630
62k
Transcript
writer.appを⽀える技術 五⼗川 洋平 (POPCORN) 2018.07.21 上越TechMeetup#2
⾃⼰紹介 • 五⼗川 洋平(イソップ) - 上越TechMeetup主催 - 上越市在住のフリーランスエンジニア • 趣味:ヨーヨー、バス釣り
• Twitter:@yuhiisk • イソップブログ(http://blog.yuhiisk.com)
writer.app
間に合いませんでした… (ヽ´ω`)
だが⾔わせてくれ • 開発の経緯
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介 • 今後の野望
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる)
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。 • じゃあちょっと作りますか。
プロトタイプ期
Twitterでの反応
Twitterでの反応
Twitterでの反応
SPA移⾏期
裏技による⾃動⽂字起こし https://note.mu/yriica/n/n3050888696ab
• writer.appとSoundflower(Mac)を組み合わせて ⾃動で⽂字起こしができる。 裏技による⾃動⽂字起こし
本腰⼊れてアップデート期
• 外部のアプリケーションを使わない。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 • もっと使いやすく。 本当の⾃動化を実現する(WIP)
開発版デモ
主な機能 • ⾳声ファイル再⽣での⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし • ドキュメントの保存
Google Speech-to-Text
Google Speech APIによる⾳声認識
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。 • 公開されているため現実的な選択。
Google Speech APIによる⾳声認識 ストリーミング
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API • Websocket (VMインスタンスを利⽤)
Google Speech APIによる⾳声認識 ⾳声ファイルをアップロード
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3)
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3) • Compute
Engine ( ≒ AWS EC2)
これまでは • Web Speech API
これまでは • Web Speech API • Chromeのみ(Firefoxは開発フラグをONにすれば)
Firebaseで開発を加速
Firebaseで開発を加速 • サイトデータのホスティング • ユーザー認証 • リアルタイムデータベース(NoSQL) • Google Cloud
Platformとの統合, etc
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage Firebase Cloud Messagingで
完了を通知
Firebaseで開発を加速 • Notification API(ブラウザ)
有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 • 定期課⾦・従量課⾦ 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
有料化に伴う決済処理
有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある • ⽇本のカスタマーサポート 有料化に伴う決済処理
有料化に伴う決済処理
有料化に伴う決済処理 ① Plans
有料化に伴う決済処理 ① Plans ② Customer
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription ※めっちゃ使えます
今後の野望
• ⽂字起こし機能の強化 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 • 最終的に統合アプリケーションを⽬指す
今後の野望
アップデートリリースをお待ち下さい