Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
writer.appを支える技術
Search
Yohei Isokawa
July 21, 2018
Programming
0
720
writer.appを支える技術
2018/07/21 上越TechMeetup#2
Yohei Isokawa
July 21, 2018
Tweet
Share
More Decks by Yohei Isokawa
See All by Yohei Isokawa
今どきのWebアニメーション実装
yuhiisk
0
660
これからはじめるシングルページアプリケーション
yuhiisk
0
520
小学校段階からのプログラミング教育ってどうなる
yuhiisk
0
310
SPA実装最前線 ~今どきのJSフレームワーク選び~
yuhiisk
2
4.5k
Critical CSS
yuhiisk
1
12k
Other Decks in Programming
See All in Programming
新宿ダンジョンを可視化してみた
satoshi7190
3
370
Micro Frontends for Java Microservices - Utah JUG 2024
mraible
PRO
1
100
Kotlin Multiplatform at Stable and Beyond (Android Makers 2024)
zsmb
0
440
Hanami and htmx
bkuhlmann
0
220
Anthropic Cookbook のおすすめレシピ
schroneko
7
1.1k
初心者のためのRubyKaigi入門/RubyKaigi Introduction
a_matsuda
8
1.4k
PHPの次期バージョンはこの時期どうなっているのか - Internalsの開発体制について - PHPカンファレンス小田原
youkidearitai
PRO
1
220
Implementing Design Systems in Swift
seyfoyun
1
430
0→1と1→10の狭間で Javaという技術選定を振り返る/Reflecting on the Decision to Choose Java Between Scaling from 0 to 1 and 1 to 10
jaguar_imo
2
400
SwiftUIで使いやすいToastの作り方 / How to build a Toast system which is easy to use in SwiftUI
lovee
3
160
Java 22 Overview
kishida
1
190
TCAとKMPを用いた新規動画配信アプリ 「ABEMA Live」の設計
tomu28
2
120
Featured
See All Featured
Navigating Team Friction
lara
179
13k
Robots, Beer and Maslow
schacon
PRO
155
7.9k
Fontdeck: Realign not Redesign
paulrobertlloyd
76
4.9k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
126
32k
Testing 201, or: Great Expectations
jmmastey
29
6.4k
What’s in a name? Adding method to the madness
productmarketing
PRO
17
2.7k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
22
1.6k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
358
22k
Web Components: a chance to create the future
zenorocha
306
41k
Facilitating Awesome Meetings
lara
43
5.6k
Into the Great Unknown - MozCon
thekraken
14
1k
Automating Front-end Workflow
addyosmani
1357
200k
Transcript
writer.appを⽀える技術 五⼗川 洋平 (POPCORN) 2018.07.21 上越TechMeetup#2
⾃⼰紹介 • 五⼗川 洋平(イソップ) - 上越TechMeetup主催 - 上越市在住のフリーランスエンジニア • 趣味:ヨーヨー、バス釣り
• Twitter:@yuhiisk • イソップブログ(http://blog.yuhiisk.com)
writer.app
間に合いませんでした… (ヽ´ω`)
だが⾔わせてくれ • 開発の経緯
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介
だが⾔わせてくれ • 開発の経緯 • 開発技術の紹介 • 今後の野望
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる)
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。
事の発端 • ⾳声⽂字起こしは地道で不⽑な作業。 (想像以上に時間がかかる) • 解決できる便利なアプリがない。 • じゃあちょっと作りますか。
プロトタイプ期
Twitterでの反応
Twitterでの反応
Twitterでの反応
SPA移⾏期
裏技による⾃動⽂字起こし https://note.mu/yriica/n/n3050888696ab
• writer.appとSoundflower(Mac)を組み合わせて ⾃動で⽂字起こしができる。 裏技による⾃動⽂字起こし
本腰⼊れてアップデート期
• 外部のアプリケーションを使わない。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 本当の⾃動化を実現する(WIP)
• 外部のアプリケーションを使わない。 • 操作をもっと簡単に。 • もっと使いやすく。 本当の⾃動化を実現する(WIP)
開発版デモ
主な機能 • ⾳声ファイル再⽣での⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし
主な機能 • ⾳声ファイル再⽣での⽂字起こし • マイク⼊⼒による⽂字起こし • アップロードした⾳声ファイルの⾃動⽂字起こし • ドキュメントの保存
Google Speech-to-Text
Google Speech APIによる⾳声認識
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。
Google Speech APIによる⾳声認識 • ブラウザAPI以上の精度を期待。 • 環境に左右されない。 • 公開されているため現実的な選択。
Google Speech APIによる⾳声認識 ストリーミング
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API
ストリーミングでの⾳声認識 • navigator.mediaDevices.getUserMedia • Web Audio API • Websocket (VMインスタンスを利⽤)
Google Speech APIによる⾳声認識 ⾳声ファイルをアップロード
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3)
⾳声ファイルからの⾳声認識 • Cloud Storage ( ≒ AWS S3) • Compute
Engine ( ≒ AWS EC2)
これまでは • Web Speech API
これまでは • Web Speech API • Chromeのみ(Firefoxは開発フラグをONにすれば)
Firebaseで開発を加速
Firebaseで開発を加速 • サイトデータのホスティング • ユーザー認証 • リアルタイムデータベース(NoSQL) • Google Cloud
Platformとの統合, etc
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Storage Functions Application
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage
Firebaseで開発を加速 Speech To Text Compute Engine Storage Firebase Cloud Messagingで
完了を通知
Firebaseで開発を加速 • Notification API(ブラウザ)
有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 有料化に伴う決済処理
• オンライン決済サービス (https://stripe.com/jp) • クレジットカード決済に対応 (VISA / Master/ JCB /
AMEX / Diners / Apple Pay) • アカウント登録不要 • 定期課⾦・従量課⾦ 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
有料化に伴う決済処理
有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある 有料化に伴う決済処理
• デベロッパーファースト (curl, Ruby, Python, PHP, Java, Node, Go, .NET)
• 開発モードがある • ⽇本のカスタマーサポート 有料化に伴う決済処理
有料化に伴う決済処理
有料化に伴う決済処理 ① Plans
有料化に伴う決済処理 ① Plans ② Customer
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription
有料化に伴う決済処理 ① Plans ② Customer ③ Subscription ※めっちゃ使えます
今後の野望
• ⽂字起こし機能の強化 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 今後の野望
• ⽂字起こし機能の強化 • 画像から⽂字起こし • 精度の向上 • キャッシュ、オフライン対応 • 最終的に統合アプリケーションを⽬指す
今後の野望
アップデートリリースをお待ち下さい