Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
Search
Kazuki Miura
PRO
February 07, 2026
Technology
400
4
Share
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
一周年おめでとうございます!
#jawsug_tochigi #jawsug
https://jawsug-tochigi.connpass.com/event/381536/
Kazuki Miura
PRO
February 07, 2026
More Decks by Kazuki Miura
See All by Kazuki Miura
地域のCCoEの拡大を目指す 企業間コミュニティ 「re:light local」について
miu_crescent
PRO
0
40
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
5k
これだけはやっておいた方がよさそう?awsにおけるランサムウェア対策
miu_crescent
PRO
1
140
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
390
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
190
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
miu_crescent
PRO
1
170
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
76
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.1k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
160
Other Decks in Technology
See All in Technology
Pythonでベイズモデリング
soogie
0
170
データ分析基盤の信頼を支える視点と設計
yuki_saito
1
460
Directions Asia 2026 | Beyond Buildable AI Agents: Let’s Visualize Partner Value in the AI Era
ryoheig0405
0
140
GitHub Copilot CLI の Rubber Duck 機能を使ってコーディングの品質をあげよう #techbaton_findy
stefafafan
1
330
The Making of AI Chips
pfn
PRO
0
660
AsyncStreamでマルチブロードキャストを実装する
1mash0
1
180
TypeScriptで実現する既存APIを活用したリモートMCPサーバー構築 / TSKaigi 2026
soarteclab
1
180
【2026年版】プロジェクトマネジメント実践論|現役エンジニアが語る!~チームでモノづくりをする時のコツとは?~
mixi_engineers
PRO
1
120
AI時代に求められる思考のパラダイムシフト
nrinetcom
PRO
0
110
実例から学ぶ GuardDuty(SSH BruteForce)調査の全体フローと勘所【SecurityJAWS】
cscengineer
PRO
0
180
インプロセスQAのための要因から捉えるプロジェクトリスクマネジメントnano #1 開発リソース効率状態への対処 #jasstnano
barus_qa
0
220
【新卒研修】ライブデモ + compose.yaml読解_講義資料
dip_tech
PRO
0
130
Featured
See All Featured
The World Runs on Bad Software
bkeepers
PRO
72
12k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
230
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
560
The Art of Programming - Codeland 2020
erikaheidi
57
14k
Imperfection Machines: The Place of Print at Facebook
scottboms
270
14k
What does AI have to do with Human Rights?
axbom
PRO
1
2.1k
The Mindset for Success: Future Career Progression
greggifford
PRO
0
330
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Between Models and Reality
mayunak
4
290
Game over? The fight for quality and originality in the time of robots
wayneb77
1
170
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Building a Scalable Design System with Sketch
lauravandoore
463
34k
Transcript
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
1周年おめでとうございます! 1周年おめでとうございます!
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 三浦 一樹 クラウドアーキテクト 自己紹介 自己紹介
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 初 AWS Builder Center 初 AWS Builder Center ほんとだロゴ出てるw 本日無事、更新の連絡が来ました
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 自己紹介 自己紹介 札幌からきました
新千歳の床で寝ました 新千歳の床で寝ました こないだ こないだ 気になる人は懇親会で... 気になる人は懇親会で...
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
放送局向け 音声文字起こし 要件違いで 2つ作った 放送局向け 音声文字起こし 要件違いで 2つ作った システム A
システム A システム B システム B
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい システム A システム A
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい システム B
システム B
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock
Amazon Transcribe 今日の主役 Amazon Bedrock ありがとう ぼくの ベッドロック
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
話者識別
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe チャンネル分け:なし 話者数:なし
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe "speaker_label":"spk_0" "speaker_label":"spk_1"
有効にすると、speaker_label が付与される
ちょっと何言って るかわからない ちょっと何言って るかわからない
人が読める形に + speaker_label に人の名前を 付与する 人が読める形に + speaker_label に人の名前を 付与する
Amazon Transcribe Amazon Bedrock 社長:とりあえず、ビール 常務:ハイボールで 会長:レモンサワー! 各登場人物の最初の発言は以下です Bedrock 側に発言順と最初の一言を渡し て、テキスト整形してもらう
これでとても綺麗 に議事録ができま した これでとても綺麗 に議事録ができま した 社長:お忙しいところありがとう ございます。 常務:皆様、こんにちは 会長:よろしくおねがいします
用途 通称番組審議会用 の議事録 用途 通称番組審議会用 の議事録 2 審議機関は、放送事業者の諮問に応じ、放送番組の適正を図るため必要な事項を審 議するほか、これに関し、放送事業者に対して意見を述べることができる。 3 放送事業者は、番組基準及び放送番組の編集に関する基本計画を定め、又はこれを 変更しようとするときは、審議機関に諮問しなければならない。
4 放送事業者は、審議機関が第二項の規定により諮問に応じて答申し、又は意見を述 べた事項があるときは、これを尊重して必要な措置をしなければならない。 5 放送事業者は、総務省令で定めるところにより、次の各号に掲げる事項を審議機関 に報告しなければならない。 一 前項の規定により講じた措置の内容 二 第九条第一項の規定による訂正又は取消しの放送の実施状況 三 放送番組に関して申出のあつた苦情その他の意見の概要 6 放送事業者は、審議機関からの答申又は意見を放送番組に反映させるようにするた め審議機関の機能の活用に努めるとともに、総務省令で定めるところにより、次の各号 に掲げる事項を公表しなければならない。 一 審議機関が放送事業者の諮問に応じてした答申又は放送事業者に対して述べた意見 の内容その他審議機関の議事の概要 二 第四項の規定により講じた措置の内容 放送法 第六条 放送事業者は、放送番組の適正を図る ため、放送番組審議機関(以下「審議 機関」という。 )を置くものとする。
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock VTT ファイルいけんじゃね?
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ブラウザが読める 動画とかで使ってる zoom とかの字幕も シークバーサムネとか もここで定義
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ただのテキストファイル
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock Transcribe はVTT が出せる 人に優しくないので Bedrock に頑張ってもらう
用途 選挙報道のため 用途 選挙報道のため 候補者の発言はとても大切 https://news.ntv.co.jp/n/rab/category/politics/ra0da837093f974868bafd8ba7d4b27569
Amazon Transcribe Amazon Bedrock 時間は1分くらいでまとめて1行ずつ CSV に出力してください 「あー」 「うー」などは削除 カスタム語彙
+ フィラーの除去 カスタム語彙 + フィラーの除去 プロンプト(だいたい) カスタム語彙 ・政党名 ・候補者名 ・地名 陸奥とむつ
操作画面 操作画面
今日の オープニング 今日の オープニング WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、
2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッションの中で、ちょっと地域 支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単に振り返りたいと思い ます。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中から入っていただい て、今三人で運営しています。
今日の オープニング 今日の オープニング
0:00:00 - 0:00:19 ちゃんとお話させていただいた、 やらせていただいてるんですけど、この後ですね、トークセッションの中 で、ちょっと地域支部の活性化だったりとか、活動報告、 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、 2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッション の中で、ちょっと地域支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
編集や テロップ作成 にも使える フィラーが消えて るの大きい 編集や テロップ作成 にも使える フィラーが消えて るの大きい
ツイートするまで次いきません! ツイートするまで次いきません!
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock 生成AI に入力するデータを
工夫すると 考えることを減らせる! 間に色々噛ませるのがAWS のいいところ
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 便利な p a r s e r として 便利な p a r s e r として
ありがとうございました! ありがとうございました! # j a w s u g _
t o c h i g i # j a w s u g _ t o c h i g i