Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Kazuki Miura
PRO
February 07, 2026
Technology
430
4
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
一周年おめでとうございます!
#jawsug_tochigi #jawsug
https://jawsug-tochigi.connpass.com/event/381536/
Kazuki Miura
PRO
February 07, 2026
More Decks by Kazuki Miura
See All by Kazuki Miura
地域のCCoEの拡大を目指す 企業間コミュニティ 「re:light local」について
miu_crescent
PRO
0
49
us-east-1 に障害が起きた時に、 ap-northeast-1 にどんな影響があるか 説明できるようになろう!
miu_crescent
PRO
13
5.1k
これだけはやっておいた方がよさそう?awsにおけるランサムウェア対策
miu_crescent
PRO
1
160
なぜ あなたはそんなに re:Invent に行くのか?
miu_crescent
PRO
0
420
エンタメ方向のTを広げよう!Werner先生の クロージングキーノートを 深掘りするための小ネタ10
miu_crescent
PRO
1
200
Amazon Bedrockを活用した 報道向け文字起こしシステムの開発
miu_crescent
PRO
1
190
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
0
87
us-east-1 の障害が 起きると なぜ ソワソワするのか
miu_crescent
PRO
3
1.2k
完全未経験からAWSと共に セキュリティに立ち向かった半生
miu_crescent
PRO
1
170
Other Decks in Technology
See All in Technology
感情と身体を置き去りにしない、エンジニアの生きのこり方 ──いまから、ここから「自分の状態」を扱うという選択
saorimurooka
0
400
Text-to-SQLをAgentCoreで実現し、生成されるSQLの精度を定量的に評価する
yakumo
2
160
AI時代における最適なQA組織の作り方
ymty
3
190
Zenoh on Zephyr on LiteX
takasehideki
2
140
5分でわかるDuckDB Quack
chanyou0311
4
270
自分が詳しくない領域でAIを使う #プロヒス2026
konifar
20
8k
CVE-2026-20833_脆弱性対応とAES 化について
jukishiya
0
220
從觀望到全公司落地:AI Agentic Coding 導入實戰 — 流程整合與安全治理
appleboy
0
170
スタートアップにおけるアジャイルの実践について #shibuyagile
murabayashi
1
170
AWS Security Hub CSPMの成功・失敗体験
cmusudakeisuke
0
590
起点・思考・出力で分解する 〜PM業務の自動化設計〜
kazu_kichi_67
2
1.2k
作る力から、見極める力へ — AI時代に広がるエンジニアの価値と役割
rince
0
370
Featured
See All Featured
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
Between Models and Reality
mayunak
4
360
Groundhog Day: Seeking Process in Gaming for Health
codingconduct
0
230
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
67
55k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.4k
HDC tutorial
michielstock
2
720
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
470
New Earth Scene 8
popppiees
3
2.4k
More Than Pixels: Becoming A User Experience Designer
marktimemedia
3
450
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.3k
Tell your own story through comics
letsgokoyo
1
980
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
11k
Transcript
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
1周年おめでとうございます! 1周年おめでとうございます!
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 三浦 一樹 クラウドアーキテクト 自己紹介 自己紹介
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 初 AWS Builder Center 初 AWS Builder Center ほんとだロゴ出てるw 本日無事、更新の連絡が来ました
# j a w s u g _ t o
c h i g i # j a w s u g _ t o c h i g i 自己紹介 自己紹介 札幌からきました
新千歳の床で寝ました 新千歳の床で寝ました こないだ こないだ 気になる人は懇親会で... 気になる人は懇親会で...
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹
放送局向け 音声文字起こし 要件違いで 2つ作った 放送局向け 音声文字起こし 要件違いで 2つ作った システム A
システム A システム B システム B
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい システム A システム A
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい システム B
システム B
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock
Amazon Transcribe 今日の主役 Amazon Bedrock ありがとう ぼくの ベッドロック
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe Amazon Bedrock
話者識別
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe チャンネル分け:なし 話者数:なし
議事録を作りたい + 発言者識別したい 議事録を作りたい + 発言者識別したい Amazon Transcribe "speaker_label":"spk_0" "speaker_label":"spk_1"
有効にすると、speaker_label が付与される
ちょっと何言って るかわからない ちょっと何言って るかわからない
人が読める形に + speaker_label に人の名前を 付与する 人が読める形に + speaker_label に人の名前を 付与する
Amazon Transcribe Amazon Bedrock 社長:とりあえず、ビール 常務:ハイボールで 会長:レモンサワー! 各登場人物の最初の発言は以下です Bedrock 側に発言順と最初の一言を渡し て、テキスト整形してもらう
これでとても綺麗 に議事録ができま した これでとても綺麗 に議事録ができま した 社長:お忙しいところありがとう ございます。 常務:皆様、こんにちは 会長:よろしくおねがいします
用途 通称番組審議会用 の議事録 用途 通称番組審議会用 の議事録 2 審議機関は、放送事業者の諮問に応じ、放送番組の適正を図るため必要な事項を審 議するほか、これに関し、放送事業者に対して意見を述べることができる。 3 放送事業者は、番組基準及び放送番組の編集に関する基本計画を定め、又はこれを 変更しようとするときは、審議機関に諮問しなければならない。
4 放送事業者は、審議機関が第二項の規定により諮問に応じて答申し、又は意見を述 べた事項があるときは、これを尊重して必要な措置をしなければならない。 5 放送事業者は、総務省令で定めるところにより、次の各号に掲げる事項を審議機関 に報告しなければならない。 一 前項の規定により講じた措置の内容 二 第九条第一項の規定による訂正又は取消しの放送の実施状況 三 放送番組に関して申出のあつた苦情その他の意見の概要 6 放送事業者は、審議機関からの答申又は意見を放送番組に反映させるようにするた め審議機関の機能の活用に努めるとともに、総務省令で定めるところにより、次の各号 に掲げる事項を公表しなければならない。 一 審議機関が放送事業者の諮問に応じてした答申又は放送事業者に対して述べた意見 の内容その他審議機関の議事の概要 二 第四項の規定により講じた措置の内容 放送法 第六条 放送事業者は、放送番組の適正を図る ため、放送番組審議機関(以下「審議 機関」という。 )を置くものとする。
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock VTT ファイルいけんじゃね?
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ブラウザが読める 動画とかで使ってる zoom とかの字幕も シークバーサムネとか もここで定義
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
WebVTT: Web Video Text Tracks WebVTT: Web Video Text Tracks
ただのテキストファイル
全文文字起こし + タイムコード が欲しい 全文文字起こし + タイムコード が欲しい Amazon Transcribe
Amazon Bedrock Transcribe はVTT が出せる 人に優しくないので Bedrock に頑張ってもらう
用途 選挙報道のため 用途 選挙報道のため 候補者の発言はとても大切 https://news.ntv.co.jp/n/rab/category/politics/ra0da837093f974868bafd8ba7d4b27569
Amazon Transcribe Amazon Bedrock 時間は1分くらいでまとめて1行ずつ CSV に出力してください 「あー」 「うー」などは削除 カスタム語彙
+ フィラーの除去 カスタム語彙 + フィラーの除去 プロンプト(だいたい) カスタム語彙 ・政党名 ・候補者名 ・地名 陸奥とむつ
操作画面 操作画面
今日の オープニング 今日の オープニング WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、
2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッションの中で、ちょっと地域 支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単に振り返りたいと思い ます。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中から入っていただい て、今三人で運営しています。
今日の オープニング 今日の オープニング
0:00:00 - 0:00:19 ちゃんとお話させていただいた、 やらせていただいてるんですけど、この後ですね、トークセッションの中 で、ちょっと地域支部の活性化だったりとか、活動報告、 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
WEBVTT 1 00:00:00.109 --> 00:00:01.820 ちゃんとお話させていただいた、 2 00:00:02.059 --> 00:00:08.399 やらせていただいてるんですけど、えーこの後ですね、トークセッション の中で、ちょっと地域支部の活性化だったりとか、活動報告、 3 00:00:08.630 --> 00:00:13.590 まあ一周年なのでお話ししたいと思っているんですけど、そこでまた簡単 に振り返りたいと思います。で、今日はちょっと 4 00:00:13.590 --> 00:00:19.250 お休みいただいた、お休みになっちゃったんですけど、ヒヤナさんが途中 から入っていただいて、今三人で運営しています。
編集や テロップ作成 にも使える フィラーが消えて るの大きい 編集や テロップ作成 にも使える フィラーが消えて るの大きい
ツイートするまで次いきません! ツイートするまで次いきません!
使ってる サービスは一緒 使ってる サービスは一緒 Amazon Transcribe Amazon Bedrock 生成AI に入力するデータを
工夫すると 考えることを減らせる! 間に色々噛ませるのがAWS のいいところ
生成A I を活用した 音声文字起こしシステムの 2 つの構築パターンについて 生成A I を活用した 音声文字起こしシステムの
2 つの構築パターンについて # j a w s u g _ t o c h i g i # j a w s u g _ t o c h i g i 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 2 0 2 6 年2 月7 日 株式会社ヘプタゴン 三浦一樹 便利な p a r s e r として 便利な p a r s e r として
ありがとうございました! ありがとうございました! # j a w s u g _
t o c h i g i # j a w s u g _ t o c h i g i