Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
会議の議事録作成を省力化したい
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
murakami0923
July 15, 2025
Business
30
0
Share
会議の議事録作成を省力化したい
AWSのAmazon Transcribeで、録画あるいは録音したデータを文字に起こし、誰が何の発言をしたのかを自動的・半自動的に記録する方法を試しました。
murakami0923
July 15, 2025
More Decks by murakami0923
See All by murakami0923
ベクトルデータベースあれこれ ~RAGのために~
murakami0923
0
20
2022/10/21 bitstar CROSS 2022 in EZO AWS ECSでのバックエンドの開発について
murakami0923
0
120
2022/08/06 JavaDo n+1問題に気を付けよう
murakami0923
0
370
Other Decks in Business
See All in Business
株式会社リバイブル 会社説明資料
rebible
0
400
merpay-Overview
mercari_inc
8
200k
タケウチグループRecruit
takeuchigroup
0
12k
エンジニアのためのコミュニケーション術
zashii
0
280
01_全社_FLUX採用ピッチ資料_Ver.5.3
flux
PRO
8
210k
採用ピッチ資料_耳川広域森林組合
mimirin
0
160
哲学ドリブン開発の全体像 ── 同じプロンプトで出力が変わるとき、何が起きているのか~Philosophy as Code
makitotashiro
0
160
【簡易版】パーソルクロステクノロジー_システムインテグレーション領域のご紹介 / Introduction_of_persol-xtech_gs_es_dx_short
pxt_gs_ssol
0
160k
HumanDriven 会社紹介資料 / HumanDriven Company Profile
humandriven
0
300
Brush Company Deck ver1.0
brush2026
0
500
VISASQ: ABOUT DEV TEAM
eikohashiba
6
44k
三井物産グループのデジタル証券~イオン大宮~徹底解説セミナー
c0rp_mdm
PRO
0
1.2k
Featured
See All Featured
Leading Effective Engineering Teams in the AI Era
addyosmani
9
2k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
200
Balancing Empowerment & Direction
lara
6
1.1k
Beyond borders and beyond the search box: How to win the global "messy middle" with AI-driven SEO
davidcarrasco
3
140
How to make the Groovebox
asonas
2
2.2k
Everyday Curiosity
cassininazir
0
210
Getting science done with accelerated Python computing platforms
jacobtomlinson
2
210
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.9k
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
370
A designer walks into a library…
pauljervisheath
211
24k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
380
StorybookのUI Testing Handbookを読んだ
zakiyama
31
6.8k
Transcript
© 2025 Masashi Murakami All Right Reserved. 1 会議の議事録作成を省力化したい 2025/07/11
村上 將志
© 2025 Masashi Murakami All Right Reserved. 2 はじめに
© 2025 Masashi Murakami All Right Reserved. 3 はじめに 大事な会議では、どのような議論があって、何が決定したか、その後の宿題が何か、しっかり把握
するために、記録を撮っておくことが大切です。 一方で、会議に参加する際、議事録や議事メモ作成のためにメモを取りながら議論に参加するのは 大変ですし、自分が議論に入っている時はメモを飛ばしてしまうことも多々あります。 2020年のコロナ禍以降、ZoomやTeams、Webexなどでのオンラインの会議が増え、各ツールの録 画機能やOSでのデスクトップ録画機能などで録画をすることで振り返りにも使える一方、録画をす べてチェックする時間を取りにくいのが現実です。 そこで、AWS (Amazon Web Services)のAmazon Transcribeを用いて、録画あるいは録音した データを文字に起こし、誰が何の発言をしたのかを自動的・半自動的に記録したいと考えました。
© 2025 Masashi Murakami All Right Reserved. 4 試したこと Amazon
Transcribeで音声を文字起こしするため、下記の流れで行うことにしました。 1. 録画データを音声データに変換(ffmpegコマンド) • ※Amazon Transcribeでは動画ファイルをサポートしていないため、音声に変換します。 2. 音声データをAmazon S3にアップロード 3. Amazon TranscribeでS3上の音声を文字起こし • ※参加者の人数(最大話者数)を設定することで、声ごとに分類 4. 文字起こしのJSONファイルをダウンロード 5. Jupyter Notebookで下記の処理を実行 1. JSONを解析して話者ごとの発言内容を表示 2. 発言内容から、話者を特定→自動化不可能のため人力 3. フィラー(「えー」、「ええと」、「あのー」など)を除去 4. 会話内容をExcelに保存
© 2025 Masashi Murakami All Right Reserved. 5 前提 •
ffmpegコマンド、Jupyter Notebookの実行は、Ubuntu 24.04上で行う前提とします。 – ※Windows 11のWSL2上にUbuntu 24.04をインストールして使用しています。 • Ubuntuの中にPython 3.11、pipがインストールされている前提とします。 – ※もっと新しいバージョンでも動くとは思いますが、作成時点の3.11に合わせた方が確実 かと思います。 – ※作成時点はpyenvでPythonのバージョンを管理し、Jupyter Notebook実行のディレク トリ内にvenvを作成する方法を採りました。 • AWS (Amazon Web Services)にアカウントがあり、ユーザーに必要な権限が割り当てられて いる前提とします。 – S3バケット作成、S3への読み書き、Transcribe実行など – Power User権限のあるユーザーで確認しました。
© 2025 Masashi Murakami All Right Reserved. 6 前提 Amazon
Transcribeの音声認識ファイルの解析用Jupyter Notebookは https://github.com/murakami0923/the-minutes-python-analyze/tree/main に入れてあります。 ※「main」ブランチで作成中
© 2025 Masashi Murakami All Right Reserved. 7 録画データを音声データに変換 (ffmpegコマンド)
© 2025 Masashi Murakami All Right Reserved. 8 録画データを音声データに変換(ffmpegコマンド) •
Ubuntuにffmpegをインストールします。 – sudo apt install -y ffmpeg • Ubuntuに動画ファイルをアップロードします。 • ffmpegコマンドで変換を実行します。 – ffmpeg -i {mp4ファイル名} {mp3ファイル名}
© 2025 Masashi Murakami All Right Reserved. 9 音声データをAmazon S3にアップロード
© 2025 Masashi Murakami All Right Reserved. 10 音声データをAmazon S3にアップロード
• S3にTranscribe用のバケットを作成し、音声ファイル(mp3)をアップロードします。 • S3 URIが必要になるので、コピーして控えておきます。
© 2025 Masashi Murakami All Right Reserved. 11 Amazon TranscribeでS3上の音声を文字起こし
© 2025 Masashi Murakami All Right Reserved. 12 Amazon TranscribeでS3上の音声を文字起こし
• Transcribeのジョブ作成を開始します。 • 名前を入力します。 • 言語はデフォルトで英語になっているので 日本語を選択します。 • その他はデフォルトのままでOKです。
© 2025 Masashi Murakami All Right Reserved. 13 Amazon TranscribeでS3上の音声を文字起こし
• 入力データのS3 URIには、S3にアップロードした音声ファイルのS3 URI(s3://ではじまるも の)を入力します。
© 2025 Masashi Murakami All Right Reserved. 14 Amazon TranscribeでS3上の音声を文字起こし
• 出力については、音声ファイルと同じバケットの、ジョブ名と同じディレクトリを切って、そ の中に出力するよう設定するとよいでしょう。
© 2025 Masashi Murakami All Right Reserved. 15 Amazon TranscribeでS3上の音声を文字起こし
• 必要に応じてタグを設定し、「次へ」で先に進みます。
© 2025 Masashi Murakami All Right Reserved. 16 Amazon TranscribeでS3上の音声を文字起こし
• 音声の識別設定をします。 • 「音声識別」のトグルをONにし ます。 • 「話者のパーティショニング」 のチェックをONにします。 • 話者の最大数に会議参加者の人 数(最大30人)を入力します。 • 設定を入力したら 「ジョブを作成」ボタンで次に進み ます。
© 2025 Masashi Murakami All Right Reserved. 17 Amazon TranscribeでS3上の音声を文字起こし
• ジョブの一覧ページに戻るため、ステータスを確認しながら、完了するまで待ちます。 • ステータスが「完了」になったら次の手順に進みます。
© 2025 Masashi Murakami All Right Reserved. 18 文字起こしのJSONファイルをダウンロード
© 2025 Masashi Murakami All Right Reserved. 19 文字起こしのJSONファイルをダウンロード •
S3のバケットを再表示すると、Transcribeで指定したディレクトリができているので、ディレ クトリの中に入ります。 • jsonファイルができているので、ダウンロードし、Jupyter Notebook環境の 「notebooks/data」ディレクトリに保存します。
© 2025 Masashi Murakami All Right Reserved. 20 Jupyter Notebookで下記の処理を実行
© 2025 Masashi Murakami All Right Reserved. 21 Jupyter Notebookで下記の処理を実行
• Jupyter Notebookシート:analyze-amazon-transcribe-json.ipynb • 使用方法: – セル1つずつを順に実行します。 • ※途中、コードを修正する必要があるため – 前のセルに、speaker_labelごとに会話内容が表示されるので、その内容をもとに、 speaker_labelごとに名前設定する欄に、話者の名前を記載します。 – その後は最後まで順に実行します。
© 2025 Masashi Murakami All Right Reserved. 22 さいごに
© 2025 Masashi Murakami All Right Reserved. 23 さいごに(現状課題と将来について) •
Amazon Transcribeでの固有名詞について – カスタムボキャブラリーを設定し、固有名詞の認識精度の向上を試みたいと考えています。 • 話者の名前の設定について – 現状、会話の内容から手作業で設定するようにしていますが、将来的には、人の口癖などから 予測する仕組みを考えてみたいと考えています。 • フィラーの除去後について – フィラーを除去した後、同じ話者の会話が続くケースがみられたため、再度会話データのマー ジを実装したいと考えています。
© 2025 Masashi Murakami All Right Reserved. 24 ありがとうございました。