Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT資料 - MNTSQの契約書解析を LLMに置き換える話
Search
mntsq
July 11, 2024
Technology
1.9k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT資料 - MNTSQの契約書解析を LLMに置き換える話
mntsq
July 11, 2024
More Decks by mntsq
See All by mntsq
MNTSQ Legal Expert Deck
mntsq
0
680
_SSoT_MNTSQ-CompanyDeck_公開用_.pdf
mntsq
0
80
CRE Camp #1 エンジニアリングを民主化するCREチームでありたい話
mntsq
2
450
Life at MNTSQ
mntsq
1
44k
MNTSQと生成AI
mntsq
0
1.7k
MNTSQ Engineering Team Deck
mntsq
0
21k
MNTSQ Company Deck
mntsq
6
110k
「すべての合意をフェアにする」ってなんだ
mntsq
0
880
MNTSQ社内勉強会 #1 スタートアップの開発サイクルを調べてみた
mntsq
0
780
Other Decks in Technology
See All in Technology
Databricks における 生成AIガバナンスの実践
taka_aki
1
360
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
230
Socrates × Looker 〜セマンティックレイヤーで進化するデータ分析エージェント〜
hanon52_
3
1.6k
Reliability in the Age of AI: Engineering for AI Velocity
rrreeeyyy
0
110
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
310
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
270
【Gen-AX】20260530開催_JJUG CCC 2026 Spring
genax
1
450
Kubernetesにおける学習基盤とLLMOpsの概要
ry
1
120
noUncheckedIndexedAccess、3時間、1万円。 / noUncheckedIndexedAccess, 3 Hours, 10,000 JPY.
kaonavi
1
340
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
230
「速く作る」から「正しく作る」へ ─ 生成AI時代の開発フロー改革の ロードマップと実行 ─
starfish719
0
9.3k
NAB Show 2026 動画技術関連レポート / NAB Show 2026 Report
cyberagentdevelopers
PRO
0
130
Featured
See All Featured
Typedesign – Prime Four
hannesfritz
42
3.1k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.2k
The Spectacular Lies of Maps
axbom
PRO
1
790
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
1.6k
A designer walks into a library…
pauljervisheath
211
24k
A better future with KSS
kneath
240
18k
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
The #1 spot is gone: here's how to win anyway
tamaranovitovic
2
1.1k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
570
Code Review Best Practice
trishagee
74
20k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
Transcript
©MNTSQ, Ltd. MNTSQの契約書解析を LLMに置き換える話 LT資料
©MNTSQ, Ltd. 2 発表の流れ 自己紹介 & 会社紹介 自己紹介/MNTSQのプロダクト/MNTSQのVision MNTSQの契約書解析をGPT-4oで解く やってみた
いくつかのプロンプトテクニック 小ネタ集 プロダクションにおける課題 いろいろ
©MNTSQ, Ltd. 3 Takumi Hirata • アルゴリズムエンジニア @ MNTSQ株式会社 •
機械学習やその周辺のソフトウェア開発を行っています • 最近はプロダクションにおけるLLM活用を推進しています 自己紹介
©MNTSQ, Ltd. 4 ドラフト 審査交渉 締結 集約 管 理 分
析 MNTSQ CLM MNTSQ 自動ドラフティング MNTSQ 案件管理 MNTSQ Connect MNTSQ 契約管理 MNTSQ データベース • 案件受付・アサイン • 審査状況の「見える化」 • ノウハウの自動提案 • リスクの自動検知 • 審査履歴の自動登録 • 電子契約連携 • 紙データのAI-OCR • 電子契約連携 • リスクマネジメント • 契約台帳の自動作成 • 契約期限など自動アラート • ナレッジマネジメント • NO&Tナレッジの活用 • 法務情報の自動分析 • オペレーションコンサル • 既存データの移行サポート • メール連携 • SharePoint・Box連携 • 自社雛型+NO&T雛型での自動ドラフト • 交渉ポリシー・解説文登録 • 案件に応じた叩き台を自動提案 契約業務を軸にしたtoB SaaS
©MNTSQ, Ltd. 5 契約は取引のプログラム もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Tech Blog より
©MNTSQ, Ltd. 6 すべての合意をフェアにする 誰もが一瞬でフェアな契約を結ぶことができればビジネスはもっと加速する リスクの制御 ビジネスの加速
©MNTSQ, Ltd. 7 ©MNTSQ, Ltd. 7 MNTSQの契約書解析をGPT-4oで解く 十分に発達した科学技術は、魔法と見分けがつかない。 “ クラークの三法則
より
©MNTSQ, Ltd. 8 契約書解析 : 分類・抽出等で契約書を構造化するタスク 秘密保持契約書 MNTSQ株式会社(以下、甲とする)とモンテス太郎(以下、乙とする)はXXX業務(以下、 本件業務とする)を遂行するにあたって、双方が開示する秘密情報の扱いについて次の とおり合意する。
(定義) 第1条 本契約において使用される語句の定義は次の通りとする。 (1)「開示者」とは、本契約の当事者のうち、他方の当事者に本秘密情報を開示する者 をいう。 (2) 「受領者」とは、開示者から本秘密情報を受領する者をいう。 (3) 「本秘密情報」とは、… 2. 前項にかかわらず、次の各号の一に該当する情報は秘密情報に該当しない。 (1) 取得した時に既に公知、公用となっていたもの (2) … (… 第2条 … 本契約の締結を証するため本書2通を作成し、甲乙記名押印の上、各1通を保有する。 2020年1月1日 .. NER(Named Entity Recognition) 文書分類 パッセージ分類 構造解析 照応解析 例えばどのような種類の契約書なの かを分類するなど、契約書全体の性 質をさまざまな角度から検討します タイトルの場所や、署名欄の検出と いった契約書全体の情報から、「こ の箇条書きはどの文の下位に属する のか」といった情報まで様々な分析 を行います。例えば、以下のような 条項の木構造を抽出したりします 契約書では定義された単語を参照し たり、他の条項を参照することが頻 繁に起きます。こういった参照を解 決するようなタスクもあります 人間は各条項をコンセプトとして捉 えています。例えば「反社会的勢力 に関する条項」を探したい、といっ た要望に答えられるように条や項に さまざまなタグを付与したりします 誰がいつ契約を結んだか、どれくら いの期間有効な契約なのかなど、契 約に関する基本的な情報を検出する のに、NERタスクを解くことは欠か せません
©MNTSQ, Ltd. 9 契約書を構造化してJSONに変換 MNTSQの契約書解析をGPT-4oで解く
©MNTSQ, Ltd. 10 プロンプト MNTSQの契約書解析をGPT-4oで解く OCRで抽出した契約書本文 出力のJSONスキーマ (ここが契約書解析の要!) 指示
©MNTSQ, Ltd. 11 ©MNTSQ, Ltd. 11 いくつかのプロンプトテクニック 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 2⃣
自己参照データモデルによる階層ツリー構造の抽出 3⃣ JSONをunpretty-printしてトークン節約
©MNTSQ, Ltd. 12 Pydanticによるデータモデルの定義 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック 契約データ 条項データ
©MNTSQ, Ltd. 13 model_json_schema でJSONスキーマを生成 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 14 model_validate_json でGPT-4oの出力JSONを検査 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 15 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 自己参照
©MNTSQ, Ltd. 16 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 前版にはなかった 子要素たち
©MNTSQ, Ltd. 17 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック unpretty-printとは、読みやすさのための改行や空白を除去すること
©MNTSQ, Ltd. 18 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック JSONのunpretty-printにより約43%のコスト削減 トークン数: 金額: 783
$0.003915 443 $0.002215
©MNTSQ, Ltd. 19 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック プロンプトの変更
©MNTSQ, Ltd. 20 ©MNTSQ, Ltd. 20 プロダクションにおける課題 Unfortunately, as anyone
who has worked on shipping real-world software knows, there’s a world of difference between a demo that works in a controlled setting and a product that operates reliably at scale. “ What We’ve Learned From A Year of Building with LLMs より
©MNTSQ, Ltd. 21 コンテキストウィンドウと入力可能なページ数(目安) プロダクションにおける課題 コンテキストウィンドウ 入力可能なページ数 代表的なモデル 8k 16
GPT-4 32k 64 GPT-4 32k 128k 256 GPT-4o 200k 400 Claude 3.5 Sonnet 2,000k 4,000 Gemini 1.5 Pro 最低100ページは 入力したい
©MNTSQ, Ltd. 22 モデル選択 プロダクションにおける課題 GPT-4o Claude 3.5 Sonnet Gemini
1.5 Pro 契約書解析における精度 ◯ ◎ ◯ コンテキストウィンドウ 128k 200k 2,000k トークンの出力速度 ◯ ◯ △ 価格 ◯ ◎ ◎ 日本リージョンでの利用 △ ✕ ◯ 発表者の主観に基づく評価です
©MNTSQ, Ltd. 23 Lost in the Middle プロダクションにおける課題 ChatGPT -
LLMシステム開発大全 より
©MNTSQ, Ltd. 24 まだ世にベスプラが存在しない状況でいろいろ決める必要がある プロダクションにおける課題 • ソースコードとプロンプトの分離、および実験管理 ◦ どのソリューションが適切?(PromptLayer, LangSmith,
etc.) • プロンプトの効果的なレビュー方針 ◦ 何を根拠にApproveする? • 精度改善のアプローチ ◦ MLではデータ増やせばなんとかなったがプロンプトでは...? • その他、MLOpsに基づくプラクティスの適用 Q&Aや懇親会では この辺を議論できると 嬉しいです
None