Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
LT資料 - MNTSQの契約書解析を LLMに置き換える話
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
mntsq
July 11, 2024
Technology
1.9k
1
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
LT資料 - MNTSQの契約書解析を LLMに置き換える話
mntsq
July 11, 2024
More Decks by mntsq
See All by mntsq
MNTSQ Legal Expert Deck
mntsq
0
680
_SSoT_MNTSQ-CompanyDeck_公開用_.pdf
mntsq
0
80
CRE Camp #1 エンジニアリングを民主化するCREチームでありたい話
mntsq
2
450
Life at MNTSQ
mntsq
1
44k
MNTSQと生成AI
mntsq
0
1.7k
MNTSQ Engineering Team Deck
mntsq
0
21k
MNTSQ Company Deck
mntsq
6
110k
「すべての合意をフェアにする」ってなんだ
mntsq
0
880
MNTSQ社内勉強会 #1 スタートアップの開発サイクルを調べてみた
mntsq
0
780
Other Decks in Technology
See All in Technology
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
170
GoとSIMDとWasmの今。
askua
3
520
SIer20年! 培ったスキルがスタートアップで輝く時
shucho0103
0
800
2026.06.13_AI時代に事業会社が「SIer出身エンジニア」を求める理由 / Why Businesses Seek Engineers with a System Integrator Background in the AI Era
jumtech
0
960
自律型AIエージェントは何を破壊するのか
kojira
0
130
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.8k
AI フレンドリーなエラー監視を TypeScript で実現する
shinyaigeek
2
280
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
590
AIの性能が向上しても未解決な組織の重大問題は何か?/An Unsolved Organizational Problem in the Age of AI
moriyuya
3
500
Dario Amodi『Policy on the AI Exponential』を理解する
nagatsu
0
210
[モダンアプリ勉強会]今更聞けないGit/GitHub入門
tsukuboshi
0
310
Claude Code の Sandbox 機能を Anthropic Sandbox Runtime(srt) で試そう!/lets-play-anthropic-sandbox-runtime
tomoki10
1
330
Featured
See All Featured
We Have a Design System, Now What?
morganepeng
55
8.2k
SEOcharity - Dark patterns in SEO and UX: How to avoid them and build a more ethical web
sarafernandez
0
200
Designing Powerful Visuals for Engaging Learning
tmiket
1
400
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
22k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
420
Stop Working from a Prison Cell
hatefulcrawdad
274
21k
Agile Leadership in an Agile Organization
kimpetersen
PRO
0
160
Java REST API Framework Comparison - PWX 2021
mraible
34
9.3k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
28
3.5k
HDC tutorial
michielstock
2
700
Producing Creativity
orderedlist
PRO
348
40k
Transcript
©MNTSQ, Ltd. MNTSQの契約書解析を LLMに置き換える話 LT資料
©MNTSQ, Ltd. 2 発表の流れ 自己紹介 & 会社紹介 自己紹介/MNTSQのプロダクト/MNTSQのVision MNTSQの契約書解析をGPT-4oで解く やってみた
いくつかのプロンプトテクニック 小ネタ集 プロダクションにおける課題 いろいろ
©MNTSQ, Ltd. 3 Takumi Hirata • アルゴリズムエンジニア @ MNTSQ株式会社 •
機械学習やその周辺のソフトウェア開発を行っています • 最近はプロダクションにおけるLLM活用を推進しています 自己紹介
©MNTSQ, Ltd. 4 ドラフト 審査交渉 締結 集約 管 理 分
析 MNTSQ CLM MNTSQ 自動ドラフティング MNTSQ 案件管理 MNTSQ Connect MNTSQ 契約管理 MNTSQ データベース • 案件受付・アサイン • 審査状況の「見える化」 • ノウハウの自動提案 • リスクの自動検知 • 審査履歴の自動登録 • 電子契約連携 • 紙データのAI-OCR • 電子契約連携 • リスクマネジメント • 契約台帳の自動作成 • 契約期限など自動アラート • ナレッジマネジメント • NO&Tナレッジの活用 • 法務情報の自動分析 • オペレーションコンサル • 既存データの移行サポート • メール連携 • SharePoint・Box連携 • 自社雛型+NO&T雛型での自動ドラフト • 交渉ポリシー・解説文登録 • 案件に応じた叩き台を自動提案 契約業務を軸にしたtoB SaaS
©MNTSQ, Ltd. 5 契約は取引のプログラム もし「リーダブルコード」を弁護士が読んだら? - MNTSQ Tech Blog より
©MNTSQ, Ltd. 6 すべての合意をフェアにする 誰もが一瞬でフェアな契約を結ぶことができればビジネスはもっと加速する リスクの制御 ビジネスの加速
©MNTSQ, Ltd. 7 ©MNTSQ, Ltd. 7 MNTSQの契約書解析をGPT-4oで解く 十分に発達した科学技術は、魔法と見分けがつかない。 “ クラークの三法則
より
©MNTSQ, Ltd. 8 契約書解析 : 分類・抽出等で契約書を構造化するタスク 秘密保持契約書 MNTSQ株式会社(以下、甲とする)とモンテス太郎(以下、乙とする)はXXX業務(以下、 本件業務とする)を遂行するにあたって、双方が開示する秘密情報の扱いについて次の とおり合意する。
(定義) 第1条 本契約において使用される語句の定義は次の通りとする。 (1)「開示者」とは、本契約の当事者のうち、他方の当事者に本秘密情報を開示する者 をいう。 (2) 「受領者」とは、開示者から本秘密情報を受領する者をいう。 (3) 「本秘密情報」とは、… 2. 前項にかかわらず、次の各号の一に該当する情報は秘密情報に該当しない。 (1) 取得した時に既に公知、公用となっていたもの (2) … (… 第2条 … 本契約の締結を証するため本書2通を作成し、甲乙記名押印の上、各1通を保有する。 2020年1月1日 .. NER(Named Entity Recognition) 文書分類 パッセージ分類 構造解析 照応解析 例えばどのような種類の契約書なの かを分類するなど、契約書全体の性 質をさまざまな角度から検討します タイトルの場所や、署名欄の検出と いった契約書全体の情報から、「こ の箇条書きはどの文の下位に属する のか」といった情報まで様々な分析 を行います。例えば、以下のような 条項の木構造を抽出したりします 契約書では定義された単語を参照し たり、他の条項を参照することが頻 繁に起きます。こういった参照を解 決するようなタスクもあります 人間は各条項をコンセプトとして捉 えています。例えば「反社会的勢力 に関する条項」を探したい、といっ た要望に答えられるように条や項に さまざまなタグを付与したりします 誰がいつ契約を結んだか、どれくら いの期間有効な契約なのかなど、契 約に関する基本的な情報を検出する のに、NERタスクを解くことは欠か せません
©MNTSQ, Ltd. 9 契約書を構造化してJSONに変換 MNTSQの契約書解析をGPT-4oで解く
©MNTSQ, Ltd. 10 プロンプト MNTSQの契約書解析をGPT-4oで解く OCRで抽出した契約書本文 出力のJSONスキーマ (ここが契約書解析の要!) 指示
©MNTSQ, Ltd. 11 ©MNTSQ, Ltd. 11 いくつかのプロンプトテクニック 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 2⃣
自己参照データモデルによる階層ツリー構造の抽出 3⃣ JSONをunpretty-printしてトークン節約
©MNTSQ, Ltd. 12 Pydanticによるデータモデルの定義 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック 契約データ 条項データ
©MNTSQ, Ltd. 13 model_json_schema でJSONスキーマを生成 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 14 model_validate_json でGPT-4oの出力JSONを検査 1⃣ PydanticによるJSONスキーマの生成と出力JSONの検査 いくつかのプロンプトテクニック
©MNTSQ, Ltd. 15 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 自己参照
©MNTSQ, Ltd. 16 2⃣ 自己参照データモデルによる階層ツリー構造の抽出 いくつかのプロンプトテクニック 深さのわからない階層に対して再帰的に抽出 前版にはなかった 子要素たち
©MNTSQ, Ltd. 17 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック unpretty-printとは、読みやすさのための改行や空白を除去すること
©MNTSQ, Ltd. 18 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック JSONのunpretty-printにより約43%のコスト削減 トークン数: 金額: 783
$0.003915 443 $0.002215
©MNTSQ, Ltd. 19 3⃣ JSONをunpretty-printしてトークン節約 いくつかのプロンプトテクニック プロンプトの変更
©MNTSQ, Ltd. 20 ©MNTSQ, Ltd. 20 プロダクションにおける課題 Unfortunately, as anyone
who has worked on shipping real-world software knows, there’s a world of difference between a demo that works in a controlled setting and a product that operates reliably at scale. “ What We’ve Learned From A Year of Building with LLMs より
©MNTSQ, Ltd. 21 コンテキストウィンドウと入力可能なページ数(目安) プロダクションにおける課題 コンテキストウィンドウ 入力可能なページ数 代表的なモデル 8k 16
GPT-4 32k 64 GPT-4 32k 128k 256 GPT-4o 200k 400 Claude 3.5 Sonnet 2,000k 4,000 Gemini 1.5 Pro 最低100ページは 入力したい
©MNTSQ, Ltd. 22 モデル選択 プロダクションにおける課題 GPT-4o Claude 3.5 Sonnet Gemini
1.5 Pro 契約書解析における精度 ◯ ◎ ◯ コンテキストウィンドウ 128k 200k 2,000k トークンの出力速度 ◯ ◯ △ 価格 ◯ ◎ ◎ 日本リージョンでの利用 △ ✕ ◯ 発表者の主観に基づく評価です
©MNTSQ, Ltd. 23 Lost in the Middle プロダクションにおける課題 ChatGPT -
LLMシステム開発大全 より
©MNTSQ, Ltd. 24 まだ世にベスプラが存在しない状況でいろいろ決める必要がある プロダクションにおける課題 • ソースコードとプロンプトの分離、および実験管理 ◦ どのソリューションが適切?(PromptLayer, LangSmith,
etc.) • プロンプトの効果的なレビュー方針 ◦ 何を根拠にApproveする? • 精度改善のアプローチ ◦ MLではデータ増やせばなんとかなったがプロンプトでは...? • その他、MLOpsに基づくプラクティスの適用 Q&Aや懇親会では この辺を議論できると 嬉しいです
None