【登壇資料】AI×プロダクト開発の最前線_2025/09/16

Slide 1

Slide 1 text

- 1 - © Legalscape, Inc. #AI×プロダクト開発の最前線 #Legalscape Kaggle Grandmasterと創る、リーガルAIモデル開発の最前線富⽥晃弘(Akihiro TOMITA) Legalscape, Inc. 2025.09.16 AI×プロダクト開発の最前線〜AIにフルベットする4社の挑戦と現在地〜

Slide 2

Slide 2 text

- 2 - © Legalscape, Inc. #プロヒス2024　#Legalscape 富田晃弘(Akihiro Tomita) Legalscape, Inc. 趣味は絵を描くこと、家庭菜園、温泉めぐり ➢ 東京大学法学部→日本銀行経済調査課→ミシガン大学MBA→ 日本銀行政策企画課→PKSHA Technology→Legalscape ➢ Kaggle Grandmaster（純文系） ➢ リーガルAIの設計・実装登壇者紹介

Slide 3

Slide 3 text

- 3 - © Legalscape, Inc. #プロヒス2024　#Legalscape ◎ 株式会社Legalscape ◎ リーガルスケープ × LegalScape × リーガルスペース × リーガルスコープ × リーガルフォース ← 他社さんの製品はじめまして、リーガルスケープです

Slide 4

Slide 4 text

©Legalscape,Inc. 圧倒的な量の信頼できるコンテンツ AI等の機能による直感的な検索‧閲覧体験書籍収録数 Legalscapeとは？独⾃開発搭載法律特化AI データベース拡張判例連携 4,100冊 4

Slide 5

Slide 5 text

©Legalscape,Inc. 5 導⼊社数は1,300社以上。業界‧業種問わずご利⽤中法律事務所のお客様（⼀部）企業のお客様（⼀部）

Slide 6

Slide 6 text

Legalscape（リーガルスケープ）による実務の変化これまでのリサーチこれからのリサーチ⾃動で要約のドラフトを⼊⼿⾃動で引⽤⽂献の該当箇所を列挙⾃動で関連⽂献をリンク‧逆引きで深堀リサーチ結果をまとめる⽂献を読み込んで、記載箇所を特定する関連する⽂献を特定して、⼿元に集める最初に要約のドラフトを得た上で、引⽤⽂献で裏どりするトップダウンなリサーチへ。 6

Slide 7

Slide 7 text

©Legalscape,Inc. リーガルリサーチAI"Watson & Holmes"（ワトソン＆ホームズ） ↑ ② AIが信頼できる法情報に基づき回答 ↑ (書籍‧法令‧判例※‧ガイドライン等) 7 ① AIに質問↓

Slide 8

Slide 8 text

- 8 - © Legalscape, Inc. #プロヒス2024　#Legalscape 要するにRAGをやってます Watson 書籍DB ユーザー Holmes 埋め込みモデル前処理 LLM 後処理クエリスニペット検索結果プロンプト生成結果質問文 UI

Slide 9

Slide 9 text

©Legalscape, Inc. そもそも... AIをどうプロダクトに価値ある形で組み込むか？

Slide 10

Slide 10 text

©Legalscape, Inc. これは... 1. 実現したいことを考える ↓ 2. AIで動くものを作る ↓ 3. 動いたら喜ぶ

Slide 11

Slide 11 text

©Legalscape, Inc. プロトタイプとしては良くても、プロダクトとしてはこんな疑問が 1. 実現したいことを考える ↓ 2. AIで動くものを作る ↓ 3. 動いたら喜ぶ AIは確率的に挙動するけど、何を持って「動いた」というの？ AIはデータを「学習」して精度が上がることが強みなのに、どうフィードバックをかけるの？

Slide 12

Slide 12 text

©Legalscape, Inc. （おそらく皆さん）こうしたいと思うはず 1. 実現したいことを定式化する ↓ 2. 定式化に基づいて定量評価できるデータセットを構築する ↓ 3. 評価が良くなるようにモデルを構築・改善する ↓ 4. 十分良いモデルができたらデプロイする ↓ 5. ログやユーザー FBからデータセットを拡充し、 2.へ戻るループ

Slide 13

Slide 13 text

©Legalscape, Inc. 1. 実現したいことを定式化する ↓ 2. 定式化に基づいて定量評価できるデータセットを構築する ↓ 3. 評価が良くなるようにモデルを構築・改善する ↓ 4. 十分良いモデルができたらデプロイする ↓ 5. ログやユーザー FBからデータセットを拡充し、 2.へ戻るループ今日はここの概要を話します（おそらく皆さん）こうしたいと思うはず

Slide 14

Slide 14 text

©Legalscape, Inc. RAGの要素である検索を題材に考える 1. 実現したいことを定式化する実現したいこと：「膨大な法情報から、ユーザーの求める文献を素早く見つける」定式化（数式やルールとして明確に表現する） - ユーザークエリqに対して（入力） - 最も関連するdocをk個を（出力） - N万件の文献集合から（データベース） - 精度指標αが最高となる形で（精度） - X秒以内に（速度） - Y円以下で（コスト） - 検索する（タスク）

Slide 15

Slide 15 text

©Legalscape, Inc. If you cannot measure it, you cannot improve it. 2. 定量評価できるデータセットを構築する LLM-as-a-judge データセットを（高すぎて遅すぎる） FrontierLLMにアノテーションさせる（※ライセンス要確認）例：クエリに対する正解・不正解ドキュメントを判定させる Expert-in-the-loop ドメインの専門家（弁護士）によるドメイン知識を活かしたアノテーション例：この質問には必ずこの最高裁の判例を参照するべきなので、正解データに加える query: “労働者の定義に関する判例を教えて” true_doc_id: [111,222,333,444] query: “労働者の定義に関する判例を教えて” true_doc_id: [111,222,333,444] query: “労働者の定義に関する判例を教えて” true_doc_id: [111,222,333,444] query: “労働者の定義に関する判例を教えて” true_doc_id: [111,222,333,444]

Slide 16

Slide 16 text

©Legalscape, Inc. ここまで来たら、実質 Kaggle 3. 評価が良くなるようにモデルを構築・改善する精度リソース（速度/コスト等）プロダクトととして満たすべき一線ビジネス上、許容できる一線使い物にならないプロダクトとして価値ある状態使い続けられないこのどちらかを目指す

Slide 17

Slide 17 text

©Legalscape, Inc. （例）ベクトルエンべディングモデルのドメイン適応のケース ● オープンなベクトルエンべディングモデルでは日本語の法律ドメインにおいて、プロダクションで求める検索精度を発揮できないケースがある ● 法律ドメインに特化させるためにエンべディングモデルのファインチューニングを実施 ○ 某コンペで悪戦苦闘した SentenceTransformerの知見を活用 ● 法律に特化した弊社の検証データセットで、精度向上を確認した事例 Recall@k

Slide 18

Slide 18 text

©Legalscape, Inc. まとめ動くだけで満足しない AI開発 ● プロダクトにAIを組み込む上で大切なのは、単に「動いた！」で終わらせないこと ● 定式化 → 評価設計 → モデル構築のプロセスを通して、ユーザーに本当に価値あるものを評価設計が実務のカギ ● 「AIをどう正しく評価するか」をどうデザインするかで、プロダクトの成否が決まる ● ここをしっかり設計できれば、あとは Kaggleのように改善を楽しむサイクルに入れる Legalscapeでの挑戦 ● 「膨大な法情報」を扱うという難しい領域で、まだ解かれていない課題に取り組み、リーガル AI という新しい分野を切り拓いています ● 今日紹介したRAGはその一例にすぎません。挑戦すべきテーマはまだまだあります ● AIを動かすで止まらず、価値を生み続けるプロダクトをつくりたいなら、 Legalscapeへ

Slide 19

Slide 19 text

Slide 20

Slide 20 text

Join us! Client-side TypeScript / Server-side TypeScript / NLP / etc. 採⽤情報 legalscape.co.jp