Upgrade to Pro — share decks privately, control downloads, hide ads and more …

リーガルテックにおける検索・推薦技術

LegalOn Technologies, Inc
September 18, 2024
200

 リーガルテックにおける検索・推薦技術

LegalOn Technologies, Inc

September 18, 2024
Tweet

More Decks by LegalOn Technologies, Inc

Transcript

  1. 2 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    名前:宮里 俊太郎(みやざと しゅんたろう) • 所属 ◦ 株式会社LegalOn Technologies(2021/04-) (入社時は社名LegalForce) • 職種 ◦ 検索・推薦エンジニア • 経歴 ◦ 2019/03:東京大学 電子情報工学科 卒業 ◦ 2021/04:同大学院 情報理工学系研究科 修了 自己紹介
  2. 6 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. Purpose:法とテクノロジーの力で、安心して前進できる社会を創る。

    設立:2017年4月21日 所在地:東京都渋谷区桜ヶ丘町1-1渋谷サクラステージSHIBUYAタワー19F 代表:代表取締役 執行役員・CEO/弁護士 角田 望 従業員数:552名(役員含)(2024年9月時点) 事業内容:法務に関するソフトウェアの開発・提供 会社紹介:株式会社LegalOn Technologies
  3. 7 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    自然言語処理・ソフトウェアの力で、あらゆる法務業務を サポート(所謂リーガルテック) • 法務とは:法的観点で企業のリスクを防ぎ、事業を円滑に 進めることを支援する仕事(弊社の記事参照) ◦ 契約書にリスクがないかレビュー ◦ 法律や過去の契約書を分析し、会社の権利・義務・ 可能なこと・禁止されたことを把握 ◦ etc. 事業内容(噛み砕いて言うと)
  4. 11 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    共通部分が多い ◦ データの集合からユーザが欲しいものだけを取得・ランキング ◦ Elasticsearch等の検索エンジンが良く使われる • 異なる部分 ◦ 検索:ユーザが明確な意図を持ち能動的にクエリを入力する ◦ 推薦:ユーザが好みそうなデータをサービスが予測する。ユーザ は受動的に受け取る 補足:そもそも、なぜ検索・推薦をひとまとめで扱っているのか
  5. 13 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  6. 15 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    全ては紹介できないが、大部分はこのように整理可能 ◦ 検索機能 ◦ 推薦機能(以下は一種の社内用語なので後で説明) ▪ 類似しているものの推薦 ▪ 関連しているものの推薦 ▪ 参考になるものの推薦 機能の全体像
  7. 16 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    ファイル(社内用語) ◦ ユーザーの契約書 ◦ LegalOn Technologiesの提供する契約書雛形 ◦ その他ファイル(ユーザのメモなど) • 契約書の構成要素である条文(契約書を分割して取得) • 案件(法務外とのメールやコメントのやり取り) • 参考情報(法令集、法律解説記事など) 前提:サービス内部に保管されているデータの全体像
  8. 19 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    APIとしての実装・運用を含む ◦ 要件の合意 ◦ 仕様の合意 ◦ データ構造やアルゴリズムの決定 ◦ 実装、テスト ◦ 基盤となる検索エンジンの運用 • 一般的な検索推薦技術を具体的な機能に落とし込む難しさに ついても、この発表で少し説明 補足:実際に社内の検索・推薦エンジニアが担当する範囲
  9. 20 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  10. 23 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    前述した通り、保存されているデータの種類が膨大で、1つ1つの データ構造が複雑 ◦ ファイル ▪ ユーザーの契約書 ▪ LegalOn Technologiesの提供する契約書雛形 ▪ その他ファイル(ユーザのメモなど) ◦ 契約書の構成要素である条文(契約書を分割して取得) ◦ 案件(法務外とのメールやコメントのやり取り) ◦ 参考情報(法令集、法律解説記事など) 検索機能の要件の難しさ
  11. 24 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    条文検索でナイーブに検索すると、上位の結果がほぼ同じ文面になる (契約書のテキストの分布の特徴として、似た文面を含みやすい) • これを解決することを検索多様化という(上位は意味的に多様にする) 検索機能の要件の難しさ 例:主語だけが違う条文たち
  12. 25 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    契約書締結の経緯によっては、レビューがあってもリスクが残る • 複雑な構文の検索が出来ると、締結済みの契約書のリスクの把握も 可能 ◦ 例:上限規定がない損害賠償条項がある契約書一覧を知りたい ▪ 損害賠償条項とは? • 契約違反したら賠償金を求められる ▪ 上限規定がないとは? • 賠償金の上限が未定義 ← リスク 検索機能の発展的な応用例:データ整理としての検索
  13. 27 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  14. 29 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  15. 31 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    現状、契約書と案件(法務外とのメールやコメントの やり取り)それぞれに類似推薦機能がある • 現在閲覧しているものの類似文書が過去にシステムに 保存されている時、それを推薦することで定型的業務 を効率化 • 法務に詳しくない人にとっても割と直感的な機能 推薦機能(1. 類似しているものの推薦)
  16. 34 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    一番簡単な言語的類似度は検索エンジンで取れるかも しれない、だがユーザーが求める「契約書の類似度」 は本当にそれと同じか? ◦ 「〜を行う」と「〜を行わない」は似ているのか 類似推薦機能の要件の難しさ
  17. 35 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  18. 37 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    法務ドメインの話を濃く含む • 前提:管理対象の契約は複数の契約書から成り立つ (プログラムの本体とパッチのような関連性を持つ) 推薦機能(2. 関連しているものの推薦):課題の前提 基本契約書 個別契約 原契約書 覚書 契約書 併 せて 締 結 した 秘密保持契約書など
  19. 38 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    「基本契約書」と「個別契約書」などは、同じ契約に 属するがバラバラにシステムにアップロードされる • ユーザーが正しく契約を理解するためには、関連する 契約書を紐付ける必要がある(本体の契約書の内容は 修正済みで古くなっているかもしれない) 推薦機能(2. 関連しているものの推薦):課題
  20. 39 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    「関連」している契約書同士は以下の特徴がある ◦ 「親:業務委託契約、子:覚書」など、親子関係 から成り立つ木構造である ◦ 子の内部に親に対する言及が存在する • 解決アプローチ:言及部分を抽出し、対象の契約書を 探すアルゴリズム(検索に近いことを行う) 推薦機能(2. 関連しているものの推薦):解決法
  21. 41 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. 1.

    各種紹介(会社・製品)、本題への導入 2. 検索・推薦技術の使われ方 2.1. 全体像 2.2. 検索 2.3. 推薦 2.3.1. 類似しているものの推薦 2.3.2. 関連しているものの推薦 2.3.3. 参考になるものの推薦 3. 興味をもった人へのお勧め(採用宣伝含む) 目次
  22. 44 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    入力 ◦ 案件:社内からの相談 • 出力 ◦ 参考情報:法律・ガイドラインなど、法務が行う 対応の根拠になる資料 • 完全に別種のテキストなので言語的類似はない • 直接的な言及も存在しない 推薦機能(3. 参考になるものの推薦):課題の困難な所
  23. 48 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    会社の技術ブログ • 検索技術勉強会(弊社社員が運営に関わっている) • 様々な名著(一部は社内勉強会で使われた) ◦ 「情報検索 :検索エンジンの実装と評価」 ◦ 「Query Understanding for Search Engines」 ◦ 「情報アクセス評価方法論」 ◦ 「検索システム ― 実務者のための開発改善ガイド ブック」 技術に興味がある人へ
  24. 49 本資料は貴社の便宜のためのみに提供されるものであり、複写、引用または第三者の閲覧に共される際は株式会社LegalOn Technologiesの了承を得てください。また、当該資料の利用により直接または間接に生じた損害や損失等について、株式会社LegalOn Technologiesは一切の責任を負いません。©LegalOn Technologies, Inc. all rights reserved. •

    検索・推薦関連のポジション ◦ ソフトウェアエンジニア ◦ シニアソフトウェアエンジニア ◦ ソフトウェアエンジニアリングマネージャー • 会社紹介スライド達 • 採用サイトトップ • (法務に詳しい事を前提としていません。詳しくなりたい人 用の教育体制も整備してあります!) We are hiring!