Upgrade to Pro — share decks privately, control downloads, hide ads and more …

製品開発と研究開発の協働 〜AI契約書レビューシステムLegalForceを作る組織設計論〜(後半)

製品開発と研究開発の協働 〜AI契約書レビューシステムLegalForceを作る組織設計論〜(後半)

Developer eXperience Day 2021にて、LegalForceにおける組織設計論をCTO時武とCRO舟木から発表したセッションの資料です。
こちらはCRO舟木から発表した後半部分の資料となります。

More Decks by LegalOn Technologies, Inc

Other Decks in Technology

Transcript

  1. ⾈⽊ 類佳 株式会社LegalForce 執行役員 兼 最高研究開発責任者(CRO: Chief R&D Officer) 経歴:

    元 東京大学情報理工学系研究科 中山英樹研究室(修士) 元 株式会社リクルート 出身:広島県→島根県 技術:Web開発、スマートフォン開発、ゲーム開発、 クラウドインフラ、自然言語処理、画像認識、機械学習等 趣味:ピアノ、ドラム、作曲 !SVLB@GVOBLJ
  2. 10

  3. 11 研究開発の4要素 アノテーション データエンジニアリング データプロダクト開発 研究 ・レビュー ・抽出 ・検索 ・校閲

    ・構造化 などのAPI開発 アノテーションシステムの開発 アノテーション作業の支援 ・データ基盤 ・BIツール ・機械学習基盤 ・データパイプライン構築 ・データ活用の推進 機械学習 中長期の研究投資 論文執筆
  4. 12

  5. 13

  6. 16 検索 テキスト構造化 テキスト分類 レビュー データ変換 条文検索 文書構造解析 文書分類 検査

    PDF変換 Word変換 条ラベリング 文分割 類似文書推薦 差分比較 OCR 言語認識 文書検索 情報抽出 権利義務抽出 LegalForce R&D Zoo(1/2) 条アラインメント 情報抽出 表情報抽出 比較 改行位置予測 編集支援 校閲 ライティング支援 ファイルクローラー クローラー
  7. 17 LegalForce R&D Zoo(2/2) データ基盤 契約書アノテーション基盤 評価基盤 データ基盤 データパイプライン アプリケーション基盤

    機械学習基盤 機械学習基盤 アプリケーション基盤 検索基盤 アノテーション基盤 可視化 汎用アノテーション基盤 検索基盤 契約書匿名化 契約書匿名化 オントロジー オントロジー データカタログ
  8. 23 研究開発はどこまで担う? フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの
  9. 26 研究開発はどこまで担う? フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの どのように選択するか?
  10. 37 研究開発はどこまで担う? フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ①データプロダクト開発パターン ②AIプロダクト開発限定パターン ③MLプロダクト開発限定パターン ④プロトタイピング限定パターン ⑤リサーチ専念パターン ⑥派遣パターン ⑦コンサルパターン ⑥ ⑦ 検索等 開発寄りなもの
  11. 38 研究開発はどこまで担う?〜①データプロダクト開発パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI A: APIまで責任を持つことで 導入されやすい B: AIの技術マネジメントはしやすい C: 機械学習だけには専念できない D: コミュニケーション面は一部犠牲になる E: 精度改善はまとめて行いやすい ⑥ ⑦ 検索等 開発寄りなもの ◦ △ ☓ 色の意味
  12. 39 研究開発はどこまで担う?〜②AIプロダクト開発パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ A: APIまで責任を持つことで 導入されやすい B: AIの技術マネジメントはしやすいが検 索等が外れる C: 機械学習だけには専念できない D: コミュニケーション面は一部犠牲になる E: 検索等が精度改善の対象から外れる 検索等 開発寄りなもの ◦ △ ☓ 色の意味
  13. 40 研究開発はどこまで担う?〜③MLプロダクト開発限定パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ A: APIまで責任を持つことで 導入されやすい B: MLの技術マネジメントはしやすいがAI 全体でのサポートが難しい C: 機械学習にある程度は専念できる D: コミュニケーション面は一部犠牲になる E: MLに依存しないものが精度改善の対 象から外れる 検索等 開発寄りなもの ◦ △ ☓ 色の意味
  14. 41 研究開発はどこまで担う?〜④プロトタイピング限定パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの A: 導入されにくい(引き継ぎが必要) B: AI全体でのサポートが難しい C: 機械学習に専念できる D: コミュニケーション面は一部犠牲になる E: 一箇所に固まっているため精度改善は まとめてできる ◦ △ ☓ 色の意味
  15. 42 研究開発はどこまで担う?〜⑤リサーチ専念パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの A: 導入されにくい(論文→プロダクトにい かない) B: AI全体でのサポートが難しい C: 機械学習に専念できる D: コミュニケーション面は問題ない E: 一箇所に固まっているため精度改善は まとめてできる ◦ △ ☓ 色の意味
  16. 43 研究開発はどこまで担う?〜⑥派遣パターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの A: 導入はしやすい B: 組織を横断するために指示系統が複 雑化 C: 様々なコンテキスト情報が入ってくる D: コミュニケーション面は問題ない E: 一箇所に固まっているため精度改善は まとめてできる ◦ △ ☓ 色の意味
  17. 44 研究開発はどこまで担う?〜⑦コンサルパターン フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① ② ③④ ⑤ データ領域のAPI群 機械学習を使わないAI ⑥ ⑦ 検索等 開発寄りなもの A: 導入までなかなか至らない B: AI全体でのサポートが難しい C: 機械学習に専念できる人もいる? D: コミュニケーションの隔たりができる E: 一箇所に固まっているため精度改善は まとめてできる ◦ △ ☓ 色の意味
  18. 45 LegalForceでは①データプロダクト開発パターンを選択 フロント エンド バック エンド 機械学習AI 論文 プロトタイピング OSS・ツール

    ① データ領域のAPI群 機械学習を使わないAI A: APIまで責任を持つことで 導入されやすい B: AIの技術マネジメントはしやすい C: 機械学習だけには専念できない D: コミュニケーション面は一部犠牲になる E: 精度改善はまとめて行いやすい 検索等 開発寄りなもの LegalForceでは ①を選択したが一長一短。 会社の状況に応じて 選択するのが良い。 ◦ △ ☓ 色の意味
  19. 51 LegalForceの研究開発部門の これまでの方針 • 立ち上げ(0→1) ⁃ マイクロサービスとして小さく作る ⁃ 初期段階から時間をかけすぎない ⁃

    見える範囲、時間をかけすぎない範囲内で工夫する • 技術選定 ⁃ ある程度の方針を立てる (「基本はRuby」「機械学習などはPython」等) ⁃ 臨機応変に状況に応じた技術選定の自由を認める • 改善(1→100) ⁃ 作り直し・大規模改修は躊躇しない
  20. 53 LegalForceの研究開発部門の これまでの方針 • 立ち上げ(0→1) ⁃ マイクロサービスとして小さく作る ⁃ 初期段階から時間をかけすぎない ⁃

    見える範囲、時間をかけすぎない範囲内で工夫する • 技術選定 ⁃ ある程度の方針を立てる (「基本はRuby」「機械学習などはPython」等) ⁃ 臨機応変に状況に応じた技術選定の自由を認める • 改善(1→100) ⁃ 作り直し・大規模改修は躊躇しない
  21. 57 LegalForceの研究開発部門の これまでの方針 • 立ち上げ(0→1) ⁃ マイクロサービスとして小さく作る ⁃ 初期段階から時間をかけすぎない ⁃

    見える範囲、時間をかけすぎない範囲内で工夫する • 技術選定 ⁃ ある程度の方針を立てる (「基本はRuby」「機械学習などはPython」等) ⁃ 臨機応変に状況に応じた技術選定の自由を認める • 改善(1→100) ⁃ 作り直し・大規模改修は躊躇しない
  22. 59 技術選定の流れの例 開始 機械学習を 利用? DBを 利用? Yes No Ruby

    / Sinatra No Ruby / Rails (Hanami) Yes Python / Flask (Fast API) 低負荷? Yes No Ruby / Lambda
  23. 62 LegalForceの研究開発部門の これまでの方針 • 立ち上げ ⁃ マイクロサービスとして小さく作る ⁃ 初期段階から時間をかけすぎない ⁃

    見える範囲、時間をかけすぎない範囲内で工夫する • 技術選定 ⁃ ある程度の方針を立てる (「基本はRuby」「機械学習などはPython」等) ⁃ 臨機応変に状況に応じた技術選定の自由を認める • 改善 ⁃ 作り直し・大規模改修は躊躇しない
  24. 63 LegalForceの変遷 • たくさんのバージョンが存在する Version1 Version2 Version3 Version4 Version1 Version2

    Version3 Version4 Version1 Version2 Version3 契約書レビュー 契約書構造解析 精度評価システム 2018年5月 NOW(2020年4月) Version 3.1 Version 3.2 Version 3.3 Version 2.1 アノテーション システム Version1 Version2
  25. 64 大規模な作り直し・大規模改修を躊躇なく実施 • 大規模な作り直し・大規模改修を躊躇なく実施 • 作り直しや大規模改修の理由は様々 • 小さく作っているので、作り直しの負荷は少なめ(大変だが・・・) • 負債解消につながったり、トレンドに合わせた技術選定がしやすい

    Version1 Version2 Version3 Version4 契約書レビュー 2018年5月 現在(2020年4月) Version 3.1 Version 3.2 Version 3.3 負荷対策 精度改善 負荷対策 精度改善 安定化 新規開発 作り直し 作り直し 大規模改修 作り直し スケール
  26. 66 まとめ • 研究開発組織(R&D)とは • 研究開発組織(R&D)設計について ⁃ AIのAPIまで開発するスタイル • 研究開発流の不確実性への対処

    ⁃ 立ち上げ(0→1) ⁃ マイクロサービスとして小さく作る ⁃ 初期段階から時間をかけすぎない ⁃ 見える範囲、時間をかけすぎない範囲内で工夫する ⁃ 技術選定 ⁃ ある程度の方針を立てる (「基本はRuby」「機械学習などはPython」等) ⁃ 臨機応変に状況に応じた技術選定の自由を認める ⁃ 改善(1→100) ⁃ 作り直し・大規模改修は躊躇しない
  27. 67 現在エンジニア・マネージャー・ テックリード等を全力採用中!! 是非お気軽にご連絡下さい!! !SVLB@GVOBLJ ↓Twitterフォロー& DMでもお気軽にご連絡下さい エンジニアリングマネージャー プロダクトオーナー Webリードエンジニア

    フロントエンドエンジニア Rubyエンジニア Pythonエンジニア 検索エンジニア データアナリスト データ基盤エンジニア SRE クラウドインフラエンジニア リサーチエンジニア セキュリティエンジニア 募集職種