Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MNTSQ社内勉強会 #4 AI系新規事業でコードを書く前にやると良いかもしれない8つの論点

MNTSQ
April 22, 2022
160

MNTSQ社内勉強会 #4 AI系新規事業でコードを書く前にやると良いかもしれない8つの論点

MNTSQ

April 22, 2022
Tweet

Transcript

  1. 3 染み出すドメインの見極めに有用かもしれない8問 • d. どんなタスクを解くことになりそう? ◦ 世の中的に定義済みのタスクか? • e. そのタスクで既に達成できていることは? 今後できそうなことは?

    • f. Modelは顧客ごとに使いまわせるか? ◦ 単一モデルか顧客固有モデルかで COGSに大きな違いがみられた (a16z) • g. データの入手可能性は? • h. アノテーションコストは? 技術的見極め 事業的見極め • a. 精度100%の時のマックスバリューはどの程度か? • b. 精度付加価値曲線( Accuracy-Value Curve)はどんな形か? ◦ Minimum Viable Accuracyはどの程度か? ◦ 精度モックテスト • c. 海外のテックジャイアントへのブロッカーがあるか? ◦ 投資額の桁が本当に違う ◦ 中長期の分散をめっちゃ変えうる
  2. 4 事業的見極めに有用な精度付加価値曲線 accuracy value 精度100%の ときの マックス バリュー 価値を 感じられる

    最小限の 地点 精度付加価値曲線は どういう形をしているか? 価値を感じられる 最小限の正確さ(MVA)
  3. 10 ① 価値を出せるドメインを見極める MVA低い (技術的 難易度低) MVA高い (技術的 難易度高) Max

    Value 大 Max Valueが 小 死ぬ GAFAと ガチる 産業 特化型 (非技術的障壁) ノンプロダクト
  4. 14 ① 価値を出せるドメインを見極める MVA低い (技術的 難易度低) MVA高い (技術的 難易度高) Max

    Value 大 Max Valueが 小 死ぬ GAFAと ガチる ノンプロダクト MNTSQ (Now) MNTSQ (数年後) MNTSQ (創業時) MNTSQ (NOW) MNTSQ (数年後) TechGiant Blockerが ある領域
  5. 15 ① 価値を出せるドメインを見極める: MNTSQの事例 • d. どんなタスクを解くことになりそう? ◦ 契約書解析 ▪

    綺麗な日本語の解析 ▪ 条項号の構造 ▪ 強いドメイン知識の注入ができそう • e. そのタスクで既に達成できていることは? 今後できそうなことは? ◦ SQuADの事例 (2018) ◦ 大きい言語モデル(BERT, GPT-3等)の応用は色々出てきており 確実にできることの幅は広がりそう ◦ 一方で日本語で巨大なモデルの運用がどこまでいけるか未知数 • f. Modelは顧客ごとに使いまわせるか? ◦ 契約書の会社ごとに違わない => 単一モデル運用が可能 • g. データの入手可能性は? ◦ データは手に入れにくいが、壁を乗り越えれば moatになる ◦ 米国ではEdgar等開示されるのでそこまで日本ほどではない • h. アノテーションコストは? ◦ 弁護士、パラリーガルじゃないと判断がつかないところがありそう ◦ アノテーションコストが高い 技術的見極め 事業的見極め • a. 精度100%の時のマックスバリューはどの程度か? ◦ 法務DDならxxx億円市場 ◦ 「法務」という意味でざくっといえば 2兆円市場 • b. 精度付加価値曲線( Accuracy-Value Curve)はどんな形か? ◦ Minimum Viable Accuracyはそれなりに高そう ◦ ドメイン知識の注入と、タスク特性( Precision重視、Recall重視)を踏ま えた調整をすれば不可能ではなさそう • c. 海外のテックジャイアントへのブロッカーがあるか? ◦ 日本語、日本法の壁