Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Incentivize Machine Learning with Blockchain an...

Incentivize Machine Learning with Blockchain and Token Economy

Talk at Blockchain EXE #12.

y_matsuwitter

June 14, 2018
Tweet

More Decks by y_matsuwitter

Other Decks in Technology

Transcript

  1. 2 ©Gunosy Inc. 本⽇のアジェンダ 機械学習とその改善サイクル l 収集・前処理・学習・予測 l 機械学習とオンチェーン処理の関わりの難しさ ブロックチェーンの特徴とインセンティブ設計

    l ブロックチェーンの特徴 l 事例:予測市場、Fake news判定Dapps l プロトコル化の世界とサービスレイヤ 機械学習とパブリック・ブロックチェーンの現実的な関わりについての⾃⾝の意⾒ について。
  2. 3 ©Gunosy Inc. ⾃⼰紹介 n Gunosy Inc. – 新規事業開発室 執⾏役員

    CTO n 業務 – 開発全般のマネジメント – 技術に関する横断的な課題対処 – 広告・リコメンドエンジンのアルゴリズ ム開発とアーキテクチャ設計 – 現在は新規事業⽴ち上げも担当 n 経歴 – 在学時に⼆社のベンチャーの⽴ち上げ・ 開発に携わる – 2013年3⽉ 東京⼤学⼯学部卒業 – 2013年1⽉よりGunosyに⼊社 – 2014年6⽉執⾏役員就任、現在に⾄る 松本 勇気 @y_matsuwitter
  3. 5 ©Gunosy Inc. 株式会社 Gunosy 企業理念「情報を世界中の⼈に最適に届ける」 n 2012年11⽉創業 n 2015年4⽉東証マザーズ上場

    n 2017年12⽉東証第⼀部に市場変更 n 従業員数 137名 (2018年2⽉末現在 連結ベース) n 事業内容 – 情報キュレーションサービス、および その他メディアの開発運営 東⼤院⽣3⼈が創業、現在6期⽬。
  4. 7 ©Gunosy Inc. Gunosyチームについて エンジニア集団 機械学習 n ブロックチェーン技術や効率的な仮想通貨マイニングの研究 n 毎月数百人の申込があるブロックチェーンエンジニア限定イ

    ベント「blockchain.tokyo」の開催 n ブロックチェーン技術ブログでの情報発信 n 不動産関連でBlockchain活用のプロジェクト推進 ブロックチェーン n 3人のファウンダーは全員エンジニア n 現在も従業員の約半分がエンジニア n 2012年から機械学習に注目 n 技術的な知見を貯めるだけでなく、 Gunosyを始めとしたプロダクトに成果を反映 n 言語処理学会で論文賞を受賞
  5. 8 ©Gunosy Inc. Gunosyにおける機械学習の活⽤ ⼤規模な機械学習の適⽤からブロックチェーンとの関わりを検討。 n パーソナライズアルゴリズム – 数TB以上のログデータをバッチ処理、 またストリーム処理も組み合わせ⾼い頻

    度で学習 – 推薦はリアルタイムに実施し、秒間数千 リクエストを捌いている n 推定アルゴリズム – Deep Learning等の活⽤で⾼い精度でユ ーザーの属性を推定 創業より⼤量のABテストとデータ活⽤を続けてきた。 第24回言語処理学会での発表の様子
  6. 10 ©Gunosy Inc. 機械学習の具体的な改善サイクル 以降、機械学習の現実的な各処理フローについて考える。 n 機械学習という取り組み – ⼤量のデータを基にして⽬的の関数に対 してより良い解を提⽰する処理系の組み

    ⽴て作業 n 競争優位性ある機械学習のために重要なこと – データ量、学習データの品質、モデルの 探索回数・量、実環境での検証回数 n 実際の機械学習処理 – データを集める・学習に適した形に加⼯ する・学習する・予測する 現実的にはログの収集・前処理・学習・予測という4処理からなる。 仮説 学習 前処理 データ収集 予測 成果
  7. 11 ©Gunosy Inc. データ収集と前処理 ⼤規模なストレージと安定した分散処理基盤が必須 n データ収集 – 課題を実際に適⽤する領域でのログをス トレージに溜める

    – 要件 l 利⽤可能なデータ量 l その信頼性 n 前処理 – 学習モデルで利⽤可能な形式への整形 – 要件 l ⼤規模なデータ同⼠のjoinやfilterの 効率的な処理 学習に利⽤可能なデータ群を準備する段階。 課題領域 ⾏動ログ 画像 属性 など データ収集 Label Features 1 [0,1,1…] 前処理 0 [1,0,1…]
  8. 12 ©Gunosy Inc. 学習と推定 ⽬的に合わせた設計、及び前処理とくらべ⾼度な計算能⼒が求められる。 n 学習 – 前処理済みデータから課題に合わせたモ デルを選定し、利⽤・学習する。

    – 要件 l GPU等を利⽤した並列処理 l 課題に合わせより多くのモデルやパ ラメタを試す環境 n 推定 – 実環境に合わせ学習モデルで予測する。 – 要件 l アーキテクチャ設計 l 場合によってはパフォーマンス確保 整形されたデータから⽬的に沿った学習モデルを⽣成し、利⽤する。 Label Features 1 [0,1,1…] 0 [1,0,1…] 学習 予測 様々なアルゴリズム SVM, LR, NN, CNN, GAN, … 学習済みモデル 実際の⼊⼒値 予測値
  9. 14 ©Gunosy Inc. Blockchainとは何で”ない”か ⾼度で安価な処理基盤ではない 安定した⼤規模ストレージではない 直接の計算資源にはならず 帯域等の課題で⾮効率的 n PoWのマイニングマシンは⾮常に特殊

    な端末 – Rich GPU, poor CPU & Memory n 基本的に全員が同じ計算する必要 n 計算コストはAWSの100万倍 n ストレージ性能が統⼀されていない。 – SSDもあればHDDもあれば。 n 帯域が細い、バラバラ – ⼤規模データ処理に必要な潤沢な 帯域を確保することが不可能 – Dropbox likeなサービスは可能 直接的なML on Blockchainは⾮現実的。*1 Public Blockchainについての特性上不向きなものがある。 *1 もちろん計算資源の貸出やデータマート等のDecentralized化は可能、だが直接的な機械学習ではないので割愛。
  10. 16 ©Gunosy Inc. Public Blockchainの⻑所とは 改ざん耐性 ⾮中央集権性 インセンティブ設計 n PoW等のコンセンサス

    とblockchainの組み合 わせで改ざんが困難 n 書き換えのコストは参 加者の⼤きなチェーン ほど⾼い。 n ノード運⽤者を信⽤す ることなく特定のタス クを実⾏させることが 可能。 – ただしコスト⾼。 n EVM等でその上に様々 な⾮中央集権的プロト コルを実装可能。 n ルール付けにより特定 の⾏動に対して経済的 な動機づけが可能。 n トークンを組み合わせ ることで過去値付けが 難しかった概念に価格 がつくようになる。 今回は特にインセンティブ設計と機械学習の関わりに注⽬したい。 改ざん耐性・⾮中央集権制・インセンティブの3点が⼤きいと考えている。
  11. 17 ©Gunosy Inc. Blockchainにおけるインセンティブ設計 経済的インセンティブで不特定多数の参加者の⾏動を設計できる。 n トークンエコノミー – 独⾃のトークン発⾏・配布・交換ルール n

    インセンティブ設計 – コミュニティに貢献する、ないしは害す る⾏動に対するマイナスの貢献に対して 適切にトークンを配布 – 結果としてDecentralizedなエコシステ ムの維持 n 経済的インセンティブたる為には – 市場取引で価格が安定していること => 需要と供給がある 特定の⾏動に対してインセンティブを⾃動的に付与する。 Blockchain 貢献者 特定の貢献 利用者 システム利用 取引所 売却 購入 Token流通
  12. 18 ©Gunosy Inc. 機械学習とBlockchain、インセンティブ設計 正しい予測に対して経済的インセンティブをオープンに付与可能。 n AIを⼈と同じくサービス圏に対する参加者と 考えてみる。 – インセンティブ

    = サービス貢献に対す る報奨である点に着⽬。 n サービス貢献活動と機械学習 – 貢献内容をDappsとのやり取りで表現で きる = ⾃動化可能 – 精度⾼い学習が⾼い報酬に結びつく。 n ある意味でDecentralizedなKaggleと考える ことができる。 教師データとしてのブロックデータ、精度に対するインセンティブ。 機械学習 ブロック チェーン データ利⽤ より適切な予測 経済的 インセンティブ
  13. 19 ©Gunosy Inc. 分散予測市場と機械学習 機械学習にて⾃律的に精度⾼く投票するほど合理的となる。 n 課題設定 – なんらかの未来事象に対して予測投票を ⾏いその確度指標の参考とする

    n 基本的には予測精度に対してインセンティブ が設定される。 – 精度⾼く予測課題に対して投票すること がインセンティブとなる。 n 例:分散型保険 – 特定の⼈物が債務不履⾏に陥るか否かを 当てた対価としてfeeを獲得。 特定のOff-chain事象の予測に対してインセンティブを付与する。 議題提案者 参加者 (機械学習) Service 予測課題 + 報酬 予測結果 正解者に Reward Oracleにより 解答提供
  14. 20 ©Gunosy Inc. Fake newsでのアイディア 実際の判定データを活⽤し精度⾼い⾃律的な判定エンジンが⽣まれる。 n 課題設定 – Fake

    newsと疑わしいURL群をDeposit 付きで提出し、⼈に判定させる。 n 提⽰したものが実際Fake newsだったケース でインセンティブを付与する。 – ⼈⼿で判定するコストを最⼩化する。 – Deposit => ⼀度に提出可能なURL数を 制限する。 n このモデルは結果として、精度⾼くURL提⽰ する参加者により多くのインセンティブ。 Fake newsの候補発⾒を機械学習的に⾏い、⼈でfinalizeする。 Fact Checker Crawler Service URLのCheck Reward URLの提案 + Deposit Deposit返却 + Reward
  15. 21 ©Gunosy Inc. ファット・プロトコル 今後多くのサービスを⽀える取引はDecentralizedなprotocolへ。 n 価値の取引のDecentralization – 価値取引のデータを持つ主体が透明化・ 公平化される。

    – どのサービスも同じDBを参照し取引を ⾏う。 n 例:Bitcoin – 通貨の送⾦プロトコル – 誰もが同じ⼿段で通貨を取引できる DecentralizedなPFがあり、その周辺に 多くのエコシステムが誕⽣。 n データの独占が不可能な時代。 Bitcoinを代表とする、⾮中央集権的な取引プロトコルの実装。 Public Blockchain サービスB サービスA サービスC ⼀定の⼿続きで同じ価値を取引
  16. 22 ©Gunosy Inc. プロトコル化の世界とサービスレイヤ、機械学習 サービス差別化要因がクローズドなデータではなく、マッチング⼒へ。 n ファット・プロトコル = ⾮中央集権的に共 通のサービス基盤を作り出し、実サービスは

    チェーン上のデータと機能を使い取引。 n 例:モノのシェアリング – モノをBlockchainに登録し、交換・購⼊ といった機能を提供する。 – サービス側はより多くの取引を⽣み出す 中で⼿数料を受け取る。 n データは公開され共通、サービスの差別化の ⼀つは機械学習技術となる。 – 精度⾼いマッチングが要求される。 特定の⾏動に対してインセンティブを⾃動的に付与する。 Public Protocol Recommend Service データ分析 学習 取引手数料報酬 ・サービス ・推薦…etc 取引 ユーザー
  17. 24 ©Gunosy Inc. まとめ 機械学習を構成する要素はデータ収集・前処理・学習・予測 l どの要素も、現状考えうる範囲においてBlockchainと相性が悪 く、On-Chain化は実⽤的でない。 ⾮中央集権的インセンティブ設計 l

    Blockchainでは、サービスに対して正となる⾏動に対してトー クンを通じた⾃動的インセンティブの付与が可能。 インセンティブ設計と機械学習 l 機械学習にてサービスに対して貢献する仕組みを設け、インセ ンティブを付与する。 l 結果、課題に対して精度⾼く判定可能な機械学習モデルがコミ ュニティドリブンで⾃律的に⽣み出される可能性。 インセンティブ設計が機械学習と組み合わさる世界について。