Incentivize Machine Learning with Blockchain and Token Economy

インセンティブ設計と機械学習 @y_matsuwitter 2018.6

2 ©Gunosy Inc. 本⽇のアジェンダ機械学習とその改善サイクル l 収集・前処理・学習・予測 l 機械学習とオンチェーン処理の関わりの難しさブロックチェーンの特徴とインセンティブ設計
l ブロックチェーンの特徴 l 事例：予測市場、Fake news判定Dapps l プロトコル化の世界とサービスレイヤ機械学習とパブリック・ブロックチェーンの現実的な関わりについての⾃⾝の意⾒について。

3 ©Gunosy Inc. ⾃⼰紹介 n Gunosy Inc. – 新規事業開発室執⾏役員
CTO n 業務 – 開発全般のマネジメント – 技術に関する横断的な課題対処 – 広告・リコメンドエンジンのアルゴリズム開発とアーキテクチャ設計 – 現在は新規事業⽴ち上げも担当 n 経歴 – 在学時に⼆社のベンチャーの⽴ち上げ・開発に携わる – 2013年3⽉東京⼤学⼯学部卒業 – 2013年1⽉よりGunosyに⼊社 – 2014年6⽉執⾏役員就任、現在に⾄る松本勇気 @y_matsuwitter

4 ©Gunosy Inc. Gunosyについて

5 ©Gunosy Inc. 株式会社 Gunosy 企業理念「情報を世界中の⼈に最適に届ける」 n 2012年11⽉創業 n 2015年4⽉東証マザーズ上場
n 2017年12⽉東証第⼀部に市場変更 n 従業員数 137名（2018年2⽉末現在連結ベース） n 事業内容 – 情報キュレーションサービス、およびその他メディアの開発運営東⼤院⽣3⼈が創業、現在6期⽬。

6 ©Gunosy Inc. Gunosyについてデータ分析と情報配信技術を強みに、複数のメディアを展開。

7 ©Gunosy Inc. Gunosyチームについてエンジニア集団機械学習 n ブロックチェーン技術や効率的な仮想通貨マイニングの研究 n 毎月数百人の申込があるブロックチェーンエンジニア限定イ
ベント「blockchain.tokyo」の開催 n ブロックチェーン技術ブログでの情報発信 n 不動産関連でBlockchain活用のプロジェクト推進ブロックチェーン n 3人のファウンダーは全員エンジニア n 現在も従業員の約半分がエンジニア n 2012年から機械学習に注目 n 技術的な知見を貯めるだけでなく、 Gunosyを始めとしたプロダクトに成果を反映 n 言語処理学会で論文賞を受賞

8 ©Gunosy Inc. Gunosyにおける機械学習の活⽤⼤規模な機械学習の適⽤からブロックチェーンとの関わりを検討。 n パーソナライズアルゴリズム – 数TB以上のログデータをバッチ処理、またストリーム処理も組み合わせ⾼い頻
度で学習 – 推薦はリアルタイムに実施し、秒間数千リクエストを捌いている n 推定アルゴリズム – Deep Learning等の活⽤で⾼い精度でユーザーの属性を推定創業より⼤量のABテストとデータ活⽤を続けてきた。第２４回言語処理学会での発表の様子

9 ©Gunosy Inc. 機械学習について

10 ©Gunosy Inc. 機械学習の具体的な改善サイクル以降、機械学習の現実的な各処理フローについて考える。 n 機械学習という取り組み – ⼤量のデータを基にして⽬的の関数に対してより良い解を提⽰する処理系の組み
⽴て作業 n 競争優位性ある機械学習のために重要なこと – データ量、学習データの品質、モデルの探索回数・量、実環境での検証回数 n 実際の機械学習処理 – データを集める・学習に適した形に加⼯する・学習する・予測する現実的にはログの収集・前処理・学習・予測という4処理からなる。仮説学習前処理データ収集予測成果

11 ©Gunosy Inc. データ収集と前処理⼤規模なストレージと安定した分散処理基盤が必須 n データ収集 – 課題を実際に適⽤する領域でのログをストレージに溜める
– 要件 l 利⽤可能なデータ量 l その信頼性 n 前処理 – 学習モデルで利⽤可能な形式への整形 – 要件 l ⼤規模なデータ同⼠のjoinやfilterの効率的な処理学習に利⽤可能なデータ群を準備する段階。課題領域⾏動ログ画像属性などデータ収集 Label Features 1 [0,1,1…] 前処理 0 [1,0,1…]

12 ©Gunosy Inc. 学習と推定⽬的に合わせた設計、及び前処理とくらべ⾼度な計算能⼒が求められる。 n 学習 – 前処理済みデータから課題に合わせたモデルを選定し、利⽤・学習する。
– 要件 l GPU等を利⽤した並列処理 l 課題に合わせより多くのモデルやパラメタを試す環境 n 推定 – 実環境に合わせ学習モデルで予測する。 – 要件 l アーキテクチャ設計 l 場合によってはパフォーマンス確保整形されたデータから⽬的に沿った学習モデルを⽣成し、利⽤する。 Label Features 1 [0,1,1…] 0 [1,0,1…] 学習予測様々なアルゴリズム SVM, LR, NN, CNN, GAN, … 学習済みモデル実際の⼊⼒値予測値

13 ©Gunosy Inc. Blockchainと機械学習

14 ©Gunosy Inc. Blockchainとは何で”ない”か⾼度で安価な処理基盤ではない安定した⼤規模ストレージではない直接の計算資源にはならず帯域等の課題で⾮効率的 n PoWのマイニングマシンは⾮常に特殊
な端末 – Rich GPU, poor CPU & Memory n 基本的に全員が同じ計算する必要 n 計算コストはAWSの100万倍 n ストレージ性能が統⼀されていない。 – SSDもあればHDDもあれば。 n 帯域が細い、バラバラ – ⼤規模データ処理に必要な潤沢な帯域を確保することが不可能 – Dropbox likeなサービスは可能直接的なML on Blockchainは⾮現実的。*1 Public Blockchainについての特性上不向きなものがある。 *1 もちろん計算資源の貸出やデータマート等のDecentralized化は可能、だが直接的な機械学習ではないので割愛。

15 ©Gunosy Inc. Ethresea.chで⾒かけた話題 On-chainでの学習は敵対的学習等の脆弱性も考えうる。

16 ©Gunosy Inc. Public Blockchainの⻑所とは改ざん耐性⾮中央集権性インセンティブ設計 n PoW等のコンセンサス
とblockchainの組み合わせで改ざんが困難 n 書き換えのコストは参加者の⼤きなチェーンほど⾼い。 n ノード運⽤者を信⽤することなく特定のタスクを実⾏させることが可能。 – ただしコスト⾼。 n EVM等でその上に様々な⾮中央集権的プロトコルを実装可能。 n ルール付けにより特定の⾏動に対して経済的な動機づけが可能。 n トークンを組み合わせることで過去値付けが難しかった概念に価格がつくようになる。今回は特にインセンティブ設計と機械学習の関わりに注⽬したい。改ざん耐性・⾮中央集権制・インセンティブの3点が⼤きいと考えている。

17 ©Gunosy Inc. Blockchainにおけるインセンティブ設計経済的インセンティブで不特定多数の参加者の⾏動を設計できる。 n トークンエコノミー – 独⾃のトークン発⾏・配布・交換ルール n
インセンティブ設計 – コミュニティに貢献する、ないしは害する⾏動に対するマイナスの貢献に対して適切にトークンを配布 – 結果としてDecentralizedなエコシステムの維持 n 経済的インセンティブたる為には – 市場取引で価格が安定していること => 需要と供給がある特定の⾏動に対してインセンティブを⾃動的に付与する。 Blockchain 貢献者特定の貢献利用者システム利用取引所売却購入 Token流通

18 ©Gunosy Inc. 機械学習とBlockchain、インセンティブ設計正しい予測に対して経済的インセンティブをオープンに付与可能。 n AIを⼈と同じくサービス圏に対する参加者と考えてみる。 – インセンティブ
= サービス貢献に対する報奨である点に着⽬。 n サービス貢献活動と機械学習 – 貢献内容をDappsとのやり取りで表現できる = ⾃動化可能 – 精度⾼い学習が⾼い報酬に結びつく。 n ある意味でDecentralizedなKaggleと考えることができる。教師データとしてのブロックデータ、精度に対するインセンティブ。機械学習ブロックチェーンデータ利⽤より適切な予測経済的インセンティブ

19 ©Gunosy Inc. 分散予測市場と機械学習機械学習にて⾃律的に精度⾼く投票するほど合理的となる。 n 課題設定 – なんらかの未来事象に対して予測投票を⾏いその確度指標の参考とする
n 基本的には予測精度に対してインセンティブが設定される。 – 精度⾼く予測課題に対して投票することがインセンティブとなる。 n 例：分散型保険 – 特定の⼈物が債務不履⾏に陥るか否かを当てた対価としてfeeを獲得。特定のOff-chain事象の予測に対してインセンティブを付与する。議題提案者参加者（機械学習） Service 予測課題 + 報酬予測結果正解者に Reward Oracleにより解答提供

20 ©Gunosy Inc. Fake newsでのアイディア実際の判定データを活⽤し精度⾼い⾃律的な判定エンジンが⽣まれる。 n 課題設定 – Fake
newsと疑わしいURL群をDeposit 付きで提出し、⼈に判定させる。 n 提⽰したものが実際Fake newsだったケースでインセンティブを付与する。 – ⼈⼿で判定するコストを最⼩化する。 – Deposit => ⼀度に提出可能なURL数を制限する。 n このモデルは結果として、精度⾼くURL提⽰する参加者により多くのインセンティブ。 Fake newsの候補発⾒を機械学習的に⾏い、⼈でfinalizeする。 Fact Checker Crawler Service URLのCheck Reward URLの提案 + Deposit Deposit返却 + Reward

21 ©Gunosy Inc. ファット・プロトコル今後多くのサービスを⽀える取引はDecentralizedなprotocolへ。 n 価値の取引のDecentralization – 価値取引のデータを持つ主体が透明化・公平化される。
– どのサービスも同じDBを参照し取引を⾏う。 n 例：Bitcoin – 通貨の送⾦プロトコル – 誰もが同じ⼿段で通貨を取引できる DecentralizedなPFがあり、その周辺に多くのエコシステムが誕⽣。 n データの独占が不可能な時代。 Bitcoinを代表とする、⾮中央集権的な取引プロトコルの実装。 Public Blockchain サービスB サービスA サービスC ⼀定の⼿続きで同じ価値を取引

22 ©Gunosy Inc. プロトコル化の世界とサービスレイヤ、機械学習サービス差別化要因がクローズドなデータではなく、マッチング⼒へ。 n ファット・プロトコル = ⾮中央集権的に共通のサービス基盤を作り出し、実サービスは
チェーン上のデータと機能を使い取引。 n 例：モノのシェアリング – モノをBlockchainに登録し、交換・購⼊といった機能を提供する。 – サービス側はより多くの取引を⽣み出す中で⼿数料を受け取る。 n データは公開され共通、サービスの差別化の⼀つは機械学習技術となる。 – 精度⾼いマッチングが要求される。特定の⾏動に対してインセンティブを⾃動的に付与する。 Public Protocol Recommend Service データ分析学習取引手数料報酬・サービス・推薦…etc 取引ユーザー

24 ©Gunosy Inc. まとめ機械学習を構成する要素はデータ収集・前処理・学習・予測 l どの要素も、現状考えうる範囲においてBlockchainと相性が悪く、On-Chain化は実⽤的でない。⾮中央集権的インセンティブ設計 l
Blockchainでは、サービスに対して正となる⾏動に対してトークンを通じた⾃動的インセンティブの付与が可能。インセンティブ設計と機械学習 l 機械学習にてサービスに対して貢献する仕組みを設け、インセンティブを付与する。 l 結果、課題に対して精度⾼く判定可能な機械学習モデルがコミュニティドリブンで⾃律的に⽣み出される可能性。インセンティブ設計が機械学習と組み合わさる世界について。

Incentivize Machine Learning with Blockchain an...

Incentivize Machine Learning with Blockchain and Token Economy

y_matsuwitter

More Decks by y_matsuwitter

Other Decks in Technology

Featured

Transcript

インセンティブ設計と機械学習 @y_matsuwitter 2018.6

2 ©Gunosy Inc. 本⽇のアジェンダ機械学習とその改善サイクル l 収集・前処理・学習・予測 l 機械学習とオンチェーン処理の関わりの難しさブロックチェーンの特徴とインセンティブ設計

3 ©Gunosy Inc. ⾃⼰紹介 n Gunosy Inc. – 新規事業開発室執⾏役員

4 ©Gunosy Inc. Gunosyについて

5 ©Gunosy Inc. 株式会社 Gunosy 企業理念「情報を世界中の⼈に最適に届ける」 n 2012年11⽉創業 n 2015年4⽉東証マザーズ上場

6 ©Gunosy Inc. Gunosyについてデータ分析と情報配信技術を強みに、複数のメディアを展開。

7 ©Gunosy Inc. Gunosyチームについてエンジニア集団機械学習 n ブロックチェーン技術や効率的な仮想通貨マイニングの研究 n 毎月数百人の申込があるブロックチェーンエンジニア限定イ

8 ©Gunosy Inc. Gunosyにおける機械学習の活⽤⼤規模な機械学習の適⽤からブロックチェーンとの関わりを検討。 n パーソナライズアルゴリズム – 数TB以上のログデータをバッチ処理、またストリーム処理も組み合わせ⾼い頻

9 ©Gunosy Inc. 機械学習について

10 ©Gunosy Inc. 機械学習の具体的な改善サイクル以降、機械学習の現実的な各処理フローについて考える。 n 機械学習という取り組み – ⼤量のデータを基にして⽬的の関数に対してより良い解を提⽰する処理系の組み

11 ©Gunosy Inc. データ収集と前処理⼤規模なストレージと安定した分散処理基盤が必須 n データ収集 – 課題を実際に適⽤する領域でのログをストレージに溜める

12 ©Gunosy Inc. 学習と推定⽬的に合わせた設計、及び前処理とくらべ⾼度な計算能⼒が求められる。 n 学習 – 前処理済みデータから課題に合わせたモデルを選定し、利⽤・学習する。

13 ©Gunosy Inc. Blockchainと機械学習

14 ©Gunosy Inc. Blockchainとは何で”ない”か⾼度で安価な処理基盤ではない安定した⼤規模ストレージではない直接の計算資源にはならず帯域等の課題で⾮効率的 n PoWのマイニングマシンは⾮常に特殊

15 ©Gunosy Inc. Ethresea.chで⾒かけた話題 On-chainでの学習は敵対的学習等の脆弱性も考えうる。

16 ©Gunosy Inc. Public Blockchainの⻑所とは改ざん耐性⾮中央集権性インセンティブ設計 n PoW等のコンセンサス

17 ©Gunosy Inc. Blockchainにおけるインセンティブ設計経済的インセンティブで不特定多数の参加者の⾏動を設計できる。 n トークンエコノミー – 独⾃のトークン発⾏・配布・交換ルール n

18 ©Gunosy Inc. 機械学習とBlockchain、インセンティブ設計正しい予測に対して経済的インセンティブをオープンに付与可能。 n AIを⼈と同じくサービス圏に対する参加者と考えてみる。 – インセンティブ

19 ©Gunosy Inc. 分散予測市場と機械学習機械学習にて⾃律的に精度⾼く投票するほど合理的となる。 n 課題設定 – なんらかの未来事象に対して予測投票を⾏いその確度指標の参考とする

20 ©Gunosy Inc. Fake newsでのアイディア実際の判定データを活⽤し精度⾼い⾃律的な判定エンジンが⽣まれる。 n 課題設定 – Fake

21 ©Gunosy Inc. ファット・プロトコル今後多くのサービスを⽀える取引はDecentralizedなprotocolへ。 n 価値の取引のDecentralization – 価値取引のデータを持つ主体が透明化・公平化される。

22 ©Gunosy Inc. プロトコル化の世界とサービスレイヤ、機械学習サービス差別化要因がクローズドなデータではなく、マッチング⼒へ。 n ファット・プロトコル = ⾮中央集権的に共通のサービス基盤を作り出し、実サービスは

23 ©Gunosy Inc. まとめ

24 ©Gunosy Inc. まとめ機械学習を構成する要素はデータ収集・前処理・学習・予測 l どの要素も、現状考えうる範囲においてBlockchainと相性が悪く、On-Chain化は実⽤的でない。⾮中央集権的インセンティブ設計 l