$30 off During Our Annual Pro Sale. View Details »

ICML2013読み会 "ELLA: An Efficient Lifelong Learning Algorithm"

ICML2013読み会 "ELLA: An Efficient Lifelong Learning Algorithm"

Yuya Unno

July 09, 2013
Tweet

More Decks by Yuya Unno

Other Decks in Research

Transcript

  1. ELLA: An Efficient Lifelong
    Learning Algorithm
    株式会社Preferred Infrastructure
    海野 裕也 (@unnonouno)
    2013/07/09
    ICML2013読み会@東大

    View Slide

  2. ⾃自⼰己紹介
    l  海野  裕也 (@unnonouno)
    l  プリファードインフラストラクチャー
    l  情報検索索、レコメンド
    l  機械学習・データ解析研究開発
    l  Jubatusチームリーダー
    l  分散オンライン機械学習フレームワーク
    l  専⾨門
    l  ⾃自然⾔言語処理理
    l  テキストマイニング
    2

    View Slide

  3. 要旨
    l  Lifelong learningのためにGO-MTLの精度度をほとんど落落
    とさずに、1000倍早くした
    l  ⼿手法の要旨は以下の2点
    l  テーラー展開して元の最適化の式を簡略略化
    l  再計算の必要な項の計算を簡略略化
    3

    View Slide

  4. Lifelong learning
    4

    View Slide

  5. Lifelong learning
    l  タスクが次々やってくる
    l  Z(1), …, Z(Tmax)
    l  学習者はタスクの数も順番も知らない
    l  各Zは教師有りの問題(分類か回帰)
    l  各タスクにはn
    t
    個の教師ありデータが与えられる
    マルチタスクで、タスクが次々やってくるイメージ
    5

    View Slide

  6. Lifelong learningのキモチ(ホントか?)
    l  ずっと学習し続ける
    l  データセットはオンラインでやってくる
    l  過去の学習結果をうまく活かしたい(似たような問題、
    組み合わせの問題が多い)
    例例えば将来的に、ずっと学習し続けるインフラのようなモ
    ノができた時を想定している(のかも)
    6

    View Slide

  7. Grouping and Overlap in Multi-Task Learning
    (GO-MTL) [Kumar&Daume III ’12]
    l  L: 損失関数
    l  w = Ls: モデルパラメータ
    l  L: k個の隠れタスクの重み
    l  s: 各タスクをLの線形和で表現する役割
    l  sは疎にしたいのでL1正則化
    7
    収束の証明のために
    ちょっと変えてある

    View Slide

  8. GO-MTLが遅い
    l  GO-MTL⾃自体はマルチタスクのバッチ学習⼿手法なので
    データが次々やってくるLifelong learningに適⽤用しよう
    とすると遅い
    l  2重ループが明らかに遅そう
    8

    View Slide

  9. ⼯工夫1: 損失関数の部分をテーラー展開
    9
    θ(t)の周りで2次の
    テーラー展開

    View Slide

  10. ⼯工夫2: 全てのtに対するs(t)の最適化を⾏行行うのは⾮非効
    率率率
    10
    s(t)の最適化を
    順次行う

    View Slide

  11. 実際の更更新式
    l  L = A-1b
    l  実際に計算するときは、Aとbは差分更更新できるような⼯工
    夫が⼊入っている
    11

    View Slide

  12. 実験結果
    12
    バッチとほとんど同じ精度度で1000倍以上速い!!

    View Slide

  13. あれ、よく⾒見見ると・・・
    13
    Single Task Leaning (STL) でもそこそこだし、
    当然もっと速い・・・

    View Slide

  14. まとめ
    l  マルチタスクのバッチ学習であるGO-MTLをLifelong
    learningに適⽤用するために、⾮非効率率率な部分を効率率率化した
    l  ほとんど精度度を下げずに、1000倍以上⾼高速化した
    l  タスクを独⽴立立に解いてもそこそこの精度度が出ていて、実
    験設定はもう少し考慮しても良良かったのかも
    14

    View Slide