Upgrade to Pro — share decks privately, control downloads, hide ads and more …

CUDAでヒストグラム計算を書いてcupyにmergeしてもらった

 CUDAでヒストグラム計算を書いてcupyにmergeしてもらった

Ishita Takeshi

May 24, 2018
Tweet

More Decks by Ishita Takeshi

Other Decks in Programming

Transcript

  1. 石田 岳志 (@sonicair) 東京高専 専攻科 2年 (B4) • qiita.com/IshitaTakeshi •

    日経ソフトウエア 2017年8月号 • 特許6306770 日経ソフトウエア 2017年8月号 日経BP社
  2. 動機:PCANetの実装 • フィルタの重みをPCAで計算できるCNN • (論文によると) PCAなので学習が速い Chan, Tsung-Han, et al.

    "PCANet: A simple deep learning baseline for image classification?." IEEE Transactions on Image Processing 24.12 (2015): 5017-5032.
  3. 戦略: 並列化してそれぞれ二分探索 0 1 2 3 4 5 6 -0.5

    0.5 1.5 2.5 3.5 4.5 5.5 3 = (0 + 6) / 2 bins[3] = 2.5
  4. 戦略: 並列化してそれぞれ二分探索 3 = (0 + 6) / 2 bins[3]

    = 2.5 >= 2 0 1 2 3 4 5 6 -0.5 0.5 1.5 2.5 3.5 4.5 5.5
  5. 戦略: 並列化してそれぞれ二分探索 1 = (0 + 3) / 2 bins[1]

    = 0.5 0 1 2 3 4 5 6 -0.5 0.5 1.5 2.5 3.5 4.5 5.5
  6. 戦略: 並列化してそれぞれ二分探索 1 = (0 + 3) / 2 bins[1]

    = 0.5 <= 2 0 1 2 3 4 5 6 -0.5 0.5 1.5 2.5 3.5 4.5 5.5
  7. 戦略: 並列化してそれぞれ二分探索 2 = (1 + 3) / 2 bins[2]

    = 1.5 0 1 2 3 4 5 6 -0.5 0.5 1.5 2.5 3.5 4.5 5.5
  8. 戦略: 並列化してそれぞれ二分探索 2 = (1 + 3) / 2 bins[2]

    = 1.5 <= 2 0 1 2 3 4 5 6 -0.5 0.5 1.5 2.5 3.5 4.5 5.5
  9. 評価 GPU TITAN X (Pascal) CPU Intel Core i7-6700 Binの数,サンプル数

    を 24~216 の範囲で 変化させて実行時間を調査