深層学習技術の今と印刷産業への挑戦 (日本印刷学会秋期セミナー)

タクトピクセル株式会社代表取締役 CEO/CTO 玉城哲平 2019年日本印刷学会秋期セミナー 2019/10/11 深層学習技術の今と印刷産業への挑戦

発表内容 • AI・深層学習技術について • 印刷現場への適用例 • データの準備 • モデル •
解析 • 最近の研究トレンド • 当社の取り組みの紹介

3 玉城哲平たまきてっぺい代表取締役 CEO/CTO 分子構造計算、最適化問題の数値解析手法科学技術計算ソフトウェア開発企業で半導体シミュレーターや数値計算ライブラリの開発ナビタスビジョン株式会社
画像検査ソフトウェアAsmil Vision 新規開発タクトピクセルを辻谷と共同創業横浜国立大学博士課程(社会人)所属趣味クラシック音楽（バイオリン、ビオラ）、読書、マラソン O O O O O O O O O O O O O O O O O C H3 CH3 CH3 CH3 C H3 C H3 固定相移動相 Flow

人工知能とは？ 4 知性を感じるような高度な情報処理システム深層学習（ディープラーニング）＝エキスパートシステム、データ予測、ロボット人工知能研究分野の特定技術広義狭義＝
データマイニング、機械学習、ニューラルネットワーク＝ゲーム、画像、音声、自然言語への適用人工知能？様々な文脈で使用されており定義が定まらない

Googleトレンド https://trends.google.co.jp/trends/ 0 10 20 30 40 50 60 70
80 90 100 Jan-08 Jan-09 Jan-10 Jan-11 Jan-12 Jan-13 Jan-14 Jan-15 Jan-16 Jan-17 Jan-18 日本世界人気度深層学習の躍進 5 Googleトレンド「人工知能」

CONFIDENITIAL 6 第１次AIブーム（1960年代）自然言語マシンビジョン第２次AIブーム（1980年代）エキスパートシステムニューラルネットワーク https://ja.wikipedia.org/wiki/人工知能の歴史第３次AIブーム（2000年代以降）
演算装置(CPU, GPU)の進化ビッグデータ情報技術の進化深層学習（ディープラーニング）、強化学習インターネット IoT • 囲碁・将棋 • 画像分類コンペティション • 翻訳 • クイズある領域では人間を超えている

CONFIDENITIAL 7 1980 2010 第2次AIブーム第3次AIブーム河島茂生,新聞記事に見る人工知能やロボットの言説の変化, 人工知能学会誌 Vol.32(2017),
No.6, 935-942 第1次AIブーム

“人工知能”と”深層学習”という言葉人工知能 ※ この表示は手法からの分類について述べたものであり、そのほかにも応用的なアプリケーションや数学的な視点が必要です。また、この図は主観的なもので、一般化することはできません。研究分野、立場によって見解が異なることに注意が必要です。 ※ 図上は領域が分かれている場合でも相互に関連しあっている場合があります。 ※ 将来的にこの分類が明らかな誤りとされる可能性もあります。機械学習
データマイニングベイジアンネットワーク人工無脳ニューラルネットワーク(NN) 決定木モデルクラスタリング強化学習畳み込みNN 再帰型NN 深層学習

“人工知能”と”深層学習”という言葉人工知能、AI 深層学習「検査業務に人工知能を使うと………。」「検査装置の結果画像を学習データとし、深層学習技術を適用した学習済みモデルを作成して、良否判定の自動分類システム構築すると………。」人工知能技術、AI技術深層学習技術曖昧なので最近はあまり使われない傾向にある。
「深層」でないニューラルネットワークや周辺技術も含めた言い方。

深層学習 (ディープラーニング, DL) 10 ディープラーニングまたは深層学習（英: deep learning）とは、（狭義には4層以上の）多層のニューラルネットワーク（ディープニューラルネットワーク、英: deep neural
network）による機械学習手法である https://ja.wikipedia.org/wiki/ディープラーニング入力層中間層出力層この辺が”ディープ(深い)”の由来ねこ

何が起こっているの？ねこ

２５５ 11 3.5 8 10 21 演算装置何かを入力したら、何かを出力する

その関係を調べたい２５５ 11 3.5 8 10 21 演
算装置 = 2 + 1 2 5 10 21 5 11 3.5 8

= () すごく単純

0 , 1 , 2 , … 0 = ()
1 2 3 複数の入力形式ニューロン、人工ニューロン

＝ℎ(Σ + ) 1 2 3 パーセプトロン 1 2 3
・・・

多層パーセプトロン

MNIST • ０～９の１０種類の手書き数字画像が格納されたデータセット • アメリカ国立標準技術研究所(NIST)のデータセットを修正 (modified)したもの • 28x28ピクセルのサイズ • グレースケール
https://en.wikipedia.org/wiki/MNIST_database https://www.nist.gov/sites/default/files/documents/srd/nistsd19.pdf

・・・ 28 28 ０１２３４
５６７８９ 28x28=784 入力出力ニューラルネットワークによる分類 0.0 0.0 0.0 0.0 0.0 0.1 0.1 0.1 0.2 0.3 0.4 0.6 1.0 1.0 0.9 1.0 1.0 1.0 1.0 1.0 1.0 0.7 0.9 1.0 1.0 1.0 1.0 0.5 0.0 0.1 0.0 0.5 1.0 0.4 0.0 0.0 0.0 0.0 0.4 1.0 0.3 0.0 0.4 0.6 0.4 1.0 1.0 0.8 0.2

畳み込みニューラルネットワーク 3 3 畳み込み(convolution)層& プーリング(pooling)層特徴マップ畳み込み(convolution)層& プーリング(pooling)層全結合層

Krizhevsky, A., Sutskever, I., & Hinton, G. E. (2012). Imagenet
classification with deep convolutional neural networks. In Advances in neural information processing systems (pp. 1097-1105).

印刷画像分類の精度とパラメータ数モデルは大きいほうがより良い？ VGG16, 96.4% VGG19, 95.2% ResNet50, 90.1% ResNet101, 88.5%
ResNet152, 93.5% InceptionV3, 97.5% 88.0% 89.0% 90.0% 91.0% 92.0% 93.0% 94.0% 95.0% 96.0% 97.0% 98.0% 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000 70,000,000

ImageNet 巨大データセット • 1400万枚を超える画像 • 1000クラスを抽出して分類課題を与えられる http://www.image-net.org/ 画像認識のコンペ ILSVRC

ILSVRC(Classificaiton top-5) • 2012年 AlexNet: 15.3 % • 2014年 GoogLeNet
6.67% • 2015年 ResNet 3.57% 人間：5.1% http://karpathy.github.io/2014/09/02/what-i-learned-from-competing-against-a- convnet-on-imagenet/ https://github.com/starpentagon/python_scripts/blob/master/dataset/ILSVRC201 2_class_name/ILSVRC2012_class_name.csv 1400万枚を超える画像 1000クラスを抽出して分類課題を与えられる

Simonyan, K., & Zisserman, A. (2014). Very deep convolutional networks
for large-scale image recognition. arXiv preprint arXiv:1409.1556. He, K., Zhang, X., Ren, S., & Sun, J. (2016). Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).

深層学習モデルの設計入力層中間層中間層出力層 [b, x, y, c] b:
バッチサイズ x: 画像サイズ幅 y: 画像サイズ高さ c: 画像チャンネル数画像チャンネル数を4 チャンネル以上にする適切な前処理を行う適切な規模のネットワーク構造とする（大きすぎるのも良くない）全結合層(Fully Connected)層より Global Average Pooling 層学習条件・ImageNet等からの転移学習は行わない。ランダム初期値で学習を開始する。・StepwiseでLearning Rateを設定する。・Optimizerはあまり精度に影響しない。 Dropout層よりBatch Normalize層が重要 Residual層も取り入れる 11,283,478 26,073,878 23,593,174 50,474,518 134,360,598 55,784,214 139,670,294 21,818,390 54,313,942 0 20,000,000 40,000,000 60,000,000 80,000,000 100,000,000 120,000,000 140,000,000 160,000,000 Parameter size 定性的な分類問題に落とし込む精度と計算量のバランスがいい印刷画像向け深層学習画像分類エンジン

モデルのサイズと計算時間 VGG16, 7.5 VGG19, 10.48 ResNet50, 33.55 ResNet101, 47.43 ResNet152,
114.85 InceptionV3, 46.45 0 20 40 60 80 100 120 140 20,000,000 30,000,000 40,000,000 50,000,000 60,000,000 70,000,000 1エポック当たりの計算時間とパラメータ数 • 印刷画像の欠陥分類 • Geforce GTX 1080

791.54 97.42 74.36 0 100 200 300 400 500 600
700 800 900 CPU(i5-2400S 2.5GHz) GPU(Geforce GTX 1080) GPU(Tesla V100) CPUとGPUの計算速度の違い画像数：4760 モデル：inception-resnet-v2 入力サイズ：112x112 バッチサイズ：32 x 10.6 1エポック当たりの時間[秒]

GPU メーカー・NVIDIA ・AMD NVIDIA製・Geforceシリーズ・Teslaシリーズ型番発売時期発売時価格
Geforce GTX 1080 2018.5 64,000円 GeForce GTX 1070 2018.6 40,000円 GeForce GTX 1660 Ti 2019.2 40,000円 Tesla P100 2016.6 Tesla V100 2017.6 100万円

発売価格: $399,000 （≒4,300万円) https://www.nvidia.com/en-us/data-center/dgx-2/

東京リージョン p3.16xlarge：33.552USD/時間 https://aws.amazon.com/jp/ec2/instance-types/p3/

深層学習の何がすごい？ • これまで難しかった判別能力が飛躍的に上がった • 特徴抽出を人が行わなくて良くなった（帰納的）・耳があってひげがあって… ・毛並みのテクスチャは… ・耳の形状は三角で… ・目の色は…

深層学習以外の発展 • 強化学習 • 自然言語処理 • ベイズ推論 • 囲碁・将棋 •
チャットボット • 故障予知、異常検知人工知能技術は色々な研究・技術の集積

分類敵対的生成ネットワーク画像の生成に用いられる強化学習強化学習評価関数に用いたり、探索の絞り込みに深層学習を用いることで性能の向上が
見込める自己符号化器特徴量抽出 MATLABの事例より類似コンテンツの検索、異常検知領域分割 Classification Semantic Segentation GAN Reinforcement Learning Autoencoder Feature Engineering https://jp.mathworks.com/discovery/anomaly-detection.html http://host.robots.ox.ac.uk/pascal/VOC/voc2012/segexamples/index.html https://www.kdnuggets.com/2016/07/mnist- generative-adversarial-model-keras.html

印刷画像向けの特徴技術課題・定量的な問題が多い・複数画像を入力・背景絵柄が変化する犬や猫などの写真(3チャンネルカラー画像)分類はノウハウが一般化してきている検査
・自動検査装置の結果の精度をさらに向上させたい・結果を解析して生産管理に生かしたい → 問題設定の見直し → モデルの工夫 → 大規模データ学習

画像の例良品／不良品分類欠陥品種分類画像と分類項目の例 × 不良品 × 不良品 × 不良品
良品良品毛ごみインキカス汚れ異物見当ズレ毛ごみの付着は不良品として処置するインキカスは不良品として処置する汚れは不良品として処置する払ったら落ちる異物は良品扱い微細な見当ズレは良品扱い

画像検査装置仕上げ工程ベリファイ工程（データ検品）画像自動分類アプリケーション事前判別確実に良品と思われるものを排除してベリファイ工程の負担を削
減する。事後判別確実に致命的な欠陥となりそうなものを強制的に欠陥指定して流出事故を防止する。 1 2 3 学習済みモデルデータ収集システム化ベリファイ工程の効率化

データ収集と分類項目のポイント • 様々なバリエーション • 画像特徴から推測できる推論結果 • 適切な分類項目数とデータ量 • 定性的な分類項目 •
データの増幅方法 • アノテーションノイズ多品種クライアント属性は含まない１分類項目当たり1000画像大小ではなく欠陥品種画像特徴を失わない方法一貫した方針

画像のバリエーション単一の品種（絵柄）ではなく、できるだけ多くの種類の画像を集める。画像枚数よりも画像の多様性が重要。

アノテーション作業 • 1項目当たり1,000画像(組)以上 (印刷画像) • 一貫したルール • ある程度溜まってきたら省力化可能例えば… ・10分類の場合
最低3万件・3,000件/日/人・10日人 ※ 知識のある現場の方が良い

アノテーションの省力化 • 半教師あり学習 • アクティブラーニング推論ラベル無しデータモデル 1 :
50% 効率的なアノテーション追加する教師データモデル2 : 60% 抽出教師データ

外注する場合 10万円～100万円(初回) ・精度・納期・難易度

画像特徴から推測できる推論結果 • 通常であれば良品とするところだが、この製品のクライアントの要求精度が厳しいため、多少歩留まりを犠牲にしても不良品とする。（良品／不良品分類） • 画像からは判別できないが、使用している紙の種類から、浮遊異物ではなく夾雑物だと判断できる。（欠陥品種分類）相応しくない例）

定性的な分類項目 × 重大欠陥、中欠陥、小欠陥 → 深層学習ではなく領域サイズからルールベースで判定するべき △ 良品、不良品 → ノイズが多いが精度を求めないのであれば可能
〇欠陥の品種 → 明確な指標に基づいて区別するのであれば可能

最近の研究トレンド

注目領域の可視化 (Saliency map) Interpretable Explanations of Black Boxes by Meaningful
Perturbation : http://openaccess.thecvf.com/content_ICCV_2017/papers/Fong_Interpretable_Explanations_of_ICCV_2017_paper.pdf [1610.02391] Grad-CAM: Visual Explanations from Deep Networks via Gradient-based Localization : https://arxiv.org/abs/1610.02391 [1710.11063] Grad-CAM++: Improved Visual Explanations for Deep Convolutional Networks : https://arxiv.org/abs/1710.11063 深層学習モデルによって推測された結果は途中の計算結果を理解することが困難であるため、説明できる深層学習(Interpretable DL)の研究が盛んに行われている。分類処理を行った後に「なぜその判断を行ったか？」を可視化することにより、そのモデルが汎化能力を獲得しているかを間接的に分析することができる。ニューラルネットワーク構造に制約されない、より安定的に利用できるmask法で実装した。 $ dlc-titan predict-ss --model-network ${SOURCE}/network.json --model-weight ${SOURCE}/trained.h5 --image-input-model ${F1} ${F2} -- cam-type Grad-CAM --image-masking-stride 1,1 --grid 16,16 --image-target-size 112,112,3 --last-conv-layer prediction --output- dir ./predict-ss/output/ --output-heatmap ./predict-ss/heatmap/${F2##*/} --verbose DLC-Titanに実装済み

説明可能AI https://www.ai-gakkai.or.jp/my-bookmark_vol34-no4/ https://www.darpa.mil/program/explainable-artificial- intelligence

Encoder-Decoder による良品学習と欠陥検出良品データの準備 (100枚) データの前処理ノイズ付加入力層圧縮特徴出力層
Encoder Decoder ハイパーパラメータ、ネットワークモデルの構造、ノイズの与え方については、印刷の特徴に合わせた調整が必要。

Encoder-Decoder による良品学習と欠陥検出 • 不良品画像の収集が不要である。（従来手法と同じ） • 基準画像との差分ではないので、あいまいな検知ができる • 位置決め無しで欠陥を検出す
ることができる • 検査領域の枠を引いたりなどの細かい設定が不要になる未知のデータ予測された良品比較検査アルゴリズム

近年の学術界の変化 CONFIDENITIAL 50 • 既存の研究を調べる • 仮説を立てる • 実験する •
先行発表する • 論文を書く AIブーム。資金調達が容易。企業との共同研究など。 AI関連(特に深層学習)の画像認識コンペティション・ILSVRC Challenge (ImageNet) ・Cityscapes 大規模な国際会議・NIPS ・IJCAI アーカイブ(arXiv)の存在・査読なし・フリーアクセスフレームワーク・TensorFlow ・Caffe 産業と先進技術の垣根が低くなってきている

MNIST • ０～９の１０種類の手書き数字画像が格納されたデータセット • アメリカ国立標準技術研究所(NIST)のデータセットを修正 (modified)したもの • 28x28ピクセルのサイズ • グレースケール
https://en.wikipedia.org/wiki/MNIST_database https://www.nist.gov/sites/default/files/documents/srd/nistsd19.pdf

ImageNet 巨大データセット • 1400万枚を超える画像 • 1000クラスを抽出して分類課題を与えられる http://www.image-net.org/ 画像認識のコンペ ILSVRC

CIFAR-10 dataset • ベンチマークとして非常によく使われる • 1分類当たり6,000枚 • 10分類 60,000枚

Ver. 1.0 １０月公開予定疑似印刷検査画像のデータセット・黒点ゴミ。毛ゴミ・カスレ・ピンホール欠陥

AI技術に期待されること • 自動化、省力化によるコスト削減 • 新人教育のコスト • 生産コスト • 人的ミスの防止 •
リードタイムの短縮 ➢安定稼働と生産予測の容易化 ➢人材の配置転換のリスク低減 56 コスト削減だけじゃない！

プードルデザインや原稿を手軽にバージョン管理 DLA-Mercury 印刷工場のための深層学習モデル作成ツール深層学習・画像処理技術
独自ライブラリ

59 /ˈpuː.dəl/ プードル印刷工場のための画像認識クラウドプラットフォーム POODL proofrog technology

基本機能 • ストレージ • 画像をアップロードしデータセット単位で保管する • データセットの分割・結合・編集作業が行える • アノテーション •
分類作業に集中できるシンプルな画面設計 • 権限機能によって安全に作業依頼ができる • データの前処理 • 検査画像の特長を失わないようなデータの増幅を行う • 学習 • 専門知識無しで学習処理の実行が可能 • 解析 • 学習済みモデルの精度を分析する • 適切な学習済みモデルをダウンロードできる • 推論 • 検査装置などに組み込んでオフラインで高速処理ができる POODL proofrog technology

AI製品とサブスクリプション 61 そのAI製品をいつ利用するか（頻度と時期）がポイント利用開始 AI製品を継続的に利用して自社製品を生産する場合は、安定した稼働のために工場内に配置するべき再学習学習済みモデルの作成時期が不定期で、自社製品の生産時にはAI製品を
工場内に配置する必要がない 1 2 3

POODL proofrog technology

販売形態・価格 • POODLプラットフォーム(SaaS/クラウド版) • 15万円/月 (年単位契約 180万円～) • 学習処理の量に合わせた従量課金 •
PoCサポート • “使える”学習済みモデル作成を個別支援 • 1か月間 300万円～ • POODLプラットフォーム使用料含む ※ オンプレミス版や特注カスタマイズは個別相談 POODL proofrog technology

2019/5/20 Taktpixel Co., Ltd. 64 契約書パッケージ広告チラシ書類
書籍プレゼン資料デザインや原稿を手軽にバージョン管理 POODL proofrog technology

2019/5/20 Taktpixel Co., Ltd. 65 POODL proofrog technology

2019/5/20 Taktpixel Co., Ltd. 66 POODL proofrog technology

67 タクトピクセル株式会社 / Taktpixel Co., Ltd. / TPX タクト (takt)
…指揮棒ピクチャー(picture) …画像エレメント (element) …要素 pixel … 画素

お問い合わせ玉城哲平 (たまきてっぺい) [email protected] https://taktpixel.co.jp/ 共同研究パートナー企業を募集しています・データセットの提供・課題検討・技術交流

深層学習技術の今と印刷産業への挑戦 (日本印刷学会 秋期セミナー)

深層学習技術の今と印刷産業への挑戦 (日本印刷学会 秋期セミナー)

More Decks by Taktpixel Co., Ltd.

Other Decks in Business

Featured

Transcript

深層学習技術の今と印刷産業への挑戦 (日本印刷学会秋期セミナー)

深層学習技術の今と印刷産業への挑戦 (日本印刷学会秋期セミナー)