図面をデノイジングする技術について - 【ABEJA × CADDi】Computer Visionのビジネス活用を考える

図面をデノイジングする技術について #ABEJAxCADDi 中村遵介

図面の画像解析 Copyright 2017-2021 CADDi Inc. All rights reserved. 2 CADDiでは、画像解析によって図面画像から様々な情報を取得しています
寸法値寸法線テーブル情報記号

図面解析に対するノイズの影響 Copyright 2017-2021 CADDi Inc. All rights reserved. 3 図面解析では、矢印や記号などの小さな領域が大
きな意味を持つことも多い一方で、実際の図面データでは様々なノイズによって小さな領域が変形してしまっていることも... 例: 寸法線の範囲を表す矢印は、図面によるが縦横30pxほど（図面は全体は縦横4000pxほど）小さいが重要な意味を持つ

ノイズ除去の目的と定義 Copyright 2017-2021 CADDi Inc. All rights reserved. 4 目的
アルゴリズミックに行っている矢印等の記号認識において、ノイズによる認識の妨げをなくしたい定義ノイズによる図面画像の劣化を検出し、推定され得る元の綺麗な状態の図面画像に近づける

図面に載っているノイズの種類 Copyright 2017-2021 CADDi Inc. All rights reserved. 5 ノイズといっても、顧客・図面によって様々なノイズが載っている
800枚ほど調査した結果、以下が解析に影響を及ぼす可能性があると分かったヒゲノイズモスキートノイズかすれ現行である程度対処可能数が多い場合によっては悪影響比較的数が多い他ノイズと合わさる場合も場合によっては悪影響数はそこそこ他ノイズと合わさる場合も図面データのスキャンの際に入る？どこかでJPEG画像に変換されている？図面データのスキャンの際に入る？縮小時？

ノイズ除去: エキスパートモデルの採用 Copyright 2017-2021 CADDi Inc. All rights reserved. 6
すごい手法・シングルモデル: 一括で全てのノイズを除去・エキスパートモデル: 複数手法で対応するノイズを個別に除去ノイズAのすごい手法ノイズBのすごい手法複数のノイズを除去する方法として、以下の 2つが考えられる前者は実用は簡単だが開発が難しく、後者はその逆にある今回はPoCとしての面もあるため、後者のエキスパートモデルの作成を選択した

モデル開発 Copyright 2017-2021 CADDi Inc. All rights reserved. 7 出典
Olaf Ronneberger, Philipp Fischer, and Thomas Brox U-Net: Convolutional Networks for Biomedical Image Segmentation MICCAI 2015 ・実装が簡単・高解像度画像も扱いやすい・実績・知見が数多く存在モスキートノイズ除去モデルと、カスレ除去モデルの2つを作成図面ごとに異なる傾向を簡単に取り扱うため、機械学習（CNN）でのトライモデル構造にはU-Netベースの構造を採用

データセット作成の難しさ Copyright 2017-2021 CADDi Inc. All rights reserved. 8 デノイジング手法の学習や評価には大抵、
「綺麗な画像」と「ノイズで劣化した画像」のペアが必要実際の図面では「綺麗な図面」と「ノイズで劣化した図面」のペアは手に入らないこの写像をデータから学習 ? ? ?

デノイジングデータセットの自動生成 Copyright 2017-2021 CADDi Inc. All rights reserved. 9 仮説:
今回のデノイジングには広範囲なコンテキストはおそらく必要ない局所的には図面に見える画像を生成し、ノイズをシミュレーションして乗せる大量の（綺麗な図面っぽい画像、ノイズ図面っぽい画像）のペアを生成図面もどきを大量に自動生成生成した綺麗な画像リアルな図面に近付くようノイズを乗せた画像

結果の可視化と分析 Copyright 2017-2021 CADDi Inc. All rights reserved. 10 モデル自体は画素の絶対誤差で学習させるが、損失の値だけでは
実際にどのようにノイズが除去されているかは分からないモデルを動的に読み込み結果を可視化するツールを作成し、モデルの性質を把握 • 狙い通りのノイズが消せているか？ • 狙っていないノイズまで消していないか？ • モデルの順序を入れ替えた時に結果が大きく変わらないか？オリジナル損失値は異なるが見た目は似ているしかしよく見ると細かい差異がある

実際にノイズの載った図面での精度の話 Copyright 2017-2021 CADDi Inc. All rights reserved. 12 最終的な目的は、あくまで図面の解析がうまく進むかどうかという点
例えば、矢印の認識のためのデノイジングで、矢印が綺麗になるのなら文字が多少潰れても問題はない一般的な図面と、特に強いノイズの乗った図面データセットを作成し、ノイズ除去前後での記号認識精度を比較一般的な図面はあまり精度が変わらず、ノイズデータセットは認識精度が向上した

これからの話 Copyright 2017-2021 CADDi Inc. All rights reserved. 13 今回はデノイジングがどこまで可能か、現在の解析方法にどの程度影響を及ぼすかの
PoCだったため、実用化にはいくつかの壁が存在する • 計算コストが大きい • モデル自体の大きさ • 入力画像の大きさ（数千x数千サイズ） • 現行のアルゴリズムに対して具体的な影響が分かりづらい • マクロ視点で精度への影響は計測可能 • ミクロ視点でアルゴリズムへの影響が不明 • 精度改善

We are hiring!! 「キャディ　エンジニア採用」で検索！ 

図面をデノイジングする技術について - 【ABEJA × CADDi】Computer ...

図面をデノイジングする技術について - 【ABEJA × CADDi】Computer Visionのビジネス活用を考える

[email protected]

More Decks by [email protected]

Other Decks in Technology

Featured

Transcript

図面をデノイジングする技術について #ABEJAxCADDi 中村遵介

図面の画像解析 Copyright 2017-2021 CADDi Inc. All rights reserved. 2 CADDiでは、画像解析によって図面画像から様々な情報を取得しています

図面解析に対するノイズの影響 Copyright 2017-2021 CADDi Inc. All rights reserved. 3 図面解析では、矢印や記号などの小さな領域が大

ノイズ除去の目的と定義 Copyright 2017-2021 CADDi Inc. All rights reserved. 4 目的

図面に載っているノイズの種類 Copyright 2017-2021 CADDi Inc. All rights reserved. 5 ノイズといっても、顧客・図面によって様々なノイズが載っている

ノイズ除去: エキスパートモデルの採用 Copyright 2017-2021 CADDi Inc. All rights reserved. 6

モデル開発 Copyright 2017-2021 CADDi Inc. All rights reserved. 7 出典

データセット作成の難しさ Copyright 2017-2021 CADDi Inc. All rights reserved. 8 デノイジング手法の学習や評価には大抵、

デノイジングデータセットの自動生成 Copyright 2017-2021 CADDi Inc. All rights reserved. 9 仮説:

結果の可視化と分析 Copyright 2017-2021 CADDi Inc. All rights reserved. 10 モデル自体は画素の絶対誤差で学習させるが、損失の値だけでは

streamlitによる結果の可視化と分析（demo） Copyright 2017-2021 CADDi Inc. All rights reserved. 11 図面内のシンプルな

実際にノイズの載った図面での精度の話 Copyright 2017-2021 CADDi Inc. All rights reserved. 12 最終的な目的は、あくまで図面の解析がうまく進むかどうかという点

これからの話 Copyright 2017-2021 CADDi Inc. All rights reserved. 13 今回はデノイジングがどこまで可能か、現在の解析方法にどの程度影響を及ぼすかの

まとめ Copyright 2017-2021 CADDi Inc. All rights reserved. 14 •

We are hiring!! 「キャディ　エンジニア採用」で検索！