Azure CustomVision ハンズオン

自己紹介 • 株式会社KIS • 矢野翔大 • 在宅勤務中 • 興味あること：ARとかVRとか電子部品 •
趣味はモノづくり • ようやくMRTKv2触り始めた • Dynamics365 Guidesお試し中 • KumaMCNで活動中 MRTKv2 Dynamics365 Guides

Q1:プログラミングをやったことある人？

Q1:Deep Learningを自分で実装したことある人？

いろいろあるけど今日は学問的なことは省略！！

・犬1匹・猫1匹・左にいるのが猫・右にいるのが犬｛ “Class”：”Cat”, “Accuracy”:94.8 “Rect”:{ “top”:30,“left”:10, “width”:40
,”height”:50}, “Class”：”Dog”, “Accuracy”:98.1 “Rect”:{ “top”:25,“left”:60, “width”:42 ,”height”:75}}

・犬1匹・猫1匹・左にいるのが猫・右にいるのが犬｛ “Class”：”Cat”, “Accuracy”:94.8 “Rect”:{ “top”:30,“left”:10, “width”:40
,”height”:50}, “Class”：”Dog”, “Accuracy”:98.1 “Rect”:{ “top”:25,“left”:60, “width”:42 ,”height”:75}} ざっくり言うと人間が認知するのと同じようなふるまいをするもの

人間の認知機能(Cognitive)機能の一部を Web APIとして利用できる“AIパーツ” Vision 視覚 Speech 音声 Language 言語 Decision
決定 Search 検索 Labs ラボ

決定 Search 検索 Labs ラボ画像分類ビデオ読解顔識別感情判定 OCR 話者識別音声⇔テキスト文章解析文脈理解推定予測 Bingエンジンによる検索 Preview版

決定 Search 検索 Labs ラボ Computer Vision Custom Vision Face Video Indexer Form Recognizer Ink Recognizer Speech to Text Text to Speech Speech Translation Speaker Recognition Translator Text Text Analytics QnA Maker Immersive Reader Language Understanding Personalizer Content Moderator Anomaly Detector Autosuggest Custom Search Entity Search Image Search News Search Spell Check And more Academic Knowledge Knowledge Exploration Conversation Learner Personality Chat Answer Search Event Tracking And more

MLの稼働環境不要 NN・DLの深い知識不要あらゆるOS・言語で使える各言語のSDK プラットフォーム別サンプル従量課金無料版で検証利用に合わせて調整データの即活用 Cognitive
Servicesの特徴

決定 Search 検索 Labs ラボ実際に触って体験してみましょう

Custom Visionで画像分類まずは食べ物の画像を分類してみましょう

Custom Vision の価格

ハンズオンで使う資料 https://github.com/shota-yano/Custom-Vision-Handson.git Git cloneかZIPファイルをダウンロードしてください

Azureのアカウント作成ここからアカウント作る ※要クレジットカード https://azure.microsoft.com/ja-jp/

Azureのアカウント(学生の場合) 学校で配られたメールアドレスがあれば始められるのでアカウントがない場合は作ってください https://azure.microsoft.com/ja-jp/free/students/

Azureポータルへアクセス https://azure.microsoft.com/ja-jp/features/azure-portal/ クリック

リソースを作成する ②検索

リソースを作成するクリック

リソースを作成する両方を選択項目値名前適当にサブスクリプションご自身が契約してるものリソースグループ次のスライドに記載
トレーニングの場所東日本 • 一番近いところがお勧め • 場所によって価格が変動することがあるトレーニング価格レベル F0(無料の場合)/S0（有料の場合）予測の場所 F0(無料の場合) 予測価格レベル東日本

リソースグループを作成する場合新規作成をクリック

リソースグループを作成する場合 ①新規作成をクリック ②任意に名前を決めて入力 ③Okをクリック

全部入力したら作成作成をクリック項目値名前適当にサブスクリプションご自身が契約してるものリソースグループ前のスライドで作成したもの
トレーニングの場所東日本 • 一番近いところがお勧め • 場所によって価格が変動することがあるトレーニング価格レベル F0(無料の場合)/S0（有料の場合）予測の場所 F0(無料の場合) 予測価格レベル東日本

デプロイ完了まで待つ ①クリック ②クリック

作成したCustom Vision のリソースクリック

CustomVision ポータルへアクセスクリック ※ブラウザはIE以外でお願いします

新しいプロジェクトを作成クリック

新しいプロジェクトを作成項目値 Name 適当に Description(任意) プロジェクトの説明 Resource Group Azureで作成したものを選択
Project Type Classification(分類)を選択 Classification Type Multiclass(画像1つにつき1タグ) Domains Foodを選択 ※用途で使い分ける • General(他が当てはまらない場合) • Food(食べ物) • Landmarks(建造物など) • Retail(小売り(洋服などもここ)) • Compact系(エクスポートしたい場合) 入力後クリック

今回使用する画像セット https://www.vision.ee.ethz.ch/datasets_extra/food-101/ スイスのチューリッヒ工科大学のコンピュータビジョン研究チームが公開しているものです。クラス分けのタグ情報が付加された食べ物の画像です。約5GBの一括ダウンロードです。容量に注意してください。今回はこの中から一部を抽出して使用します。

画像を追加するクリック

画像を追加するトレーニングデータを使う 20枚選択してクリック

画像にまとめてタグをつける ①20枚あることを確認入力して Enterキー

タグを入力後アップロードする ②クリック ①入力が確定したことを確認 ※間違ったら「×」で削除

画像の追加完了クリック ※同じ要領で他の画像もアップロードとタグ付けをしてください

全ての画像のアップロードとタグ付けまで完了タグの一覧

学習させるクリック

学習方法を選択して実行する ②クリック ※Advanced Trainingは選ばないでください 1時間以上学習がかかるのでハンズオン何もできなくなります Standardプラン(S0)の場合1時間あたり2000円ちょっとかかります。 24時間回せば5万円くらいかかるので注意してください Freeプラン（F0）の場合、1時間学習した後強制的に学習が終わります ①FastTrainingを選択

学習完了まで待つ(1～２分)

結果が表示されたら学習完了これでもう画像分類が出来ます

結果の見方項目説明 Precision(精度) 正しかったと識別された分類の割合。 100枚の画像が犬として識別され、そのうち 99枚が実際に犬であった場合、精度は 99%
になります。 Recall(再現率) 正しく識別された実際の分類の割合。実際に犬である画像が 100枚あり、 80枚が犬として識別された場合、再現率は 80% になります。 AP(平均精度) 閾値で計算されたPrecisionの平均値

になります。 Recall(再現率) 正しく識別された実際の分類の割合。実際に犬である画像が 100枚あり、 80枚が犬として識別された場合、再現率は 80% になります。 AP(平均精度) 閾値で計算されたPrecisionの平均値犬99枚狐1枚合計100枚の画像を与えるこの100枚の画像は全部犬だ精度99%

になります。 Recall(再現率) 正しく識別された実際の分類の割合。実際に犬である画像が 100枚あり、 80枚が犬として識別された場合、再現率は 80% になります。 AP(平均精度) 閾値で計算されたPrecisionの平均値犬の画像を100枚与えるこの100枚のうち 80枚は犬の画像だ再現率80%

結果の見方タグごとの結果が見れるうまく分類できないタグは調整して再学習など行う

結果の見方学習するたびにリストが増える

結果の見方閾値区分閾値との関係閾値を上げたらどうなるか Precision 閾値を上げる ⇒上がる間違って分類されるものが減る。取りこぼしは増える
Recall 閾値を下げる ⇒上がる取りこぼしは減る。間違って分類されるものも増える APIから呼び出す時に調整できるかは不明 (パラメータが見当たらないため) このパラメータをどう扱うかは作りたいもの次第例：MRIなどの画像から癌を見つける場合閾値を上げる：癌なのに癌じゃないと判断されるかも閾値を下げる：癌じゃないのに癌だと診断されるかもどちらが良いのか？

Quick Test クリック

ローカルファイルをアップロードするクリック

ローカルファイルをアップロードする検証用データクリック

テスト結果を確認する【結果】 99.9%の確率で寿司だと分類されました

URLを指定してWEBの画像も使用可能 URLを入力

予測の履歴を確認クリック

予測の履歴を確認テストした結果はここに表示されていく

予測の履歴を確認マウスオーバーで結果が確認可能クリックすれば詳細が確認できる

タグの修正予測結果が間違っていた場合は正しいタグをつける保存すれば次回の学習に使用される

モデルの公開 ①クリック ②クリック

名前を入力して公開する(名前は何でもよい) クリック名前を入力 ※デフォルトのままでもいい予測に使うリースを選択 ※CustomVision作成時に同時に作られてる

公開完了公開すると「Unpublish」に変化する ⇒これをクリックすれば非公開に戻せる

API実行用のURLとキーを確認するクリック

API呼び出し用の情報を確認する(後で使います) キー URL WEB上の画像を使いたい場合はこっちローカルマシンの画像を使いたい場合はこっち ※今回はこれを使う

Foodの中のHTMLをテキストエディタで開くテキストエディタで開く

赤字の部分を書き換える $.ajax({ url: "https://YourUrl", beforeSend: function(xhrObj){ // Request headers xhrObj.setRequestHeader("Content-Type","multipart/form-data");
xhrObj.setRequestHeader("Prediction-key",“YoutKey"); }, ①AURLを入力 ※2つ前のスライドの値です ②キーを入力 ※2つ前のスライドの値です

HTMLファイルをブラウザで実行クリック Microsoft EdgeかGoogle Chromeで実行してください。 Microsoft InternetExplorerは動作保証しません

ローカルファイルを選択 ②クリック ①1枚選択

APIを使って画像の分類結果を受け取る読み込んだファイルクリック

これでもうAPIさえたたけば画像分類できますね結果が表示される

補足ソースの解説

APIのドキュメントクリック

APIのドキュメントここに解説がある

APIのドキュメント一番下までスクロールすると先ほどのサンプルソースのもとがここにある

CustomVisionの公式ドキュメントクリック

CustomVisionの公式ドキュメント

以上が画像分類です

Custom Visionで物体検出今度は少し業務よりのものとして製品の傷の検出を試します

http://resources.mpi-inf.mpg.de/conferences/dagm/2007/prizes.html 使用する画像セットドイツのシンポジウムで開催されたコンペ用のデータセットです。工業用部品の表面の欠陥を検出するという目標で、・基本画像１０００枚・人工的につけられた欠陥を含む150枚の画像が含まれています。

①クリック新しいプロジェクトを作成

新しいプロジェクトを作成項目値 Name 適当に Description(任意) プロジェクトの説明 Resource Group Azureで作成したものを選択
Project Type Object Detectionを選択 Domains Generalを選択 ※用途で使い分ける • General • Logo(ロゴの検出) • Compact ①クリック

画像を追加するクリック

トレーニングデータ100枚選択トレーニングデータクリック

画像をアップロードするクリック

アップロード完了クリック

タグをつける

アノテーションクリック

アノテーションドラッグ＆ドロップで傷の場所を囲う ※なるべく最小に

新しいプロジェクトを作成タグを入力

アノテーションタグを入力して Enter

アノテーションタグがついたことを確認次の画像に進みアノテーションを行う ※100枚やる

アノテーション完了 100枚あることを確認

学習を行うクリック

学習を行う ①クリック ②クリック

学習完了

QuickTestを行うクリック

ローカルファイルをアップロードするクリック

ローカルファイルをアップロードする ③クリック ②クリック ①検証用データ

学習結果を確認する 78.4％の確率で傷だと判断傷の検出ができている ※場合によっては複数検出することもあるので、一定の確率以下は無視するようなことも必要

傷なし画像をアップロードしてみる傷なし画像を選択クリック

学習結果を確認する傷がないと判断した場合は何も出てこない

APIを公開する

APIを公開する ①名前を入力 ②予測リソースを選択 ※リソース作成時に同時に作成している ③クリック

公開完了クリック

API呼び出し用のキーをメモする

HTMLファイルをテキストエディタで開く

Foodの時と同じように赤文字を置き換えて保存する $.ajax({ url: "https://YourUrl", beforeSend: function(xhrObj){ // Request headers xhrObj.setRequestHeader("Content-Type","multipart/form-data");
xhrObj.setRequestHeader("Prediction-key",“YourKey"); }, type: "POST", data: $("input[name='ufile']").prop("files")[0], processData: false, contentType: false })

HTMLファイルを実行してみるクリック

画像を1枚選ぶ検証用データクリック 1枚選択

画像を送信してAPIの推論結果を受け取るクリック

傷の検出ができると画面に描画される

補足ソースの解説

以上が物体検出です

Logic Appsの価格

OneDriveにアクセスする https://onedrive.live.com/about/ja-jp/ クリック

もしくは、OneDrive for Businessにアクセスする https://onedrive.live.com/about/ja-JP/business/ クリック

フォルダを2つ作成する Excel用に作成画像用に作成

excelフォルダにexcelファイルを格納するドラッグ&ドロップで格納する DLしてきたやつを使います

Excelファイルの格納を確認する

Logic Appのリソースを作成する入力する

クリック Logic Appのリソースを作成する

Logic Appのリソースを作成するクリック

Logic Appのリソースを作成する項目値名前適当にサブスクリプション契約してるものリソースグループ既に作成しているもの
場所東日本 LogAnalytics OFF クリック

Logic Appのリソースを作成する ①クリック ②クリック

デザイナーでフローを作成するクリック

デザイナーでフローを作成するここでフローを構築していく

デザイナーでフローを作成するここにある

トリガーを作成する ①検索 ②クリック Office365 buisiness版はこっち

トリガーを作成するクリック

トリガーを作成する(サインイン＆アクセス許可) クリック

トリガーを作成する(サインイン後の状態)

トリガーを作成する ①クリック ②クリック

トリガーを作成する画像フォルダを選択

トリガーを作成する間隔を30秒に設定 ※これで30秒に1回新しいファイルがないか確認するファイル監視の設定完了です

アクションを作成するクリックこまめに保存

アクションを作成する(HTTPリクエスト) ①検索 ②クリック

アクションを作成する(HTTPリクエスト) クリック

アクションを作成する(HTTPリクエスト) ①POSTを選択 ②CustomVision のAPIのURL ③CustomVision のAPIのキー ④クリック ⑤クリック

アクションを作成する(HTTPリクエスト) 選択後はこのようになる

アクションを作成する(JSON解析) ①検索 ②クリック ③クリック

アクションを作成する(JSON解析) クリック

アクションを作成する(JSON解析) ①クリック ②クリック

アクションを作成する(JSON解析) ①開いて中身をコピー ※DLしたファイルです ②貼り付け

アクションを作成する(JSON解析) 入力後はこんな感じ

アクションを作成する(EXCEL操作) ①検索 ②クリック Business版はこっち

アクションを作成する(EXCEL操作) クリック

アクションを作成する(EXCEL操作) ①クリック ②Excelファイルを格納している場所へ移動

アクションを作成する(EXCEL操作) クリック

アクションを作成する(EXCEL操作) ①クリック ②すべてON ③クリック

アクションを作成する(EXCEL操作) ①クリック ②クリック（データ操作ならなんでもいい)

アクションを作成する(EXCEL操作) ①For eachが自動追加される ②項目をそれぞれ選択する

保存して実行する ①保存 ②実行

OneDriveに画像を D&Dでアップロード画像をアップロードアップロードからファイル選択でも可能

画像をアップロードアップロードされたことを確認

画像をアップロード作成したフローが実行される

EXCELファイルにデータが更新されていればOK 複数行追加される可能性がある。不要なものは除外するなどデザイナー側での工夫は必要です。ぜひチャレンジしてみてください

これで自動化ができたユーザユーザ ①アップロード ②取得 ※常時監視 ③API実行 ④推論結果 ⑤結果を書き込みユーザは画像をOneDriveにアップロードするだけで推論結果が自動で蓄積されていく
画像

リソースを無効化する(後片付け) 無効にする有効のままだと30秒に1回実行され課金され続ける

リソースの削除(後片付け) 使わないものはリソースグループごと削除する

【余談】実はCustomVisionコネクタも存在している HTTPリクエストと JSONの解析が1つになったもの

【余談】実はCustomVisionコネクタも存在している Custom Vision側のAPIがアップデートされたら使えなくなる ※LogicAppのコネクタのアップデート待ちになる

【余談】実はCustomVisionコネクタも存在しているなので今回は自力で組み立てる ※所詮中身はREST APIなので難しくない

【余談】書き込み先はDBでも良い SQL SrverやAzureストレージ、ブロックチェーンデータベースなどに書き込むことも可能

Azureの無料の公式学習サイト https://docs.microsoft.com/ja-jp/learn/ Azureの使い方がハンズオン形式で学べます

Azure CustomVision ハンズオン

Azure CustomVision ハンズオン

More Decks by shota-yano

Other Decks in Technology

Featured

Transcript