Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
【MLN】Visual Blocks for ML
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
高橋かずひと
June 24, 2023
Technology
1.4k
0
Share
【MLN】Visual Blocks for ML
高橋かずひと
June 24, 2023
More Decks by 高橋かずひと
See All by 高橋かずひと
【PyCon mini Shizuoka 2026】生成AI時代に画像処理やオーディオ処理のノードエディターを作る理由
kazuhitotakahashi
0
1.3k
【NGK2026S】日本株のシステムトレードに入門してみた
kazuhitotakahashi
0
1.5k
【NGK2025S】動物園(PINTO_model_zoo)に遊びに行こう
kazuhitotakahashi
1
2.4k
【Pycon mini 東海 2024】Google Colaboratoryで試すVLM
kazuhitotakahashi
2
2.4k
【Python東海#44】Pydroid3で画像処理
kazuhitotakahashi
0
2.1k
【Unagi.py 56枚目】動物園(PINTO_model_zoo)に遊びに行こう
kazuhitotakahashi
1
1.9k
【Python東海#43】Image-Processing-Node-Editor
kazuhitotakahashi
0
1.2k
【NGK2023S】 ノードエディタ形式の画像処理ツール「Image-Processing-Node-Editor」
kazuhitotakahashi
0
1.8k
【Pythonデータ分析勉強会#33】「DearPyGuiに入門しました」の続き~Image-Processing-Node-Editor~
kazuhitotakahashi
0
1.9k
Other Decks in Technology
See All in Technology
イベントストーミングとKiroの仕様駆動開発で実現する要件の認識合わせプロセス
syobochim
7
840
Generative UI × A2UI で AI エージェントを作った話 AI-DLC も使ってみた!
kmiya84377
1
260
long-running-tasks
cipepser
2
430
エンジニアは生成AIと どのように向き合うべきか? ことばの意味という観点から
verypluming
3
280
形式手法特論:公平性制約の位相的特徴づけ #kernelvm / Kernel VM Study Kansai 12th
ytaka23
1
530
Claude Codeですべての日常業務を爆速化しよう!
minorun365
PRO
16
15k
オンコールの負荷軽減のためのBits Assistant 活用方法 / How to Use Bits Assistant to Reduce the Workload on On-Call Staff
sms_tech
1
280
電子辞書Brainをネットに繋げてみた(自力編)
raspython3
0
280
Fabric-cicd によるAzure DevOps デプロイ
ryomaru0825
0
110
Amazon CloudFrontにおけるAIボットアクセス制御のポイント
kizawa2020
5
300
AI時代に改めて考える、ドメイン駆動設計 - モデリングが「AIへの共通言語」になる
littlehands
8
2.7k
AI とサービス・デザイン / AI and Service Design
ks91
PRO
0
180
Featured
See All Featured
Balancing Empowerment & Direction
lara
6
1.1k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Code Reviewing Like a Champion
maltzj
528
40k
Abbi's Birthday
coloredviolet
2
7.8k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
2k
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
470
The Curse of the Amulet
leimatthew05
1
12k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
830
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
190
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
180
Transcript
Visual Blocks for ML MLN 2023/06/24
Who am I ? Name Twitter:KzhtTkhs :高橋かずひと 所属 :サイバーエージェント AI事業本部
行政DX Div GovTech開発センター 仕事 :画像処理 兼 なんでも屋 その他:Axross寄稿や インディーゲーム開発の お手伝いしています
Who am I ? Name Twitter:KzhtTkhs :高橋かずひと 所属 :サイバーエージェント AI事業本部
行政DX Div GovTech開発センター 仕事 :画像処理 兼 なんでも屋 その他:Axross寄稿や インディーゲーム開発の お手伝いしています
Image-Processing-Node-Editor 特徴 ・高橋自作のノードエディタ 形式の画像処理アプリ ・ノードをドラッグ& ドロップで接続できる ・各処理を視覚化しながら 処理を試すことが出来る ・OSS(Apache-2.0 license
)
0. Overview
Visual Blocks for ML とは 特徴 ・Google製のノーコード のグラフエディター ・ノードをドラッグ& ドロップで接続できる
・MLワークフローの プロトタイプを視覚化 しながら試すことが出来る ・Web上で動作するデモと Colaboratoryで動く パッケージがある https://visualblocks.withgoogle.com/ より引用
Visual Blocks for ML とは https://visualblocks.withgoogle.com/ より引用 注意点 ・Google製ではあるが、 正式にサポートされている
Google製品ではない ・このプロダクトの関心を 測ることを目的とした 実験的なリリース ・長期的なメンテナンスの 保証はない ※現時点で既にGitHubの更新はあまり活発ではない…… 正確に言うとコア部分がパブリックに開発されていないので状況が謎
1. Input node
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・静止画を入力 ・デフォルトで いくつかの テスト画像 ・アップロード も可能
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・テキスト入力 が出来る ・他ノードと 組み合わせて 重畳表示や APIの入力に
Visual Blocks for ML:Inputノード ・Input image ・Input text ・Live camera
・Webカメラを 入力画像と して利用 ・( 現時点では ) カメラの切り 替えは不可
2. Effect node
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・2つの画像を合成 ・複数の合成モード ・テキストの重畳表示
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・以下の画像処理を実行 輝度、コントラスト、 クロップ、リサイズ、 シアー、回転、ブラー ノイズ付与
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・Code editorで作成した 任意のシェーダーコード を実行
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・テキスト処理を行う - テキストの結合 - テキストの置換 - Mustacheテンプレート
Visual Blocks for ML:Effectノード ・Image Mixer ・Image processor ・Shader processing
・Text processer ・Virtual sticker ・画像と顔のランドマーク 座標を用いて、画像の オーバーレイ表示を行う
3. Model node
Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection ・Face landmark
・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・人物や(一部の)動物を 切り抜いたマスクを 取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・顔検出結果(バウンディ ングボックス、キーポイン ト)を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・顔のランドマーク検出結 果を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・ハンドジェスチャーを検 出する(エラー出る😇 Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・手のキーポイント検出結 果を取得する Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・Mobilenet(v1 or v2) を用いてクラス分類結果を 取得する Visual Blocks for ML:Modelノード① ・Body
segmentation ・Face detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・物体検出結果を取得する (モデル不明。 MobileNet-SSDLite?) Visual Blocks for ML:Modelノード① ・Body segmentation ・Face
detection ・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
・PaLMチャットを実行する ※要APIキー Visual Blocks for ML:Modelノード① ・Body segmentation ・Face detection
・Face landmark ・Gesture Recognition ・Hand pose detection ・Mobilenet ・Object detection ・PaLM Chat
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・PaLMによる文章生成を 行う ※要APIキー
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・セグメンテーション+ 深度推定結果を取得する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・姿勢推定結果を取得する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・入力テキストが有害な テキストかクラス分類を 行う
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・TensorFlow-Hub等の TFJSモデルを実行する ※前処理・後処理はTensor 操作用ノードで実施する
Visual Blocks for ML:Modelノード② ・Portrait depth ・Pose landmark ・Text Toxicity
・TFJS model runner ・TFLite model runner ・PaLM Text Generator ・TensorFlow-Hub等の TFLiteモデルを実行する ※前処理・後処理はTensor 操作用ノードで実施する
4. Output node
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・深度推定結果と画像から 3D画像を表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・物体検出などのバウンディ ングボックスを画像に重畳表 示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・クラス分類結果を表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・Tailwind CSSを用いた 簡易なHTMLを表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・複数画像を並べて 比較表示する
Visual Blocks for ML:Outputノード① ・3D Phote ・Bounding box visualizer ・Classification
Viewer ・HTML viewer ・Image comparison ・Image viewer ・画像を表示する URL指定での画像表示や 複数並べての表示も可能 ※複数表示出来ると、Image comparisonとの 差別化がイマイチ……
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・姿勢推定結果などの キーポイントと画像を 用いて可視化する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・セグメンテーションなどの マスクを用いて 切り抜いた画像を表示する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・深度推定結果を擬似カラー で表示する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・Tensorを画像に変換する
Visual Blocks for ML:Outputノード② ・Landmark visualizer ・Mask visualizer ・Tensor to
depthmap ・Tensor to image ・Tensor viewer ・Tensorの値を表示する
5. Tensor node
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensorの型を変換する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensorのクロップ、 リサイズを実行する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・画像に対し前処理を 実行してTensorへ変換する - リサイズ - 正規化
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・最小値、最大値を指定して 値の範囲をリマップする
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensor[]に対し、 インデックスを指定して Tensorを取得する
Visual Blocks for ML:Tensorノード ・Convert tensor type ・Crop and resize
・Preprocess image ・Remap value range ・Tensor picker ・Tensor to classification ・Tensor型のクラス分類の 出力を「Classification viewer」で表示できる形に 変換する
6. MISC node
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・コードを記述するノード ・言語は自由 ・このノード単体では動作 せず、 Shader processing などに接続して使用
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・Web APIを実行した結果を 取得する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・指定URLの内容を iframeとして埋め込む
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・画像のサイズを取得し json形式で出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・入力されたデータを ログ出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・文字列選択リストを 生成し、選択されている 文字列を出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・文字列を範囲選択し、 選択した内容を出力する
Visual Blocks for ML:MISCノード ・Code editor ・Custom API ・Embed webcite
・Get image size ・Logger ・String picker ・Text selector ・Url Param ・指定URLのURLパラメータ を抽出して出力する ※うまく動かない……調査中
7. Colaboratory
Visual Blocks for ML:Colaboratory ・Colaboratory 向けに visualblocks と言うパッケージが提供されている https://colab.research.google.com/github/google/visualblocks/blob/main/examples/quick_start_style_transfer.ipynb より引用
Visual Blocks for ML:Colaboratory ・Webデモとの大きな違いは、Generic関数を定義しブロックに登録できること
Visual Blocks for ML:Colaboratory
Visual Blocks for ML:Colaboratory
8. 作例
https://github.com/google/visualblocks/tree/main/pipelines/ より引用 その他にも多くの作例が掲載されている
https://github.com/google/visualblocks/tree/main/pipelines/ より引用 その他にも多くの作例が掲載されている
ご清聴ありがとうございました🙂