Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
実務で使えるOrange Data Miningの便利な機能
Search
ぶんちん
June 01, 2023
Technology
0
1.1k
実務で使えるOrange Data Miningの便利な機能
ぶんちん
June 01, 2023
Tweet
Share
More Decks by ぶんちん
See All by ぶんちん
製造業における品質不良の要因分析04_ツール選択の考え方
bunnchinn3
0
33
これまでLT振り返り 何が人気の話題?
bunnchinn3
0
53
製造業における品質不良の要因分析03_必要な知識の入手方法
bunnchinn3
0
49
製造業における品質不良の要因分析02_分析着手順の考え方
bunnchinn3
0
48
製造業における品質不良の要因分析01_ゴール設定
bunnchinn3
0
82
良書紹介02_Head First データ解析
bunnchinn3
0
43
良書紹介01_生命科学・生物工学のための間違いから学ぶ実践統計解析
bunnchinn3
0
62
OJT指導のはじめかた
bunnchinn3
0
150
自律機械知能の行動観察
bunnchinn3
0
130
Other Decks in Technology
See All in Technology
複雑性の高いオブジェクト編集に向き合う: プラガブルなReactフォーム設計
righttouch
PRO
0
110
サービスでLLMを採用したばっかりに振り回され続けたこの一年のあれやこれや
segavvy
2
390
【re:Invent 2024 アプデ】 Prompt Routing の紹介
champ
0
140
PHP ユーザのための OpenTelemetry 入門 / phpcon2024-opentelemetry
shin1x1
1
170
MLOps の現場から
asei
6
640
宇宙ベンチャーにおける最近の情シス取り組みについて
axelmizu
0
110
第3回Snowflake女子会_LT登壇資料(合成データ)_Taro_CCCMK
tarotaro0129
0
180
KubeCon NA 2024 Recap: How to Move from Ingress to Gateway API with Minimal Hassle
ysakotch
0
200
コンテナセキュリティのためのLandlock入門
nullpo_head
2
320
20241214_WACATE2024冬_テスト設計技法をチョット俯瞰してみよう
kzsuzuki
3
440
祝!Iceberg祭開幕!re:Invent 2024データレイク関連アップデート10分総ざらい
kniino
2
250
TSKaigi 2024 の登壇から広がったコミュニティ活動について
tsukuha
0
160
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
335
57k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
Designing for humans not robots
tammielis
250
25k
Designing Experiences People Love
moore
138
23k
Making the Leap to Tech Lead
cromwellryan
133
9k
Unsuck your backbone
ammeep
669
57k
Adopting Sorbet at Scale
ufuk
73
9.1k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
656
59k
Gamification - CAS2011
davidbonilla
80
5.1k
Intergalactic Javascript Robots from Outer Space
tanoku
270
27k
Done Done
chrislema
181
16k
Thoughts on Productivity
jonyablonski
67
4.4k
Transcript
実務で使える Orange Data Miningの便利な機能 ぶんちん 2023年6月1日 データサイエンティスト集会 in VRC 1
自己紹介 ぶんちん 複合経営が特徴の企業(製造業)に所属 データ分析担当者だったが。。。 成果獲得を狙うと、 同じことに繰り返しで 飽きた 他者にやらせたら、
成果が増えるのでは 特に非専門家向けのDS教育 2
Orange Data Mining ビジュアルプログラミング的にデータ分析や機械学習モデル作成・評価が可能 公式HPから入手すれば無料で使用可能 UIが素晴らしい 初心者は勉強に使おう!
専門家は手抜き・教育に使おう! 3 https://orangedatamining.com/ GUI操作で分析・モデル作成が可能 基本的な使い方は前回紹介 スライド&動画公開してます
便利な機能紹介 Orangeには様々な便利な機能が実装されています。 今回はその中から、ちょっと見ただけでは気づきそうにないけど便利なものを中心に 紹介します。 4 • 入門者向け:誰もが使える便利な機能 • 中級者向け:機械学習についてある知識がある人向けの機能 •
アドオン :特定の領域に特化した追加機能
入門者向け 基本統計量の一括出力 散布図の便利機能×2 5
入門者向け:基本統計量の一括出力 6 ← colorを指定するとグラフに反映される 基本統計量を表示したいデータと接続するだけ
入門者向け:散布図の便利機能1 7 散布図を表示したいデータと接続、 縦軸と横軸の項目を指定するだけ これだけだと普通すぎて面白くないですよね?
入門者向け:散布図の便利機能1 8 表形式で 表示するwidget マウスで範囲指定 選択したデータを抽出 散布図どころかグラフのwidgeに限らず、 全てのデータ可視化機能からGUIでデータ選択が可能
入門者向け:散布図の便利機能1 9 widgetをつなぐ線を ダブルクリック! 接続を変えると 選択有無のフラグ情報を取得可能 この機能を使ってフィルターかければ、 マウス操作で異常値の除去などが可能 即時、他の分析結果に反映できる! 注意:恣意的なデータ選択はやめよう
入門者向け:散布図の便利機能2 10 散布図を表示したいデータと接続、縦軸と横軸の項目を指定するだけ これだけだと普通すぎて面白くないですよね? ①目的変数を設定 → ← ②押す
入門者向け:散布図の便利機能2 11 ※イイ感じ順 の具体的な内容 knn(k=10)で全ての特徴量の組み合わせでモデル作成・評価 精度(オレンジ色のバー)の良い順に表示する ③押す ↓ 目的変数をきれいに説明する 縦軸と横軸の組み合わせを
イイ感じ順※に表示 カテゴリ変数や相関係数には表れない相関を扱える 非専門家向けのデータ可視化に便利!
中級者向け モデル作成のデータの前処理 異常データの除去(異常検知) 12
中級者向け:モデル作成のデータ前処理 前回の資料、説明をシンプルにするため、適切に機械学習モデルを作成するため に恣意的なことをしていました。 13 特徴量の正規化しなくても問題ない 決定木系のアルゴリズムを選択 正規化をはじめ、便利なデータ前処理機能を説明します
中級者向け:モデル作成のデータ前処理 14 モデル作成前に実施したい前処理を 順に加えて設定するだけでOK! 適用アルゴリズムの左側に Preprocessのwidgetを接続
中級者向け:異常データの除去(異常検知) 15 異常検知アルゴリズムを使い、 一定比率の異常値を簡単に除去可能 前述のwidgetの接続を変えれば、 逆に異常データの抽出も可能 適用可能なアルゴリズム • One Class
SVM • Covariance Estimator • Local Outlier Factor • Isolation Forest
アドオン ad-on(追加機能)の導入方法 特徴量重要度の算出 16
アドオン:ad-on(追加機能)の導入方法 17 導入したいアドオンにチェック 必要に応じて導入してください あまり導入しすぎると起動が重くなるので注意 例えば • 機械学習モデルの説明 • 画像処理
• 自然言語 • 時系列分析 • 生存分析 • ネットワーク分析 など 様々な領域の手法に対応
アドオン:特徴量重要度の算出 18 Explainのad-on 補足)Permutation Importanceを使ってモデルがどの特徴量から学習したかを定量化する https://www.datarobot.com/jp/blog/permutation-importance/ 機械学習モデルの特徴量重要度を Permutation Importanceで評価
ご清聴、ありがとうございました。 他にも話したいネタがたくさんあります 超初心者向け機械学習の考え方 組織の基礎レベル向上 ノーコード分析の紹介 データ分析プロジェクトの進め方ネタ
あまり知られていない良書紹介 など 今後もLTでいろんなお話をしていきたいです。 どれにするかtwitterでアンケートを考えているので、投票してもらえると嬉しいです。 詳しい内容については、個別に対応するのでお気軽にお声がけください。 Twitter:@bunnchinn3 19