Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JPOUG#10 投影資料 Oracle Machine Learningご紹介

yimanishi
October 24, 2024

JPOUG#10 投影資料 Oracle Machine Learningご紹介

2024年10月18日に開催されたJPOUG Tech Talk Night#10における15min Lightning Talkでの投影資料です。

yimanishi

October 24, 2024
Tweet

Other Decks in Programming

Transcript

  1. 突然ですが、機械学習、流行ってませんか? 4 1. 学習材料となるデータの増大 データ量の増加によってモデル精度が向上し、 より機械学習の恩恵を受けやすくなっている 2. HWの進化とCloudサービスによる低コスト化 Cloudサービス(すぐ始められる、止められる) 台頭により現実的な時間、コストで分析が可能になった。

    クイックに試行してダメなら環境を止めることでサンクコストの 削減に寄与。 3. データがビジネス価値へ繋がる機運の高まり AIやビッグデータ分析の技術が進歩し、様々なデータを運用に使 える可能性が高まっている。 4. Digital Transformation(DX)と好相性 DXと相性の良い技術はクラウド、AI/ML、ローコード。 AI/ML ローコード 開発 クラウド 迅速な 価値発見 少人数による 超高速開発 高い アジリティ データ量 時間 出典:「見えない価値」見える化 企業の真の力、AIで分析 https://www.nikkei.com/article/DGXMZO41365970W9A210C1K11000/ Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  2. Oracle Machine Learning – No License Required ! 以前は有償オプションでしたが、現在は全てのエディションで無償となりました。 クラウドの場合はクラウド利用料が発生します。

    Oracle Databaseも機械学習機能を保持 5 出典:Machine Learning, Spatial and Graph - No License Required! https://blogs.oracle.com/database/post/machine-learning-spatial-and-graph-no-license-required 全て “Y” 参考出典: Oracle Database Release19データベース・ライセンス情報ユーザー・マニュアル – 1 ライセンス情報 https://docs.oracle.com/cd/F19136_01/dblic/Licensing-Information.html#GUID-B6113390-9586-46D7-9008-DCC9EDA45AB4 マニュアルからも ご確認いただけます こちらは19c Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  3. ユースケースやシステムアーキテクチャ、スキルセットに合わせて製品を選定いただけます Oracle Machine Learning 機能ご紹介 6 Oracle Machine Learning for

    SQL Oracle Databaseの機能の一つ。 SQLで機械学習が可能なためDatabase機能との 併用が可能。既存アプリケーションへの追加が容易。 Oracle Data Miner SQL Developerの拡張機能。 GUIで機械学習ワークフローの構築が 可能。 AutoMLユーザー・インタフェース Autonomous Database の機能の一つ。 AutoML機能により、アルゴリズム選定、特徴選択、 モデルチューニングをノーコードで可能。 Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  4. ◼ 概要と活用メリット • 分析アルゴリズムはDBのカーネルに含まれており、DBサーバーのリソースを有効に活用した分析が可能 • DBからのデータの移動が不要なためDBのセキュリティを保ちつつマイニング・プロセスを簡略化し工数を削減 • SQLで実行し機械学習の実行結果を表で取得できるためアプリケーションへの実装が容易 ◼ 実行イメージ

    Oracle Machine Learning for SQLご紹介 7 DBMS_DATA_MINING.CREATE_MODEL2( model_name => ‘<作成するモデル名>', mining_function => dbms_data_mining.classification, data_query => 'select * from <学習対象の表>', set_list => v_setlst, case_id_column_name=> '<一意の列>', target_column_name => NULL); END; / SELECT <一意の列>, PREDICTION_PROBABILITY(<モデル名>, 0 USING <適用データ>) prob_anomal, --予測確率 PREDICTION_DETAILS (<モデル名>, 0 , 5 DESC USING <適用データ>) anomalous_detail -–予測の原因属性 FROM <適用対象の表>; A03423 0.93113 <Attribute name=“AAA“ … 主キー 予測確率 原因属性 モデル作成 Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  5. Oracle Machine Learningで活用可能なアルゴリズム 8 CLASSIFICATION • 決定木(Decision Tree) • (2項分類)一般化線形モデル(GLM)

    • 単純ベイズ(Naïve Bayes) • ランダム・フォレスト(Random Forest) • サポート・ベクター・マシン(SVM) • 明示的セマンティック分析(ESA) • ニューラル・ネットワーク • XGBoost* ANOMALY DETECTION • One-Class SVM • MSET-SPRT* CLUSTERING • 期待値最大化法(EM) • k平均法(k-means) • 直交パーティショニング・クラスタリング(O- Cluster) TIME SERIES • 指数平滑法 等 • (単純,、2重、Holt-Winters法、Regular & Irregular, with and w/o trends & seasonal 含む) REGRESSION • 線形モデル(LM) • 一般化線形モデル(GLM) • サポート・ベクター・マシーン(SVM) • ステップワイズ線形回帰 • ニューラル・ネットワーク • XGBoost* ATTRIBUTE IMPORTANCE • 主成分分析 • 最小記述長(Minimum Description Length) • CUR行列分解 • 教師なしペアワイズKLダイバージェンス ASSOCIATION RULES • Apriori PREDICTIVE QUERIES • 予測, クラスタ, 検知, 機能郡 SQL ANALYTICS • SQL ウインドウ関数 • SQL パターンマッチング • SQL 集計関数 FEATURE EXTRACTION • 明示的セマンティック分析 (ESA) • 非負行列因子分解 (NMF) • 特異解分析 (SVD) • 主成分分析 (PCA) • 教師無し Pair-wise KL Div ROW IMPORTANCE • CUR行列分解 RANKING • XGBoost* TEXT MINING SUPPORT • テキスト列サポートのアルゴリズム • トークン化とテーマ検出 • 明示的セマンティック分析 STATISTICAL FUNCTIONS • 基本関数:最小、最大、メジアン、標準偏 差、t検定、F検定、ピアソン分布、カイ二乗 検定、 分散分布(ANOVA)等 SQL関数:行列の選択、条件式、結合、等 * New in 21c Includes support for Partitioned Models, Transactional data and aggregations Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  6. 内容説明 ◼ デモ内容 APRIORIというアルゴリズムを用いて「トランザクションにアイテムAとアイテムBが含まれる場合、アイテムCも含まれる可 能性が高い」というルールをスーパーの購買データを例に導出する。 Oracle Machine Learning使い方例ご紹介 9 トランザクションid

    1 トランザクションid 2 トランザクションid 3 カレー粉 鶏肉 人参 じゃがいも カレー粉 ひき肉 じゃがいも トランザクションid アイテム 1 カレー粉 1 鶏肉 1 人参 1 じゃがいも 2 シチュー 2 じゃがいも 以下略 シチュー 鶏肉 じゃがいも ◼ イメージ 買い物時に1度の決済で購入した物が 同一トランザクションidを持つ ◼ 表データイメージ Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  7. Oracle Machine Learning使い方例ご紹介 10 -- モデルを作成するpl/sql DECLARE v_setlst DBMS_DATA_MINING.SETTING_LIST; BEGIN

    v_setlst('ALGO_NAME') := 'ALGO_APRIORI_ASSOCIATION_RULES'; v_setlst('ODMS_ITEM_ID_COLUMN_NAME'):= 'ITEM'; DBMS_DATA_MINING.CREATE_MODEL2( model_name => 'TRANSACTION_APRIORI_MODEL', mining_function => 'ASSOCIATION', data_query => 'SELECT id, item, uriage FROM transaction_table', set_list => v_setlst, case_id_column_name => 'ID', target_column_name => NULL ); END; / PL/SQLプロシージャが正常に完了しました。 --作成したモデルに関するビュー SELECT * FROM all_mining_model_views WHERE model_name='TRANSACTION_APRIORI_MODEL'; --アソシエーションルールの結果確認、item007に興味を持った人が50%以上の確率で興味を持つアイテムを抽出 SELECT antecedent_predicate, consequent_predicate, rule_confidence FROM DM$VATRANSACTION_APRIORI_MODEL WHERE antecedent_predicate = 'item007' AND rule_confidence > 0.5; Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  8. Converged Database のメリット • 種類の異なるデータをシームレスに管理・活用 • 運用管理コスト・工数を削減 • 一貫したセキュリティ・ポリシーとサービス・レベルを適用 さいごに

    リレーショナルデータだけではないConverged Databaseが加速するデータ分析 13 { } JSON Graph Blockchain XML Relational Spatial Oracle Database Text 空間演算子の活用 支店から半径500m 以内にいる人は? Oracle Textによる 文書群内の重要単語 抽出、類似文書分類 グラフ理論の活用 コミュニティ内の重要人物は? Aさんと購買行動の似た人は? XMLQueryによる 要素、属性の探索 機械学習機能を保持 分類、クラスタリング、 異常検出 etc Furthermore, Analysis Function Vector ベクトルによる セマンティック検索 Copyright © 2024, Oracle and/or its affiliates. All rights reserved.
  9. 1. Oracle Databaseをご利用いただいていましたら、 Oracle Machine Learning, Spatial and Graph は追加ライセンスコストなし

    2. Oracle Machine Learning の主な機能には以下があり スキルセットや環境に合わせて選択いただける • PL/SQLとSQLで完結するOracle Machine Learning for SQL • GUIでデータのフローやモデル構築ができるOracle Data Miner • ノーコードでモデル構築ができるAuto ML User Interface(Autonomousのみ) 3. Oracle Databaseはリレーショナルデータだけでなく、グラフ構造や自然言語、地理空間、ベクトルも 扱える Take away 14 Data MinerやAuto MLについてご興味を持っていただけましたら ぜひググってください!色々ナレッジあります。 Copyright © 2024, Oracle and/or its affiliates. All rights reserved.