Upgrade to Pro — share decks privately, control downloads, hide ads and more …

【Showcase】データベース技術者のための機械学習入門

 【Showcase】データベース技術者のための機械学習入門

下記セミナーにて使用した資料です。

2022/05/20実施
Oracle Developer Day 2022 - Spring
14:15-16:15【Showcase】 データベース技術者のための機械学習入門

内容:
機械学習に深く精通していなくても機械学習をシステムに取り入れることができるのがAutoMLです。
実はAutonomous Databaseには、AutoMLがツールとして付随しています。
本セッションでは、実環境を使用したデモンストレーションを通じてAutonomous Databaseの作成から、GUI操作で簡単に行うデータのロード、付随するAutoMLを利用した分析を体感していただきます。
いまや幅広い分野で利用されている機械学習、データベースからはじめてみませんか。

 ■スケジュール
 Autonomous Database 概要説明 (20分)
 デモ / 解説: Autonomous Database 作成 ・ データのロード (40分)
 デモ / 解説: AutoML (60分)

登壇者:
Sara Shatari / Ryunosuke Deguchi
日本オラクル株式会社
クラウド・エンジニアリング統括
COE本部
Autonomousソリューション部
クラウド ソリューション
エンジニア

URL:
https://developer.oracle.com/jp/developer-days-2022-may/#dbday-tab2

3115a782126be714b5f94d24073c957d?s=128

oracle4engineer
PRO

May 20, 2022
Tweet

More Decks by oracle4engineer

Other Decks in Technology

Transcript

  1. 【Showcase】 データベース技術者のための機械学習入門 捨田利 沙羅 / 出口 龍之介 Cloud Solution Engineer

    Oracle Corporation Japan May. 20th, 2022 # oradev22
  2. Copyright © 2022, Oracle and/or its affiliates 5 14:15 【データの準備】Autonomous

    Database を使ってみよう (70分) Autonomous Database 概要説明 Showcase: Autonomous Database 作成 ・ DBの各種操作 15:30 【モデル構築・評価/デプロイ】 – AutoML UI (45分) AutoML UI 概要説明 Showcase:AutoML UIを使用した予測モデルの作成・アプリの作成 *セッションやデモの進行状況によって多少終了時間が前後する場合がございます。 Agenda
  3. 機械学習とは Copyright © 2022, Oracle and/or its affiliates 機械学習(きかいがくしゅう、英: Machine

    Learning)とは、 経験からの学習により自動で改善するコンピューターアルゴリズムもしくはその研究領域で、人工知能の一種であるとみなされ ている。 「訓練データ」もしくは「学習データ」と呼ばれるデータを使って学習し、学習結果を使って何らかのタスクをこな す。 例えば過去のスパムメールを訓練データとして用いて学習し、スパムフィルタリングというタスクをこなす、といった事が可能となる。 https://ja.wikipedia.org/wiki/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92 Wikipedia:機械学習 より引用 機能的には、 データから学習されたプログラムを生成、利用する 6
  4. 機械学習のプロセス Copyright © 2022, Oracle and/or its affiliates データ準備 モデル構築

    モデル評価 デプロイ データ準備 有用なデータを探索し、持ってきて、 データ変換等を行うことでモデル構築 用のデータを生成する モデルの評価 精度やモデルの内部を確認し、解釈する 等の作業を通して、モデルが目的に対して 適切なものであるか、利用に耐えるもの であるかを判断 事業への適用 機械学習モデルをシステムに組み込むこと で実現することが多い 7
  5. 機械学習のプロセス Copyright © 2022, Oracle and/or its affiliates データ準備 モデル構築

    モデル評価 デプロイ 分析、データ理解: データ連携・集計 データ変換処理: データ型を揃える 等 データ抽出: 必要なデータのみを抽出 データ準備 有用なデータを探索し、持ってきて、 データ変換等を行うことでモデル構 築用のデータを生成する 8
  6. 機械学習のプロセス Copyright © 2022, Oracle and/or its affiliates データ準備 モデル構築

    モデル評価 デプロイ 分析、データ理解: データ連携・集計 データ変換処理: データ型を揃える 等 データ抽出: 必要なデータのみを抽出 データ準備 有用なデータを探索し、持ってきて、 データ変換等を行うことでモデル構 築用のデータを生成する 80%の時間がデータの準備/検索/管理に費やされている → Autonomous Databaseを使って作業の負担を軽減可能 80% 9
  7. Copyright © 2022, Oracle and/or its affiliates 10 Autonomous Database

    • Autonomous Database • Showcase Autonomous Database DB
  8. Copyright © 2022, Oracle and/or its affiliates Oracle Database デプロイメント選択肢

    様々なシステム要件に対応 Most Manual Most Autonomous 汎用サーバ上に Databaseを インストール Exadataに Databaseを構成 IaaS上に Databaseを インストール Autonomous Database (Shared or Dedicated) DBCS - BM/VM Exadata Cloud Service Or Exadata Cloud at Customer Oracle Cloud Infrastructure On Premise 11
  9. Copyright © 2022, Oracle and/or its affiliates シングル・データ・プラットフォームがデータドリブン実践の鍵 従来 理想

    • 散在するデータ、複雑なデータ配置 • 複雑なデータ活用、価値提供の鈍化 • 多大なセキュリティリスク、運用保守コスト • 集約され、一貫性のあるデータ • 市場変化に追従する、鮮度のよいデータ活用 • 一元化されたセキュリティ、シンプルな運用保守 データタイプ、機能別のデータサイロ 集約された、シングル・データ・プラットフォーム =コンバージドデータベース 基幹システム SaaS 新規アプリ 基幹システム SaaS 新規アプリ 12
  10. Copyright © 2022, Oracle and/or its affiliates オラクルが提供するシングル・データ・プラットフォーム 構造化 データ

    JSON キー バリュー 地理情報 グラフ ファイル あらゆるデータタイプとワークロード に1つのデータベースで対応 ブロック チェーン JSON ハイパー スケール 機械学習 地理情報 グラフ 永続化 メモリ インメモリ アナリティクス マルチ テナント Cloud Integration インメモリ IoT オンプレミス Oracle Autonomous Database Oracle Exadata Cloud Oracle Exadata Cloud @Customer コンバージド機能 シングル・データ・プラットフォーム =コンバージドデータベース 企業内の様々なデータ 13
  11. Low-code Oracle Autonomous Database 14 Copyright © 2022, Oracle and/or

    its affiliates 14
  12. Autonomous Databaseの完全な柔軟性 1 CPU単位+無停止+自動でスケーリング 負荷状況を判断し、自動的にリソースの拡張・縮小を無停止で実施します 1 CPU単位で拡張・縮小を行い、秒単位で課金されます 0 4 8

    CPU 6時 12時 18時 24時 翌6時 日中時間帯のスパイクに対応 夜間バッチの高負荷に対応 16 実際に利用しているリソース Autonomous Database ~ ~ 0 4 8 6時 12時 18時 24時 翌6時 16 実際に利用しているリソース 課金対象のリソース 他社データベース・サービス 柔軟性が欠如している ため、クラウドにも関わら ず、ピークに合わせたサイ ジングが必要 ~ ~ シェイプ単位での拡張のみ システム再起動が必要 Copyright © 2022, Oracle and/or its affiliates 15
  13. お客様は機械学習が実現する自動化の効果を実感 Autonomous Databaseがもたらす運用自動化の効果 “Autonomous Data Warehouse Cloudにより Hertzは運用コストを 削減し、その分を我々の顧客サービ スやリワードの拡充に振り向けること

    が可能になります” “パフォーマンスの一貫性は多くのビジネ スユーザーにとって重要です。 Autonomous Data Warehouse Cloudによって人的ミスによるクエリー・ パフォーマンスへの影響を排除すること が可能になります。” “人間が生きるに当たって時間がすべ てです。Autonomous Data Warehouse Cloudが自分自身で チューニングを行いダウンタイムがない ことは我々にとっても我々の患者に とっても重要なことです。” 運用に人手をかけない 人的ミスがなく安心 チューニング不要 Copyright © 2022, Oracle and/or its affiliates 16
  14. Autonomous Database 完全な自動化によるデータ管理の効率化/コストの削減 Software Cost Labor Cost Storage Cost Server

    Cost Facilities Cost *Source: Oracle TCO report 2018. 50% savings calculated based on 16 CPU config w/BYOL from on-premises Oracle Database 管理コストを最大80%、TCOを3年間で最大50%削減 ファシリティ管理 サーバー管理 OSインストール/パッチ適用 DBインストール/パッチ適用 バックアップ/リストア HA/DR DB最適化/スケール AP最適化 AP管理 ファシリティ管理 サーバー管理 OSインストール/パッチ適用 DBインストール/パッチ適用 バックアップ/リストア HA/DR DB最適化/スケール AP最適化 AP管理 $877K $431K Autonomous Database お客様管理 お客様管理 オラクル管理 On-Premise Copyright © 2022, Oracle and/or its affiliates 17
  15. Copyright © 2022, Oracle and/or its affiliates アプリケーション開発を強力にサポートするツール群 インスタンスを作成すれば、すぐに利用可能 機械学習アナリティクス

    Notebook / AutoML UI ビジネスインテリジェンス Oracle Analytics Desktop Webアプリ開発 Application Express : APEX API開発 Oracle Rest Data Services データ操作 Database Actions Service Console SQL Monitor / Performance Hub グラフDB開発 Graph Studio 18
  16. Autonomous Database 価格体系 フルマネージドのExadataを安く利用可能 CPU、ストレージのサイズを個々に設定 • OCPU:1 OCPU単位で秒課金 • 1

    OCPUを1時間利用した場合:約161円 • ストレージ : 1 TB単位で秒課金 • 1TB を 1カ月利用した場合:約14208円 従量課金制 • 最低1分からスタート可能 • 1分を超えた利用については秒単位で課金 • 一時的なスケールアップに対するコストを抑制 • テストのための一時利用を必要最低限のコストで対応 • お手持ちのOracle Database ライセンスの持ち込みも可能(BYOL) 初期費用なし ピーク時は 秒単位で拡張 拡張時は 無停止で即時適用 * 料金:2022/1 現在 Copyright © 2022, Oracle and/or its affiliates 19
  17. 1 OCPU(2vCPU)/ストレージ 1TB/Backup 60日間分含む 24時間31日間(744時間) Autonomous Database: 見積もり例 サービス名 数量

    単価 単位 費用 1 Oracle Autonomous Data Warehouse Oracle Autonomous Transaction Processing 1 ¥161.292 1時間/OCPU ¥120,001 (744時間) 2 Oracle Autonomous Database - Exadata Storage 1 ¥14,208 1ヶ月/TB ¥14,208 合計 ¥134,209 * その他の費用:Data Transfer (Outbound) 等 * As of June 2021 見積りサイト https://cloud.oracle.com/ja_JP/cost-estimator Copyright © 2022, Oracle and/or its affiliates 20
  18. Globalで100社を超える顧客事例、日本国内で20社を超える顧客事例 Copyright © 2022, Oracle and/or its affiliates 21

  19. Copyright © 2022, Oracle and/or its affiliates Autonomous Databaseの革新を体験いただいたお客様の声 お客様

    用途 比較対象 結果 コメント Propre Japan 不動産情報 ビッグデータ基 盤 インメモリDB on AWS EC2 83秒→0.7秒 (99%短縮) データを移行しただけでチューニングをしていない状態で高い性能が得られた ことは衝撃的でした。稼働開始後の運用においても、チューニングが必要な いこと実感しています。運用管理が自動化されたことで新サービスの検討や 開発に注力できるようになりました オカムラ 全社データ分 析基盤 オンプレミス 他社DWH レスポンスタイム 最大60分の1 コスト36%削減 従来のデータベース環境と比較して少ないリソースで高いパフォーマンスを実 現しています。具体的には、バッチ処理で平均1.5倍に性能が改善したほか、 BIのレスポンスタイムを最大60分の1に短縮しています。また年額費用は約 36%削減しており、コスト最適化も果たしています。レスポンスの高速化によ り従業員のレポート作成時の作業効率向上にもつながっています。 ファンコミュニ ケーションズ アフィリエイト サービスのデー タ管理基盤 AWS RDS for Oracle コスト約5分の1 高性能とAIによる運用の自動化を実現したOracle Autonomous Database Cloudは、まさに究極のデータベースと言っても過言ではありませ ん。今、振り返ると、その存在になぜもっと早く気付けなかったのかと悔しくてな りませんね ベネフィット・ワ ン 会員データ分 析 Excel 2-3時間 -> 15分 従来 2~3 時間を費やしていた集計業務をわずか 15 分に短縮 会員の流入動向などの把握が月次または週次から日次ベースへ ピー・ビーシステ ムズ(ダリア) 販売管理 データの分析 基盤 AWS RDS for Oracle 95%短縮 コスト20%削減 パフォーマンスはもちろんのことコスパも大きく向上することを確認できましたの で即ADWを採用しました。ADWのパフォーマンスと可能性には大きな期待 をしております 22
  20. Forth Corporation, Thailandとその子会社であるForth Smart Corp.は、プリペイド携帯電話の充電、銀行送金、公共 料金の支払い、モバイルゲームの支払いなどの金融サービスを提 供する12万台以上のキオスクを運営しています。 Forth Smart社は、データベース内のOracle Machine

    Learningを使用して、MLモデルの構築、評価、展開にオラクル の既存の投資を活用しながら、事業範囲を拡大し、新しい機会 を模索しています。 Oracle Machine Learningを使用することで、Forth Smart は90%もの精度でターゲットを絞ることができ、コンバージョン数 が3倍になったことを確認しました。 Oracle Database と Oracle Machine Learning で新しい顧客を獲得 Copyright © 2021, Oracle and/or its affiliates 25
  21. Copyright © 2022, Oracle and/or its affiliates 26 Autonomous Database

    • Autonomous Database • Showcase Autonomous Database DB
  22. Autonomous Database ワークロード/デプロイメント方式 ORACLE AUTONOMOUS DATABASE Autonomous Data Warehouse (ADW)

    Autonomous Transaction Processing (ATP) Shared Exadata Infrastructure Dedicated Exadata Infrastructure ワークロード デプロイメント ( /DWH) (OLTP/ ) ( Pluggable Database) ( OCI or C@C*) * C@C: Oracle Cloud@Customer(お客様データセンターでのOCI提供サービス) Autonomous JSON Database (AJD) (JSON ) APEX Application Development (APEX ) Copyright © 2022, Oracle and/or its affiliates 27
  23. Copyright © 2022, Oracle and/or its affiliates アプリケーション開発を強力にサポートするツール群 インスタンスを作成すれば、すぐに利用可能 機械学習アナリティクス

    Notebook / AutoML UI ビジネスインテリジェンス Oracle Analytics Desktop Webアプリ開発 Application Express : APEX API開発 Oracle Rest Data Services データ操作 Database Actions Service Console SQL Monitor / Performance Hub グラフDB開発 Graph Studio 28
  24. Copyright © 2022, Oracle and/or its affiliates Database Actions データベース・アクション

    Oracle Databaseの各種操作に慣れていない方におすすめ • より高度なクライアントツールを導入する前の、事前ステップとしても活用可能 SQL Developer Webの後継ツールとして、GUIで様々な操作が可能 • 開発:SQL実行、RESTデータサービスの操作、データモデル図の生成、JSONデータの操作 • データ・ツール:データのロード(一括、自動)、データ・インサイト、カタログ • 管理:データベースユーザのパスワード管理、領域管理 など 参考資料 • 「Speakerdeck Database Actions」で検索ください 29
  25. / – AutoML UI • AutoML UI • Showcase AutoML

    UI
  26. Oracle Machine Learning – “AutoML UI”とは ポイント:予測することで正しい対応を可能にする <What> 過去のデータから未来を予測したいときに、機械学習を使って、 予測モデルを作成し活用することができるOracle

    Databaseの機能。 クリックだけ(GUI)で予測モデルを作成することができる製品。 <Differentiation> Autonomous Databaseを作成するだけで、 Autonomous Databaseの中に、機械学習に必要な環境がー気に揃う。 <Case Study> ・ 在庫に関する悩みを抱えているお客様が、来月の在庫を予測 ・ 購買行動を増やすために、顧客分析と機械学習で個人個人に効果的なクーポンを予測 ・ コンバージョン率を上げるために、個人個人に効果的な広告を予測 etc…… Copyright © 2022, Oracle and/or its affiliates 31
  27. 機械学習を組み込んだシステム構成図の1例 環境構築の工程が多く 手間がかかる 必要なスキルが多く 手順のミスが発生することも • 予測結果を見える化させるためシステム構築が必要 • Webのサーバサイドのスキルが必要なるケースも •

    検証とモデル再構築のために分析用サーバが必要 • 工程が多いので手順のミスや ローカル環境の違いで失敗することも • 本番環境へのモデルのデプロイには様々な作業が必要 データ分析 機械学習 データベース WEBアプリ データ収集 予測モデル ユーザ 予測モデル 予測モデル 外部データ Copyright © 2022, Oracle and/or its affiliates 32
  28. 機械学習を組み込んだオラクルのシステム構成図の1例 Autonomous Databaseを 立てたら環境が出来上がる! SQLのみで機械学習も可能 • 機械学習の流れがOracle Databaseで 完結するため、システム構築が不要 •

    Webサーバを立てる必要なし • 検証とモデル再構築のために分析用サーバは不要 • DBスキルと分析スキルで機械学習に集中 • 本番環境へのモデルのデプロイも簡単 • 工程が少ないので手順のミスやローカル環境の違い でのミスを誘発しづらい データ分析 機械学習 データベース WEBアプリ データ収集 予測モデル 外部データ Autonomous Database ユーザー Copyright © 2022, Oracle and/or its affiliates 33
  29. / – AutoML UI • AutoML UI • Showcase AutoML

    UI
  30. Oracle Machine Learning (OML) ショーケースの流れ 本日のデモでは、kaggleのチュートリアルとして有名な 「wine quality」(ワインの品質判定)を用います。 アルコール(alcohol)や酸性度(fixed acidity)

    などのワインの中の成分から品質を評価するものです。 <今の状態> ワインの成分に関する下記の2つのcsvファイルをDatabaseにロード済み • TRAIN表(機械学習モデルを作成するための学習用データセット) • TEST表(機械学習モデルが実際に予測を行う未知のデータセット) <ハンズオンの流れ> 1. AutoML UIで自動で品質予測モデルを作成 2. 予測モデルで品質予測を行うViewを作成(OML Notebook活用) 3. APEXで品質予測のアプリケーションを構築 Copyright © 2022, Oracle and/or its affiliates 35
  31. Oracle Machine Learning (OML) ショーケースの流れ Copyright © 2022, Oracle and/or

    its affiliates 度数, 酸性度, クエン酸, 塩化物, 密度… 品質良いor普通 TRAINデータ AutoML UI 予測モデル作成 36
  32. Oracle Machine Learning (OML) ショーケースの流れ Copyright © 2022, Oracle and/or

    its affiliates 度数, 酸性度, クエン酸, 塩化物, 密度… TESTデータ AutoML UI 品質良い 品質普通 37
  33. Oracle Machine Learning (OML) ショーケースの流れ 本日のデモでは、kaggleのチュートリアルとして有名な 「wine quality」(ワインの品質判定)を用います。 アルコール(alcohol)や酸性度(fixed acidity)

    などのワインの中の成分から品質を評価するものです。 <今の状態> ワインの成分に関する下記の2つのcsvファイルをDatabaseにロード済み • TRAIN表(機械学習モデルを作成するための学習用データセット) • TEST表(機械学習モデルが実際に予測を行う未知のデータセット) <ハンズオンの流れ> 1. AutoML UIで自動で品質予測モデルを作成 2. 予測モデルで品質予測を行うViewを作成(OML Notebook活用) 3. APEXで品質予測のアプリケーションを構築 Copyright © 2022, Oracle and/or its affiliates 38
  34. お客様の声 ポイント:手軽さ、データベース内機械学習、費用感 手軽さに関して • 「AutoML UIで初学者の登竜門とされる0.85を超える精度が出るのは驚いた」 • 「本来売上があるはずだった値をきちんと予測してくれている」 • 「AutoML

    UIのUIは分かりやすくて取っ付きやすくて良い」 データベース内機械学習に関して • 「IN Databaseのコンセプトは、刺さるお客さんには物凄く刺さる製品」 • 「データベースで完結しているため環境構築やデプロイも楽にできるのは、助かる」 費用感に関して • 「Autonomous Databaseを活用している/活用予定場合、OCPU数だけの課金で簡単に機械学習を始められる」 • 「機械学習の競合と比較したときに、Oracle Databaseを既に使っているためOML活用は安く済むから良い」 Copyright © 2022, Oracle and/or its affiliates 39
  35. Copyright © 2022, Oracle and/or its affiliates 40

  36. 新時代のデータベース・サービス Autonomous Database 実績のあるOracle Database / Exadata が基盤 高性能・高可用性・高セキュリティが実装済み AI/機械学習を利用した完全自動運用

    様々なツールが無償で同梱、DBで完結 完全な マネージド サービス 1CPU単位でCPUを無停止で増減可能 ワークロードに応じた自動増減も可能 CPU/ストレージは1秒単位で課金 完全な 柔軟性 あらゆるワークロード(OLTP/分析/混在) あらゆるデータタイプ(構造化/JSON/グラフ等) 1つのデータベースで対応可能 完全な マルチモデル Copyright © 2022, Oracle and/or its affiliates 41
  37. 本日実施いただいた内容 • サービス概要の理解 • データベース・インスタンスの作成、接続 • データベースへのデータ投入 • CSVファイルからWebアプリケーションを作成 •

    機械学習ツールの利用体験 簡単すぐに様々なデータベース運用、およびアプリ開発ができる Copyright © 2022, Oracle and/or its affiliates 42
  38. Oracle Cloud Infrastructure 技術情報 ・OCIのサービス概要/詳細資料 を公開 ・動画によるデモなど ・実際のOCI上での操作をステップ バイステップで解説 ・入門から応用レベルまで豊富

    ・100種類以上のワークショップ ・具体的な操作性を完全無償 で体感 ・リファレンスアーキテクチャ ・Solution PlayBooks ・Terraform サンプルスクリプト 参考資料 OCI 活用資料集 OCI チュートリアル OCI Architecture Center Oracle LiveLabs テナントを用意せずとも実際の環境を触って使用感が確認可能 ベストプラクティスやリファレンスアーキテクチャが参照可能 OCI上の主要なサービスの概要・機能をまとめた資料集 リソースの作成やその活用方法など実際の操作手順を体得 Copyright © 2022, Oracle and/or its affiliates 43
  39. Copyright © 2022, Oracle and/or its affiliates 44 Thank you

  40. Copyright © 2022, Oracle and/or its affiliates 45 アンケートのご協力をお願いします イベント終了後(Zoom

    退室後)、ご使用のブラウザにアンケートページに移動するか否かの確認画面が表示されます。 ぜひ、「続行」を押していただき、アンケートにご協力をお願いします。 https://bit.ly/DBSC-0520 Copyright © 2022, Oracle and/or its affiliates 45
  41. Copyright © 2022, Oracle and/or its affiliates 46 Developer Days

    2022 Spring 【Showcase】 データベース技術者のための機械学習入門 ご参加いただきありがとうございました! 本セッションは終了しました