Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
IBM Dojo はじめてのCloud Pak for Data
Search
noricokt
July 21, 2021
Education
2
530
IBM Dojo はじめてのCloud Pak for Data
Cloud Pak fot Dataをはじめて利用される方に向けた超入門ガイド
CSVファイルから分析ダッシュボードを作成するハンズオンの資料を含みます
noricokt
July 21, 2021
Tweet
Share
More Decks by noricokt
See All by noricokt
巣ごもりご飯に悩まないクロールエンジンを作ろう
norikokato
0
530
IBM Cloud AIサービスのいろは
norikokato
0
250
30分で作る翻訳アプリ Node-RED & IBM Cloud
norikokato
0
410
はじめてのクラウド
norikokato
0
250
IBM Cloud Education
norikokato
0
430
Twitterでサンバーストチャートを作ろ
norikokato
0
210
2020冬のDojo_クラウド入門0115.pdf
norikokato
0
640
Openshift(Minishift) workshop 101 20191203
norikokato
0
410
秋のDojo #1 クラウド入門
norikokato
0
730
Other Decks in Education
See All in Education
勉強したらどうなるの?
mineo_matsuya
10
6.5k
Qualtricsで相互作用実験する「SMARTRIQS」実践編
kscscr
0
290
Canva
matleenalaakso
0
430
Epithelium Flashcards
ndevaul
0
1k
学習指導要領から職場の学びを考えてみる / Thinking about workplace learning from learning guidelines
aki_moon
1
710
RSJ2024学術ランチョンセミナー「若手・中堅による国際化リーダーシップに向けて」資料 (河原塚)
haraduka
0
220
Chapitre_1_-__L_atmosphère_et_la_vie_-_Partie_2.pdf
bernhardsvt
0
200
20241002_Copilotって何?+Power_AutomateのCopilot
ponponmikankan
1
160
ACT FAST 20240830
japanstrokeassociation
0
330
老人会? いえ、技術継承です @ builderscon 2024 LT
s3i7h
0
110
Image Processing 1 : 1.Introduction
hachama
0
280
The Gender Gap in the Technology Field and Efforts to Address It
codeforeveryone
0
210
Featured
See All Featured
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
A Philosophy of Restraint
colly
203
16k
The World Runs on Bad Software
bkeepers
PRO
65
11k
GraphQLとの向き合い方2022年版
quramy
43
13k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
730
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
Scaling GitHub
holman
458
140k
Navigating Team Friction
lara
183
14k
Designing for Performance
lara
604
68k
Practical Orchestrator
shlominoach
186
10k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
27
4.3k
Transcript
IBM Tech Dojo はじめてのCloud Pak for Data Noriko Kato Customer
Success Manager Federated Developer Advocate 2021/07/21 #IBMDojo
Group Name / DOC ID / Month XX, 2018 /
© 2018 IBM Corporation 2 Customer Success Manager Federated Developer Advocate
学習の⽬的とゴール ⽬的 Cloud Pak for Data の特徴を知る ゴール Cloud Pak
for Data の基本機能が使える 機能のヘルプやサンプルが確認できる このコースを学ぶ⽅の想定スキル Cloud Pak for Dataを初めて利⽤する⽅ PCの基本操作が可能な⽅ 3
⽬次 1.IBM Cloud Paks を知ろう Cloud Paks できること 2.Cloud Pak
for Data 機能紹介 3.ハンズオン 画⾯のメニューと操作⽅法 4.おすすめ情報 ツール・Dojoコース紹介 4
1.IBM Cloud Paks を知ろう 5
1.IBM Cloud Paks を知ろう 6 ハイブリッドクラウド向けAIを 搭載したソフトウエア
1.IBM Cloud Paks を知ろう 7 特徴(機能) ü IBM WatsonでビジネスにAIを適⽤ ü
データとAIを活⽤した予測 ü プロセスの⾃動化 ü セキュリティー統合と管理の可視化 ü シームレスなコラボレーションによる効率向上
1.IBM Cloud Paks を知ろう 8 特徴(環境) ü Red Hat OpenShiftに構築可能
ü IBM Cloud , AWS, Azure などクラウドで使える ü オンプレミス環境に構築可能
1.IBM Cloud Paks を知ろう 9 6つのソリューションでビジネスクラウドの開発管理を強⼒に⽀援 Cloud Pak for Data
• 収集 • 編成 • 分析 • 機能を統合し 簡素化 • データを洞察に 転換 Cloud Pak for Business Automation • ワークフロー • RPA • 意思決定支援 • ビジネスの核の 変革 • 柔軟な拡張性 Watson AIOps • 説明可能なAI • インシデント評価 • イベント影響予測 • 障害予測 • AIによるリスク 軽減 Cloud Pak for Integration • システム連携 • ライフサイクル 自動化 • API管理 • 高速転送 • 運用の俊敏性を 向上 Cloud Pak for Security • リスクの発見と 意思決定支援 • データ移行回避 • マルチクラウド 環境下のツール 統合 • ワークフロー連携 Cloud Pak for Network Automation • ネットワーク 運用自動化 • ゼロタッチ運用化 • サービス迅速化 • インテント駆動 型オーケスト レーション
1.IBM Cloud Paks を知ろう 10 n データ n ビジネス・オートメーション n
Watson AIOps n インテグレーション n ネットワーク⾃動化 n セキュリティー 詳細はこちら︓https://www.ibm.com/jp-ja/cloud/paks オープン・迅速・高信頼性を 備えたモダナイゼーションと クラウドへの移行を支援
2.Cloud Pak for Data 11 Cloud Pak for Data は、あらゆるデータニーズに対応するオールインワンのプラットフォームです。
Cloud Pak for Data は、アーキテクト、データサイエンティスト、開発者、データスチュワードの 間のサイロを排除しようとしています。Cloud Pak for Data は、データの収集、整理、分析、活⽤ のためのパイプラインを作成することで、作業を効率化するのに役⽴ちます。
2.Cloud Pak for Data 12
2.Cloud Pak for Data 13 データ活⽤を加速させるプラットフォーム例 Data Access & Insights
Services カタログ データレイク レポジトリ データ仮想化 データアクセス (SQL / APIs) Knowledge Catalog (データアセット, ポリシー & ルール, 来歴, ….) データ利⽤側 データ統合 データ移⾏ データレプリ ケーション データの ⾃動分類 マスキング ⾃動化 プロファイル ⾃動作成 情報資産 ⾃動検出 データ 探索 キャッシング オプティマイザー • データプライバシー ルールの適⽤ • ビジネス⽤語との 関連づけ • 仮想アセット の公開 接 続 アセット ブラウザ グローバル サーチ データ プレビュー データ アクセ ス IBM Cloud Pak for Data コンプライアンス レポート Discovery & Exploration セルフサービス アナリティクス BI レポート, ダッシュボード ビジネス アプリケーション AI, ML & 最適化 トランザクション ・システム & 基幹業務 アプリケーション • Cloud • ソーシャルメディア • ⾮構造化 • その他外部データ • IOT • Systems of Record • ログ • … サンド ボックス データ ウェアハウス Cloud データソース NoSQL オブジェクト ストア フラット ファイル データ提供者の視点 データ利⽤者の視点 仮想DB 仮想コピー
ユーザー データソース 2.Cloud Pak for Data データ仮想化 14 仮想的データ統合で物理的に集めることなく、データ照会や演算処理を⾼速化します。データレイク、データウェアハウス、 データマートがそれぞれ別のテクノロジーに格納された形式であっても、IBM
Cloud Pak for Dataが提供する接続アダプ ターにより、分析者からはシームレスにアクセスできます。 Cloud Pak for Data アプリ モバイル 分析 ツール BI Web サービス インターフェース 仮想化機能 キャッシュ クエリー最適化 接続アダプター カタログ (データの⼀覧化 所在の確認) パフォーマンスとの トレードオフを 考慮したフェージング 複数のデータソースに対してシングルアクセスを実現 サンドボックス データ ウェアハウス クラウド上の データ ソーシャル ビッグデータ CSV ファイル オフライン データ データ マート IBM Cloud AWS Azure ビジネス⽤語 セキュリティー
データ仮想化の特⻑ 多数のデータソースに対応 • Oracle、Db2、SQLServer、Informix、Netezza、 MySQL、PostgreSQL、Big SQL、Apache Hive、 HDP Hive、Snowflake、Cloudera Impala等
スキーマ探索とフォールディング • システム間で共通のスキーマを⾃動的に検出し、これを データ仮想化で単⼀のスキーマとして⾒る事が可能 Cloud Pak for Dataサービスとの連携 • Watson Knowledge Catalogと連携し、仮想化された データをカタログへ公開し、共有する事が可能 • 分析ツール(Cognos、Watson Studio等)を介したア クセス セキュリティ • アクセス制御 • 通信暗号化 豊富なアプリケーション機能 • 好みのSQLツールを使⽤して、Data Virtualizationに 接続する事が可能 • Rstudio、Jupyter Notebook、Cognos、Tableau、 MicroStrategy シンプルなビュー結合 • 実データ、データウェアハウス、データマート等の様々な種 類の分散しているデータベースを跨いでテーブル/ビューを 作成する事が可能 1 2 3 4 5 6 クラウド オンプレ CP4D上で 仮想 VIEW作成
2.Cloud Pak for Data 16 カタログとデータ仮想化の連携 カタログ上で⼀度紐付けしたテーブルの列名とビジネス⽤語をデータ仮想化の機能を使って、ビジネス⽤語でデータを提供 することも可能です。マスキングしたデータを仮想化を通して、実際のデータを加⼯・コピーすることなくマスキングした ままデータを提供することも可能です。 テーブルの列名を仮
想化で別名をつける ことも可能です。 紐付けされたビジネ ス⽤語。 紐付けされたビジネ ス⽤語に列名を⼀括 変換
2.Cloud Pak for Data 17 アクセス管理 データ仮想化オブジェクト単位でアクセス権限管理が⾏えます。 Cloud Pak for
Dataは データ仮想化の機能も 提供しています 複数のデータソースに対して、 仮想表を作成できます 仮想表に対してアクセスできる ユーザーを指定します
2.Cloud Pak for Data 18 仮想化によるシングルアクセスメリット データ仮想化は、複数のデータソースに対してシングルアクセスを提供します。これにより、ソースデータのテーブル名・ 列名を分かりやすい名称で提供することが可能で、かつ、ユーザーの認証/アクセスの設定を仮想表に対して⾏うことができ ます。データ仮想化で⼀元的にアクセス設定を⾏う運⽤をとることができます。 ユーザーA
ユーザーB ユーザーA ユーザーB 認証 情報 認証 情報 認証 情報 認証 情報 認証 情報 認証 情報 認証 情報 認証 情報 仮想表 アクセス許 可ユーザー • ユーザーA • ユーザーA • ユーザーB • ユーザーB • ユーザーA • ユーザーB 認証 情報 認証 情報 提供者 提供者 • DB毎/テーブル毎に 細かな認証情報を設定 • DB側での作業も発⽣ • 与えられた複数 の認証情報を ⾃分で管理 • 仮想ビューに対し、アクセスを 許可するユーザーを設定するのみ • DB側の追加設定作業は発⽣せず • 仮想的にひとつのDBに ひとつの認証情報でアク セス • アクセス許可されたもの だけ利⽤可能 テーブル MEMBER テーブル 会員情報 テーブル A001 テーブル 保守情報 テーブル B001 テーブル 障害情報 テーブル MEMBER テーブル A001 テーブル B001 • 名前もわかりに くい • 理解しやすい名称
2.Cloud Pak for Data 19 データ提供⽅法 実際に公開可能な場所にデータをコピーしたり、データ加⼯が必要なケースはETLなどで実データを作成します。すでに公開可能データ が存在する場合、データ仮想化機能とデータカタログ機能の連携により、必要なデータへの迅速なアクセスを実現します。データ仮想 化機能を利⽤すると複数データをコピーする事なく、切り⼝を変えてデータ提供することも可能になります。 …
Hadoop データ提供サービス データレイク レポジトリ データ利⽤側 データ統合 データ移⾏ データレプリ ケーション 接 続 IBM Cloud Pak for Data コンプライアンス レポート データ探索 & 可視化 セルフサービス アナリティクス BI レポート, ダッシュボード ビジネス アプリケーション AI, ML & 最適化 IBM Cloud トランザクション・ システム & 基幹業務 アプリケーション • Cloud • ソーシャルメディア • ⾮構造化 • その他外部データ • IOT • Systems of Record • ログ オンプレミス • … データ ウェアハウス Cloud データソース NoSQL オブジェクト ストア フラット ファイル 直接提供 ⼀部仮想化して提供 ⼀部仮想化して提供 データ加⼯して提供
2.Cloud Pak for Data 20 AI
2.Cloud Pak for Data 21 ストレージ データ・ガバナンス ダッシュボード
2.Cloud Pak for Data 22 データ・ソース
2.Cloud Pak for Data 23 分析
2.Cloud Pak for Data 24 業種別ソリューション 開発者ツール
3.ハンズオン 25 ログイン ご案内したURLからユーザーとパスワードを⼊⼒しログインする
3.ハンズオン 26 プロジェクト作成 ログイン後、左メニューから①すべてのプロジェクトを選択、②新しいプロジェクト、③次へ をクリックする ① ② ③
3.ハンズオン 27 プロジェクト作成 ログイン後、左メニューから①空のプロジェクトを作成を選択、②プロジェクト名を⼊⼒、③作成 をクリックす る ① ② ③
3.ハンズオン 28 資産の登録 タブから①資産を選択し、右メニューのデータ、ロードからファイルを②参照、③CSVファイルを選択し(開く) アップロード ① ② ③
3.ハンズオン 29 登録データの確認 データ資産から①登録したファイルを選択し、②データ内容を確認する ③Project画⾯に戻る ① ② ③
3.ハンズオン 30 ダッシュボードの作成 プロジェクト右上の①プロジェクトに追加をクリック、②ダッシュボードを選択 ③ダッシュボード名を⼊⼒(⽇本語⼊⼒可)し、④作成 ① ② ④ ③
3.ハンズオン 31 テンプレートの選択とリソース デ①任意のテンプレートを選択、②OK ③選択されたリソースをクリック ① ② ③
3.ハンズオン 32 リソースの接続 接続リソースの選択から①データ資産を展開、②登録したcsvファイルを選択し、③選択、④ファイルが読み込まれたこ とを確認する(クリックで展開できる) ① ② ③ ④
3.ハンズオン 33 表の作成 左メニュー(アイコン)から①グラフを選択し、②表を選択、③グリッド上の任意の位置に置く ④データをドラックし⑤列に登録(データ項⽬ 画⾯では製品名と⾦額を推奨) ① ② ③ ④
⑤
3.ハンズオン 34 資産の登録 作成した表を選択しコピー、①コピーした表を選択、②上部メニューバーより表を選択、 視覚化の変更から③全ての視覚化、④グラフを選択、⑤グラフ表⽰に変更 ① ② ④ ③ ⑤
3.ハンズオン 35 保存とプレビューモードからの再編集 上部メニュー①フロッピーアイコンをクリックして保存 プレビューモードの上部メニュー②鉛筆アイコンをクリックして編集、③ダッシュボードのロックを解除 ① ② ③
3.ハンズオン 36 削除 各メニュー表⽰右の︓から削除ができます ①プロジェクト削除 ②データ資産削除 ③ダッシュボード削除 ① ② ③
4.おすすめ情報 IBM Cloud Pak for Data を試⽤する https://jp- tok.dataplatform.cloud.ibm.com/registration/stepone?preselect_region=true&context=cpdaas& apps=all
IBM Cloud Pak for Data as a Serviceを始めてみる https://qiita.com/Asuka_Saito/items/df3467dc4c9919772c63 37
免責事項 38 IBM Developer Dojoは開発者の⽅を対象に、IBM Cloudを主とした技術情報をお伝えする⽬的で開催しています。 講師や運営スタッフにより、開催毎に最適と判断した内容でお届けしています。 現在、ハンズオンを伴う講義はお客様の費⽤負担がない環境と⼿順でご案内しています。講義終了後、不要に なりました制作物はお客様ご⾃⾝で削除をお願いいたします。クレジットカードの登録が伴わない場合、費⽤は ⼀切発⽣致しませんが、ご登録いただいたお客様はご注意ください。
講師陣はみなさまの利⽤状況を個別に確認することはできません。 ご理解とご協⼒をお願いいたします。 利⽤したサービスの削除⽅法については講義の中でご案内します。 ご不明な点がございましたら、当⽇確認をお願いいたします。 講義終了後、 IBM Developer Dojoに関するお問い合わせは「Slack」にお願いします。それ以外のIBM Cloudの お問い合わせにつきましては、弊社サポートセンターまで、次のいづれかの⽅法でお問い合わせください。 IBM Cloudダッシュボードの「サポート」メニューから「Case」を作成し、英語でご記⼊ください IBM Cloudサポートセンター「相談する」ボタンからチャットまたは電話でご連絡ください https://www.ibm.com/jp-ja/cloud/support ご参加ありがとうございました。
感想を教えてください
カスタマー サクセス マネージャ- 募集中 Customer Success Manager 募集中