Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Power BI Premiumでデータ準備!
Search
Akihiro Suto
May 03, 2022
Technology
1
970
Power BI Premiumでデータ準備!
Power BI 勉強会GW合宿 2022第壱夜~夜のデータ準備~
https://powerbi.connpass.com/event/246419/
こちらで発表した内容です。
Akihiro Suto
May 03, 2022
Tweet
Share
More Decks by Akihiro Suto
See All by Akihiro Suto
JPPC2023_BI08_セマンティックモデルを覗き見る(公開用)
hanaseleb
0
4.5k
プッシュデータセットを試してみよう
hanaseleb
0
540
レポートをつくる、その先の運用を考える🤔 Power BI Report Ops
hanaseleb
0
4.9k
Power BI データフローを考える
hanaseleb
1
1.5k
DAXクエリをDAX Studioでつくって、Power Automateで発射する💪
hanaseleb
1
2.5k
BIのPowerをAutomateする
hanaseleb
0
440
Power BI のうらがわ
hanaseleb
2
790
ゼロからはじめたPower BI
hanaseleb
1
1.2k
Power Automateドリブンのチームマネジメント
hanaseleb
0
700
Other Decks in Technology
See All in Technology
複雑性の高いオブジェクト編集に向き合う: プラガブルなReactフォーム設計
righttouch
PRO
0
110
コンテナセキュリティのためのLandlock入門
nullpo_head
2
320
ガバメントクラウドのセキュリティ対策事例について
fujisawaryohei
0
530
AWS re:Invent 2024で発表された コードを書く開発者向け機能について
maruto
0
190
Oracle Cloudの生成AIサービスって実際どこまで使えるの? エンジニア目線で試してみた
minorun365
PRO
4
280
サーバレスアプリ開発者向けアップデートをキャッチアップしてきた #AWSreInvent #regrowth_fuk
drumnistnakano
0
190
社外コミュニティで学び社内に活かす共に学ぶプロジェクトの実践/backlogworld2024
nishiuma
0
260
統計データで2024年の クラウド・インフラ動向を眺める
ysknsid25
2
840
宇宙ベンチャーにおける最近の情シス取り組みについて
axelmizu
0
110
5分でわかるDuckDB
chanyou0311
10
3.2k
KubeCon NA 2024 Recap: How to Move from Ingress to Gateway API with Minimal Hassle
ysakotch
0
200
Jetpack Composeで始めるServer Cache State
ogaclejapan
2
170
Featured
See All Featured
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Site-Speed That Sticks
csswizardry
2
190
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
2
290
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
28
2.1k
Reflections from 52 weeks, 52 projects
jeffersonlam
347
20k
Faster Mobile Websites
deanohume
305
30k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
95
17k
The Cult of Friendly URLs
andyhume
78
6.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
Transcript
Power BI 勉強会 GW合宿 2022 第壱夜 夜のデータ準備
須藤 明洋 すとう あきひろ 秋田県 出身 集英社 勤務 Power BI
2021.04~ Python 2021.09~ Rugby 1991.04~ Kendama 2020.04~
Power BI Premiumでデータ準備
• Power BI Premiumの一部機能をご紹介 ◦ 💎配置パイプライン ◦ 💎データフロー ◦ 💎高度なAI
◦ 💎機械学習 Power BI Premiumでデータ準備
配置パイプライン
• BI 作成者は組織のコンテンツのライフサイクルを管理 ◦ 開発環境→テスト環境→プロダクション環境 ◦ パラメーターの管理 ◦ データベースの変更 配置パイプライン
None
None
None
None
None
None
None
None
None
None
None
None
None
None
• 開発環境 100行 ◦ インポートしたときに作業しやすい • テスト環境 1,000,000行 ◦ 前年比など確認
• 運用環境 1,000,000,000行 → 全データ 配置パイプライン
• 開発環境 100行 ◦ インポートしたときに作業しやすい • テスト環境 1,000,000行 ◦ 前年比など確認
• 運用環境 1,000,000,000行 → 全データ 配置パイプライン Power BI Desktop Power BI Service
Dataflow
• Power BI 内の多くのデータセットおよびレポートで共有できる再利用 可能な変換ロジックを作成できる。 ◦ Power Query Online •
独自の Azure Data Lake Storage Gen 2 内にデータが公開される。 Dataflow
None
• データフローを使用することで、データソースに何度もアクセスされる ことを防ぐことができる。 → Azure Data Lake Storage Gen2 にアクセス
Dataflow
None
None
None
• データフローを使用することで、データソースに何度もアクセスされる ことを防ぐことができる。 → Azure Data Lake Storage Gen2 にアクセス
• アクセス負荷軽減 • セキュリティ • 権限設計 Dataflow
Power BI Premium の Dataflow
• 💎処理の高速化 • 💎増分更新 • 💎リンクテーブル • 💎計算テーブル Power BI
Premium の Dataflow
💎処理の高速化
• Power BI Pro ◦ ベスト エフォート • Power BI
Premium ◦ 専用容量が割り当てられる →処理が早い 💎処理の高速化
💎処理の高速化 • Pro環境 • Premium環境 データ読込速度比較
💎処理の高速化 • Pro環境:更新時間の制限 ◦ 個々のエンティティのレベルで 2 時間 ◦ データフロー全体のレベルで 3
時間
None
💎処理の高速化 • Premium環境:更新時間の制限 ◦ データフロー全体のレベルで 24 時間
None
• 例が良くない ◦ すみません • 体感時間 ◦ 半分くらい 💎処理の高速化
💎増分更新
• Datasetの増分更新 ◦ Proライセンスでも可能 • Dataflowの増分更新 ◦ Premiumライセンスが必要 💎増分更新
• 更新が高速化される • 更新の信頼性が高くなる • リソースの使用が減る 💎増分更新
None
None
None
None
💎リンクテーブル&💎計算テーブル
• 💎リンクテーブル ◦ 既存のデータフローを参照する。 ◦ 複数のデータフロー内で再利用できるテーブルを作成する。 💎リンクテーブル&💎計算テーブル
None
None
None
• 💎計算テーブル ◦ リンク テーブルを参照し、書き込み専用の方法でそのテーブルに 対して操作を実行する。 ◦ その結果として新しいテーブルが作成される。 💎リンクテーブル&💎計算テーブル
None
None
データフローを使用してデ ータ ウェアハウスを作成す るためのベスト プラクティ ス - Power Query |
Microsoft Docs
データフローを使用してデータ ウェアハウスを作成する ためのベスト プラクティス - Power Query | Microsoft Docs
シナリオに沿って紹介 ◦ 夏のフェア 『ナツコミ』 ◦ Twitterの反応を可視化したい 💎リンクテーブル&💎計算テーブル
None
None
None
データ前処理
高度なAI
• テキストアナリティクス • 画像へのタグ付け 高度なAI
• テキストアナリティクス 自然言語処理 ◦ 言語の特定 ◦ キーフレーズ抽出 ◦ 感情スコア 高度なAI
None
None
None
None
None
None
データ前処理
データ前処理
• 更新のオーケストラレーション ◦ 同じワークスペースに存在する場合 ◦ 上流のデータが更新されると下流のリンクテーブル、計算テーブル は順次更新される。 💎リンクテーブル&💎計算テーブル
None
None
None
None
None
None
None
None
機械学習
• 経験からの学習により自動で改善するコンピューターアルゴリズム 機械学習 機械学習 - Wikipedia
• Power BI のAutoML ◦ 二項分類 ◦ 多項分類 ◦ 回帰
機械学習 データフローと共に Machine Learning と Cognitive Services を使用する - Power BI | Microsoft Docs
DEMO Diamond データセット カラット カラーなどから 価格を予測する 機械学習 pycaret/pycaret: An open-source,
low-code machine learning library in Python (github.com)
None
ほかにも、 • データフローへのダイレクトクエリ • ページ分割されたレポート • 最大48回更新 などなど Power BI
Premium 便利! Power BI Premium の機能。 - Power BI | Microsoft Docs
ほかにも、 • データフローへのダイレクトクエリ • ページ分割されたレポート • 最大48回更新 などなど Power BI
Premium 便利! Power BI Premium の機能。 - Power BI | Microsoft Docs もう戻れない
None