Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How about the DataWorks(AliCloud) to easily ?
Search
Youkey
December 07, 2018
Technology
0
370
How about the DataWorks(AliCloud) to easily ?
AliEatersOsaka#3 Presented by Mr.shimomaki(SBCloud).
Youkey
December 07, 2018
Tweet
Share
More Decks by Youkey
See All by Youkey
GCPUGOsaka_12.pdf
yukinakata
1
67
GCPUGOsaka_11.pdf
yukinakata
0
250
About Fenrir Inc.
yukinakata
0
74
Alibaba Cloud DataV handson 2019/03/07
yukinakata
0
430
Origin of the Our Service's name.
yukinakata
0
1k
Report of TCC2018
yukinakata
0
250
TCCtour agenda for AliEatersOsaka
yukinakata
1
360
スマートシティを支えるAlibabaCloudAI
yukinakata
0
290
GCPUG-Osaka#8 [Let' also use BQ. Let's BBQ.]
yukinakata
0
370
Other Decks in Technology
See All in Technology
コンテキスト・ハーネスエンジニアリングの現在
hirosatogamo
PRO
6
700
頼れる Agentic AI を支える Datadog のオブザーバビリティ / Powering Reliable Agentic AI with Datadog Observability
aoto
PRO
0
250
SLI/SLO 導入で 避けるべきこと3選
yagikota
0
140
Kiroで見直す開発プロセスとAI-DLC
k_adachi_01
0
110
生成AIで速度と品質を両立する、QAエンジニア・開発者連携のAI協調型テストプロセス
shota_kusaba
0
350
スピンアウト講座06_認証系(API-OAuth-MCP)入門
overflowinc
0
610
スピンアウト講座02_ファイル管理
overflowinc
0
700
Copilot 宇宙へ 〜生成AIで「専門データの壁」を壊す方法〜
nakasho
0
140
AlloyDB 奮闘記
hatappi
0
190
ADK + Gemini Enterprise で 外部 API 連携エージェント作るなら OAuth の仕組みを理解しておこう
kaz1437
0
130
会社紹介資料 / Sansan Company Profile
sansan33
PRO
16
410k
SSoT(Single Source of Truth)で「壊して再生」する設計
kawauso
1
190
Featured
See All Featured
Raft: Consensus for Rubyists
vanstee
141
7.4k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Deep Space Network (abreviated)
tonyrice
0
94
Typedesign – Prime Four
hannesfritz
42
3k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
64
52k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
180
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
8k
Digital Projects Gone Horribly Wrong (And the UX Pros Who Still Save the Day) - Dean Schuster
uxyall
0
800
30 Presentation Tips
portentint
PRO
1
260
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
110
End of SEO as We Know It (SMX Advanced Version)
ipullrank
3
4.1k
Transcript
DataWorksでDWHをお手軽に
None
None
データソリューション 4 LogService Object Storage TableStore 分散データ処理 MaxCompute Server log
Image file Excel Tableau BIツール DataV ダッシュボード RDB データマート Applicatio n RDB HybridDB オンプレミス 他社クラウド DTS データ転送 少量データならそのまま可視化も可能 大きなデータや統合が必要 な場合は、分散データ処理 基盤を使って整理 アーカイブ データウェアハウス データレイク
データ基盤の分類 データ基盤の分類 位置付け 技術要素 データレイク 元データをコピーしたもの OSS etc… データウェアハウス 業務ドメインを反映した
データの整理 MaxCompute データマート 用途向けに 加工されたデータ RDB etc… 参考:http://yuzutas0.hatenablog.com/entry/2018/12/02/180000?fbclid=IwAR1VRqyvWJT_CtBVx3VxD9a76t-GW_cAt7JQMmLamNJ_hsjZQIlIrxOCTLs
データソリューション 6 Object Storage TableStore 分散データ処理 MaxCompute DataV ダッシュボード BIツール
RDB データマート RDB HybridDB 少量データならそのまま可視化も可能 データウェアハウス データレイク
応用 データ表現 Alibaba Bigdata Platform 基盤 MaxCompute ストリーム計算 分析型DB DataV
機械学習 エンジン 加工 DataWorks QuickBI カスタマイズ 推薦エンジン トレンド分析 AI&IOT 顔認識 音声翻訳
Compute Virtual Server Alibaba ECS Amazon EC2 Azure Virtual Machine
Compute Engine Container Service Container Service Amazon EC2 Azure Container Instances Kubernetes Engine Event Driven Computing Function Compute AWS Lambda Azure Functions Google Cloud Functions Storage Object Storage Object Storage Service Amazon S3 Azure Blob Storage Cloud Storage VM Disk Storage Block Storage Amazon EBS Azure Page Blobs Persistent Disk Database Relational Database ApsaraDB for RDS Amazon RDS Azure Database for XX Cloud SQL In-Memory Data Store ApsaraDB for Redis Amazon ElastiCache Azure RedisCache Cloud MemoryStore Bigdata Data WareHouse MaxCompute Amazon Redshift Azure SQL DataWarehouse Big Query Managed Cluster Service E-MapReduce Amazon EMR Azure HDInsight Cloud DataProc Networking Virtual Networking Virtual Private Cloud Amazon VPC Azure VNet Cloud Virtual Network Content Delivery Alibaba Cloud DNS Amazon Route 53 Azure DNS Cloud DNS 他社で言うところの 詳しくは http://comparecloud.in/ を参照
MaxCompute 大規模データの分散処理プラットフォームで ワンストップで大量のデータを迅速に、簡潔に効率よく低価格で 処理することが可能です。下記の4つの主要な機能を備えています。 ① データ転送機能 ② データ格納機能(ストレージ) ③ データ処理機能(計算)
④ プロセス管理機能(権限管理、セキュリティ) 各種データのインプットから、テーブル型データストレージMaxComputeMapReduceや MaxComputeSQLなどの計算処理、そしてアウトプットまでの各プロセスを セキュアにコントロールできるプラットフォームです。
Alibaba CloudのDWH MaxCompute 10 ・PB級データを高速処理可能 2015 Sort BenchMark :377秒で100TBデータソート完了 ・多機能を備え管理を一元化
・5倍圧縮保管で運用を安価に PB級 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート, 計算/検索
11 Max Compute(分散データ処理基盤) オンプレミス MySQL TXT Text Data … Oracle
データ収集 データアプリケーション データ処理 / マネジメント MaxCompute 基盤 クラウド環境 RDS OSS ECS … データウェアハウス Data Mining Task Scheduling Scrubbing & Converting データ同期 ETL アプリケーショ ン レポート リアルタイム クエリ データ分析 マイニング 予想 データファイル アクセス制御・ポータルインテグレーション タスクマネジメント DataWorks
DataWorksでMaxComputeを操る 12 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート,
計算/検索 DataWorks ワークフロー開発 データ収集 ワーク スケジューリング バージョン管理 タスク監視 機械学習 BIレポート
DataWorksとは AlibabCloud上でBig Dataを加工する為のIDE (Integrated Development Environment)統合開発環境です。 下記の3つの主要なサービスを備えています。 ① ビッグデータ処理プログラム開発環境 ②
タスクモニタリングとジョブ管理機能 ③ データ管理機能 MaxComputeと連携することで、ビッグデータの処理やデータ分析、 データマイニングなどをワンストップで行うことができるようになります。
DataWorksとは ① ビッグデータ処理プログラム開発環境 ビッグデータに対して、高速計算処理を行い、実行結果をエクスポートして、 他システムにデータを連携させることが可能です。 ・SQL (MaxCompute SQL)、データ同期、MR (MaxCompute MR)、シェル、
その他のジョブタイプを含む豊富なコンポーネントが用意されています。 ・複数のプログラミング言語に対応し、コードのオートコンプリート機能、 書式設定機能、デバック機能を備えています。 ・多人数による大規模開発にも対応できるよう、プロジェクト管理、 バージョン管理、コラボレーション開発管理などの管理機能を備えています。 ・豊富なデータインポート機能を装備しています。 FTP, SFTP, OSS, MySQL, PostgreSQL, Memcache, Redis, MongoDB, Hbase, MaxCompute, AnalyticDB, HDFS, HybridDB for MySQL など
DataWorksとは ② タスクモニタリングとジョブ管理機能 ・タスクを視覚化しモニタリングや一元管理が可能になっています。 ・アラート機能やオフラインタスクスケジューリング機能で 効率的な運用をサポートします。 ・データ同期可能なデータ MaxCompute , MySQL
, SQL Server , PostgreSQL , Oracle , FTP , ADSなど ③ データ管理機能 各プロジェクトや各メンバー毎にデータアクセス権限を管理可能です。 データ同期設定データ転送設定も詳細に管理できます。 FTP ADS
DataWorks処理の概要 DBからデータ持っ てくる ストレージから データ持ってくる データを 1つのテーブルに統合 必要データを 整理・抽出 データマートへ
アウトプット
17 参考事例 大手食品メーカー様 20年分の POSデータを分析
機械学習プラットフォームへの連携 *2018年12月現在 日本未提供
MaxComputeが裏で活躍 GUIによる操作 豊富なアルゴリズム
DataWorksでMaxComputeを操る 20 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート,
計算/検索 DataWorks ワークフロー開発 データ収集 ワーク スケジューリング バージョン管理 タスク監視 機械学習 BIレポート
MaxCompute DataWorks DataV AI セキュリティ Private Cloud 3Q 4Q ECS
Baremetal Super Computing Cluster IOT Link Kit Image Search Machine Learning Stream Compute Anti DDoS Pro CEN (Cloud NW) GPU ECS Baremetal Apsara Stack 下期にかけてプロダクトラインナップ拡充へ 2017年12 月 2018年 3月 2018年 8月 Big Data ベアメタル (Intel) NW IoT Suite SSA (サーバセキュリティ) Express Connect Product Roadmap
EOF