Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How about the DataWorks(AliCloud) to easily ?
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Youkey
December 07, 2018
Technology
0
370
How about the DataWorks(AliCloud) to easily ?
AliEatersOsaka#3 Presented by Mr.shimomaki(SBCloud).
Youkey
December 07, 2018
Tweet
Share
More Decks by Youkey
See All by Youkey
GCPUGOsaka_12.pdf
yukinakata
1
66
GCPUGOsaka_11.pdf
yukinakata
0
250
About Fenrir Inc.
yukinakata
0
73
Alibaba Cloud DataV handson 2019/03/07
yukinakata
0
430
Origin of the Our Service's name.
yukinakata
0
1k
Report of TCC2018
yukinakata
0
250
TCCtour agenda for AliEatersOsaka
yukinakata
1
350
スマートシティを支えるAlibabaCloudAI
yukinakata
0
290
GCPUG-Osaka#8 [Let' also use BQ. Let's BBQ.]
yukinakata
0
360
Other Decks in Technology
See All in Technology
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
Claude_CodeでSEOを最適化する_AI_Ops_Community_Vol.2__マーケティングx_AIはここまで進化した.pdf
riku_423
2
610
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
270
量子クラウドサービスの裏側 〜Deep Dive into OQTOPUS〜
oqtopus
0
150
~Everything as Codeを諦めない~ 後からCDK
mu7889yoon
3
500
Red Hat OpenStack Services on OpenShift
tamemiya
0
130
モダンUIでフルサーバーレスなAIエージェントをAmplifyとCDKでサクッとデプロイしよう
minorun365
4
220
配列に見る bash と zsh の違い
kazzpapa3
3
170
Oracle AI Database移行・アップグレード勉強会 - RAT活用編
oracle4engineer
PRO
0
110
Ruby版 JSXのRuxが気になる
sansantech
PRO
0
170
制約が導く迷わない設計 〜 信頼性と運用性を両立するマイナンバー管理システムの実践 〜
bwkw
3
1k
Why Organizations Fail: ノーベル経済学賞「国家はなぜ衰退するのか」から考えるアジャイル組織論
kawaguti
PRO
1
190
Featured
See All Featured
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Darren the Foodie - Storyboard
khoart
PRO
2
2.4k
4 Signs Your Business is Dying
shpigford
187
22k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
340
Building Flexible Design Systems
yeseniaperezcruz
330
40k
Designing for Timeless Needs
cassininazir
0
130
AI Search: Where Are We & What Can We Do About It?
aleyda
0
7k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
34k
Visualization
eitanlees
150
17k
The SEO identity crisis: Don't let AI make you average
varn
0
330
Done Done
chrislema
186
16k
The Spectacular Lies of Maps
axbom
PRO
1
530
Transcript
DataWorksでDWHをお手軽に
None
None
データソリューション 4 LogService Object Storage TableStore 分散データ処理 MaxCompute Server log
Image file Excel Tableau BIツール DataV ダッシュボード RDB データマート Applicatio n RDB HybridDB オンプレミス 他社クラウド DTS データ転送 少量データならそのまま可視化も可能 大きなデータや統合が必要 な場合は、分散データ処理 基盤を使って整理 アーカイブ データウェアハウス データレイク
データ基盤の分類 データ基盤の分類 位置付け 技術要素 データレイク 元データをコピーしたもの OSS etc… データウェアハウス 業務ドメインを反映した
データの整理 MaxCompute データマート 用途向けに 加工されたデータ RDB etc… 参考:http://yuzutas0.hatenablog.com/entry/2018/12/02/180000?fbclid=IwAR1VRqyvWJT_CtBVx3VxD9a76t-GW_cAt7JQMmLamNJ_hsjZQIlIrxOCTLs
データソリューション 6 Object Storage TableStore 分散データ処理 MaxCompute DataV ダッシュボード BIツール
RDB データマート RDB HybridDB 少量データならそのまま可視化も可能 データウェアハウス データレイク
応用 データ表現 Alibaba Bigdata Platform 基盤 MaxCompute ストリーム計算 分析型DB DataV
機械学習 エンジン 加工 DataWorks QuickBI カスタマイズ 推薦エンジン トレンド分析 AI&IOT 顔認識 音声翻訳
Compute Virtual Server Alibaba ECS Amazon EC2 Azure Virtual Machine
Compute Engine Container Service Container Service Amazon EC2 Azure Container Instances Kubernetes Engine Event Driven Computing Function Compute AWS Lambda Azure Functions Google Cloud Functions Storage Object Storage Object Storage Service Amazon S3 Azure Blob Storage Cloud Storage VM Disk Storage Block Storage Amazon EBS Azure Page Blobs Persistent Disk Database Relational Database ApsaraDB for RDS Amazon RDS Azure Database for XX Cloud SQL In-Memory Data Store ApsaraDB for Redis Amazon ElastiCache Azure RedisCache Cloud MemoryStore Bigdata Data WareHouse MaxCompute Amazon Redshift Azure SQL DataWarehouse Big Query Managed Cluster Service E-MapReduce Amazon EMR Azure HDInsight Cloud DataProc Networking Virtual Networking Virtual Private Cloud Amazon VPC Azure VNet Cloud Virtual Network Content Delivery Alibaba Cloud DNS Amazon Route 53 Azure DNS Cloud DNS 他社で言うところの 詳しくは http://comparecloud.in/ を参照
MaxCompute 大規模データの分散処理プラットフォームで ワンストップで大量のデータを迅速に、簡潔に効率よく低価格で 処理することが可能です。下記の4つの主要な機能を備えています。 ① データ転送機能 ② データ格納機能(ストレージ) ③ データ処理機能(計算)
④ プロセス管理機能(権限管理、セキュリティ) 各種データのインプットから、テーブル型データストレージMaxComputeMapReduceや MaxComputeSQLなどの計算処理、そしてアウトプットまでの各プロセスを セキュアにコントロールできるプラットフォームです。
Alibaba CloudのDWH MaxCompute 10 ・PB級データを高速処理可能 2015 Sort BenchMark :377秒で100TBデータソート完了 ・多機能を備え管理を一元化
・5倍圧縮保管で運用を安価に PB級 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート, 計算/検索
11 Max Compute(分散データ処理基盤) オンプレミス MySQL TXT Text Data … Oracle
データ収集 データアプリケーション データ処理 / マネジメント MaxCompute 基盤 クラウド環境 RDS OSS ECS … データウェアハウス Data Mining Task Scheduling Scrubbing & Converting データ同期 ETL アプリケーショ ン レポート リアルタイム クエリ データ分析 マイニング 予想 データファイル アクセス制御・ポータルインテグレーション タスクマネジメント DataWorks
DataWorksでMaxComputeを操る 12 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート,
計算/検索 DataWorks ワークフロー開発 データ収集 ワーク スケジューリング バージョン管理 タスク監視 機械学習 BIレポート
DataWorksとは AlibabCloud上でBig Dataを加工する為のIDE (Integrated Development Environment)統合開発環境です。 下記の3つの主要なサービスを備えています。 ① ビッグデータ処理プログラム開発環境 ②
タスクモニタリングとジョブ管理機能 ③ データ管理機能 MaxComputeと連携することで、ビッグデータの処理やデータ分析、 データマイニングなどをワンストップで行うことができるようになります。
DataWorksとは ① ビッグデータ処理プログラム開発環境 ビッグデータに対して、高速計算処理を行い、実行結果をエクスポートして、 他システムにデータを連携させることが可能です。 ・SQL (MaxCompute SQL)、データ同期、MR (MaxCompute MR)、シェル、
その他のジョブタイプを含む豊富なコンポーネントが用意されています。 ・複数のプログラミング言語に対応し、コードのオートコンプリート機能、 書式設定機能、デバック機能を備えています。 ・多人数による大規模開発にも対応できるよう、プロジェクト管理、 バージョン管理、コラボレーション開発管理などの管理機能を備えています。 ・豊富なデータインポート機能を装備しています。 FTP, SFTP, OSS, MySQL, PostgreSQL, Memcache, Redis, MongoDB, Hbase, MaxCompute, AnalyticDB, HDFS, HybridDB for MySQL など
DataWorksとは ② タスクモニタリングとジョブ管理機能 ・タスクを視覚化しモニタリングや一元管理が可能になっています。 ・アラート機能やオフラインタスクスケジューリング機能で 効率的な運用をサポートします。 ・データ同期可能なデータ MaxCompute , MySQL
, SQL Server , PostgreSQL , Oracle , FTP , ADSなど ③ データ管理機能 各プロジェクトや各メンバー毎にデータアクセス権限を管理可能です。 データ同期設定データ転送設定も詳細に管理できます。 FTP ADS
DataWorks処理の概要 DBからデータ持っ てくる ストレージから データ持ってくる データを 1つのテーブルに統合 必要データを 整理・抽出 データマートへ
アウトプット
17 参考事例 大手食品メーカー様 20年分の POSデータを分析
機械学習プラットフォームへの連携 *2018年12月現在 日本未提供
MaxComputeが裏で活躍 GUIによる操作 豊富なアルゴリズム
DataWorksでMaxComputeを操る 20 MaxCompute *多機能:分析 - SQL, MapReduce, Graph etc… データインポート/エクスポート,
計算/検索 DataWorks ワークフロー開発 データ収集 ワーク スケジューリング バージョン管理 タスク監視 機械学習 BIレポート
MaxCompute DataWorks DataV AI セキュリティ Private Cloud 3Q 4Q ECS
Baremetal Super Computing Cluster IOT Link Kit Image Search Machine Learning Stream Compute Anti DDoS Pro CEN (Cloud NW) GPU ECS Baremetal Apsara Stack 下期にかけてプロダクトラインナップ拡充へ 2017年12 月 2018年 3月 2018年 8月 Big Data ベアメタル (Intel) NW IoT Suite SSA (サーバセキュリティ) Express Connect Product Roadmap
EOF