Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
1
12k
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.3k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
630
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
0
510
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
4.9k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.3k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
95
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.2k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.7k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.1k
Other Decks in Research
See All in Research
Equivalence of Geodesics and Importance Weighting from the Perspective of Information Geometry
mkimura
0
140
Trezor Safe 3 ファーストインプレッション
toshihr
0
190
CASCON 2023 Most Influential Paper Award Talk
tsantalis
0
120
フルリモートワークでのスクラムのスケール
kmorita1111
2
1k
Introduction of NII S. Koyama's Lab (AY2024)
skoyamalab
0
110
Deep State Space Models 101 / Mamba
kurita
9
3.5k
Scaling Rectified Flow Transformers for High-Resolution Image Synthesis / Stable Diffusion 3
shunk031
0
460
第4回ナレッジグラフ勉強会:ISWC2023論文読み会
kg_wakate
1
210
20240127_熊本から今いちど真面目に都市交通~めざせ「車1割削減、渋滞半減、公共交通2倍」~ 全国路面電車サミット2024宇都宮
trafficbrain
1
660
LiDARセキュリティ最前線
kentaroy47
0
280
SANER 2019 Most Influential Paper Talk
tsantalis
0
120
Experiments on ROP Attack with Various Instruction Set Architectures
yumulab
0
320
Featured
See All Featured
How GitHub (no longer) Works
holman
304
140k
Web Components: a chance to create the future
zenorocha
305
41k
Gamification - CAS2011
davidbonilla
76
4.6k
We Have a Design System, Now What?
morganepeng
43
6.8k
Unsuck your backbone
ammeep
663
57k
Into the Great Unknown - MozCon
thekraken
10
990
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
19
1.7k
Code Reviewing Like a Champion
maltzj
514
39k
Build The Right Thing And Hit Your Dates
maggiecrowley
24
2k
What's new in Ruby 2.0
geeforr
337
31k
Making the Leap to Tech Lead
cromwellryan
124
8.5k
Principles of Awesome APIs and How to Build Them.
keavy
121
16k
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること