Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
1
12k
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.8k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
850
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
640
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.8k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.8k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
140
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.5k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.9k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.3k
Other Decks in Research
See All in Research
時系列データに対する解釈可能な 決定木クラスタリング
mickey_kubo
2
750
データサイエンティストの就労意識~2015→2024 一般(個人)会員アンケートより
datascientistsociety
PRO
0
710
AI エージェントを活用した研究再現性の自動定量評価 / scisci2025
upura
1
120
研究テーマのデザインと研究遂行の方法論
hisashiishihara
5
1.5k
RHO-1: Not All Tokens Are What You Need
sansan_randd
1
130
Type Theory as a Formal Basis of Natural Language Semantics
daikimatsuoka
1
240
NLP2025参加報告会 LT資料
hargon24
1
320
実行環境に中立なWebAssemblyライブマイグレーション機構/techtalk-2025spring
chikuwait
0
230
90 分で学ぶ P 対 NP 問題
e869120
18
7.6k
EOGS: Gaussian Splatting for Efficient Satellite Image Photogrammetry
satai
4
300
[輪講] SigLIP 2: Multilingual Vision-Language Encoders with Improved Semantic Understanding, Localization, and Dense Features
nk35jk
2
570
引力・斥力を制御可能なランダム部分集合の確率分布
wasyro
0
190
Featured
See All Featured
KATA
mclloyd
30
14k
Making the Leap to Tech Lead
cromwellryan
134
9.4k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
44
2.4k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
10
970
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Testing 201, or: Great Expectations
jmmastey
43
7.6k
Rails Girls Zürich Keynote
gr2m
95
14k
4 Signs Your Business is Dying
shpigford
184
22k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
Why Our Code Smells
bkeepers
PRO
336
57k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
667
120k
Connecting the Dots Between Site Speed, User Experience & Your Business [WebExpo 2025]
tammyeverts
6
310
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること