Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
13k
1
Share
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
More Decks by tetsuroito
See All by tetsuroito
白金鉱業meetup発表資料
tetsuroito
1
260
Data Engineering Study#30 LT資料
tetsuroito
2
2k
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.9k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
900
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
700
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
6.3k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
5.2k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
180
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.7k
Other Decks in Research
See All in Research
Φ-Sat-2のAutoEncoderによる情報圧縮系論文
satai
4
620
ICCV2025参加報告_採択されやすいワークショップの選び方
kobayashi31
0
160
2026 東京科学大 情報通信系 研究室紹介 (すずかけ台)
icttitech
0
3.3k
AIエージェント時代のLLM-jpモデルのあるべき姿
k141303
0
350
計算情報学研究室(数理情報学第7研究室)2026
tomohirokoana
0
340
第66回コンピュータビジョン勉強会@関東 Epona: Autoregressive Diffusion World Model for Autonomous Driving
kentosasaki
0
600
R&Dチームを起ち上げる
shibuiwilliam
1
250
Aurora Serverless からAurora Serverless v2への課題と知見を論文から読み解く/Understanding the challenges and insights of moving from Aurora Serverless to Aurora Serverless v2 from a paper
bootjp
6
1.7k
Ankylosing Spondylitis
ankh2054
0
170
世界モデルにおける分布外データ対応の方法論
koukyo1994
7
2.2k
データセンター事業者を取り巻く近年の状況とその中での研究開発動向、テストベッドへの貢献の可能性
kikuzo
1
120
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
950
Featured
See All Featured
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.6k
Docker and Python
trallard
47
3.8k
How to Think Like a Performance Engineer
csswizardry
28
2.6k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
230
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
350
The Limits of Empathy - UXLibs8
cassininazir
1
330
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
sira's awesome portfolio website redesign presentation
elsirapls
0
240
JAMstack: Web Apps at Ludicrous Speed - All Things Open 2022
reverentgeek
1
440
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
Embracing the Ebb and Flow
colly
88
5k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
300
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること