Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Data Pipeline Casual Talk for Ready
Search
tetsuroito
February 08, 2019
Research
1
12k
Data Pipeline Casual Talk for Ready
20190213 Data Pipeline Casual Talk @エムスリーのオープニングトーク資料です。
tetsuroito
February 08, 2019
Tweet
Share
More Decks by tetsuroito
See All by tetsuroito
データエンジニアリングの潮流を俯瞰する
tetsuroito
1
1.7k
Classiが取り組んできた 機械学習の試行錯誤
tetsuroito
0
800
事業会社でのデータマネジメントのプラクティス #TechMar
tetsuroito
1
590
Data Engineering Study #9 Classiのデータ組織の歩み
tetsuroito
5
5.6k
Data Engineering Study #3 基調講演_データ分析基盤の浸透に必要なこと
tetsuroito
4
4.6k
Subscription Meetup Vol.2 Opening Talk Slide
tetsuroito
0
120
Data_Pipeline_Casual_Talk_Vol.4_for_Ready.pdf
tetsuroito
0
1.4k
Data Pipeline Casual Talk Vol.3 for Ready #DPCT
tetsuroito
0
1.8k
データサイエンティスト養成読本ビジネス活用編のこぼれ話とエンジニアとデータサイエンティストのコラボについて
tetsuroito
3
3.2k
Other Decks in Research
See All in Research
データサイエンティストをめぐる環境の違い 2024年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
940
Weekly AI Agents News!
masatoto
30
45k
論文読み会 KDD2024 | Relevance meets Diversity: A User-Centric Framework for Knowledge Exploration through Recommendations
cocomoff
0
140
メタヒューリスティクスに基づく汎用線形整数計画ソルバーの開発
snowberryfield
3
680
ECCV2024読み会: Minimalist Vision with Freeform Pixels
hsmtta
1
360
FOSS4G 山陰 Meetup 2024@砂丘 はじめの挨拶
wata909
1
140
ナレッジプロデューサーとしてのミドルマネージャー支援 - MIMIGURI「知識創造室」の事例の考察 -
chiemitaki
0
160
VisFocus: Prompt-Guided Vision Encoders for OCR-Free Dense Document Understanding
sansan_randd
1
420
クロスセクター効果研究会 熊本都市交通リノベーション~「車1割削減、渋滞半減、公共交通2倍」の実現へ~
trafficbrain
0
340
文書画像のデータ化における VLM活用 / Use of VLM in document image data conversion
sansan_randd
2
420
非ガウス性と非線形性に基づく統計的因果探索
sshimizu2006
0
480
Weekly AI Agents News! 10月号 論文のアーカイブ
masatoto
1
460
Featured
See All Featured
Faster Mobile Websites
deanohume
305
30k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Building Applications with DynamoDB
mza
93
6.2k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
27
1.5k
jQuery: Nuts, Bolts and Bling
dougneiner
62
7.6k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
960
No one is an island. Learnings from fostering a developers community.
thoeni
19
3.1k
Done Done
chrislema
182
16k
Statistics for Hackers
jakevdp
797
220k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Rebuilding a faster, lazier Slack
samanthasiow
79
8.8k
RailsConf 2023
tenderlove
29
970
Transcript
Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー
何者ですか? • 名前:伊藤 徹郎 (@tetsuroito) • 所属:Classi株式会社 AI室 データサイエンティスト •
分野:Educational Technology , Learning Analytics • 著書:データサイエンティスト養成読本ビジネス活用編 • 運営: ◦ Machine Learning Casual Talks ◦ Data Analyst Meetup Tokyo など
カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840
#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用
#DPCTの狙い • すべてのリソースとなる「データ」 • 活用の必要性は周知の通り • 21世紀の石油と形容されることもある • ビッグデータと称し、「量」が重視される •
GPUなどの計算リソースなどの進化 などなど
#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって?
・・・
#DPCTの狙い • データの処理工程であるパイプラインがまだ軽視されている • パイプラインの技術情報の共有 • 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) • 様々なツールの情報 •
担い手のスキル情報 • チームビルディング • 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!
登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!
大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。
Appendix:申込者属性集計(複数回答可)
Appendix:DPCTに期待すること
Appendix:DPCTに期待すること