Slide 1

Slide 1 text

Data Pipeline Casual Talk for Ready 2019/02/13(Wed) @エムスリー

Slide 2

Slide 2 text

何者ですか? ● 名前:伊藤 徹郎 (@tetsuroito) ● 所属:Classi株式会社 AI室 データサイエンティスト ● 分野:Educational Technology , Learning Analytics ● 著書:データサイエンティスト養成読本ビジネス活用編 ● 運営: ○ Machine Learning Casual Talks ○ Data Analyst Meetup Tokyo など

Slide 3

Slide 3 text

カジュアルとは 引用 https://twitter.com/con_mame/status/457130929270435840

Slide 4

Slide 4 text

#DPCTの狙い データ活用のコモディティ化がだいぶ浸透した ガートナー・ハイプサイクル 2018の図は https://japan.zdnet.com/article/35126917/ より引用

Slide 5

Slide 5 text

#DPCTの狙い ● すべてのリソースとなる「データ」 ● 活用の必要性は周知の通り ● 21世紀の石油と形容されることもある ● ビッグデータと称し、「量」が重視される ● GPUなどの計算リソースなどの進化 などなど

Slide 6

Slide 6 text

#DPCTの狙い そのデータの生成過程知ってますか? 誰がどうやって利用可能なデータにして いますか? 品質を上げるための苦労を知ってます か? それを担っているのは誰ですか? どんなスキルや経験が必要ですか? どんなツールがありますか? え、機械学習に使いたいって? ・・・

Slide 7

Slide 7 text

#DPCTの狙い ● データの処理工程であるパイプラインがまだ軽視されている ● パイプラインの技術情報の共有 ● 活用へのパイプライン、機械学習へのパイプライン(MLパイプライン) ● 様々なツールの情報 ● 担い手のスキル情報 ● チームビルディング ● 運用における課題 etc こんなことをカジュアルに話すのは#DPCTです!

Slide 8

Slide 8 text

登壇者だけでなく、 参加者のみなさんからの活発な議論を よろしくお願いします!

Slide 9

Slide 9 text

大好評のため、次回も開催したいと思います。 発表者および会場を募集します。 よろしくお願いします。

Slide 10

Slide 10 text

Appendix:申込者属性集計(複数回答可)

Slide 11

Slide 11 text

Appendix:DPCTに期待すること

Slide 12

Slide 12 text

Appendix:DPCTに期待すること