データサイエンティストが抱える辛さ ◎ Expectation does not match reality ○ (同僚・上司からの期待感が現実とマッチしない) ◎ Politics reigns supreme ○ (社内政治が最優先される) ◎ You’re the go to person about anything data ○ (データに関わるもの全てを扱う何でも屋扱いされる) ◎ Working in an isolated team ○ (他の事業から孤立したチームで働かされる) データサイエンティストが会社を去ってしまう理由 データサイエンティスト含むデータ分析職の仕事がつらい4つの理由: 洋の東西を問わずつらみは同じらしい - 六本木で働くデータサイエンティストのブログ
データサイエンティストが抱える辛さ 1. Data is never clean. 2. You will spend most of your time cleaning and preparing data. 3. 95% of tasks do not require deep learning. 4. In 90% of cases generalized linear regression will do the trick. 5. Big Data is just a tool. 6. You should embrace the Bayesian approach. 7. No one cares how you did it. 8. Academia and business are two different worlds. 9. Presentation is key - be a master of Power Point. 10. All models are false, but some are useful. データを取り扱う上での辛さもある The Inconvenient Truth About Data Science
データサイエンティストが抱える辛さ Indeed, arguably the most important reason for using a machine learning system is precisely that the desired behavior cannot be effectively implemented in software logic without dependency on external data https://ai.google/research/pubs/pub43146 複雑かつ高度なデータへの依存 機械学習プロダクトが技術的負債になりやすい理由
参考文献 ● Machine Learning: The High Interest Credit Card of Technical Debt (https://ai.google/research/pubs/pub43146) ● データサイエンティスト含むデータ分析職の仕事がつらい4つの理由: 洋の東西を問わずつらみは同じらしい - 六本木で働くデータサイエンティストのブログ (https://tjo.hatenablog.com/entry/2018/04/02/190000) ● The Inconvenient Truth About Data Science (https://www.kdnuggets.com/2015/05/data-science-inconvenient-truth.html) ● データエンジニアとは - データエンジニア日記 (http://data-soldier.hatenablog.com/entry/2017/12/08/114731) ● データ サイエンティストとデータ エンジニア:ロック スターと裏方の関係 ● (https://learningnetwork.cisco.com/docs/DOC-31728) ● Data engineers vs. data scientists (https://www.oreilly.com/ideas/data-engineers-vs-data-scientists) ● [抄訳] Data engineers vs. data scientists (https://medium.com/moonshot/ataengineers-vs-data-scientist-13fce30812a7) ● 営業さんまで、社員全員がSQLを使う 「越境型組織」 ができるまでの3+1のポイント | リブセンス (https://www.slideshare.net/livesense/150225-sql-foreveryone-45695818) ● 営業がSQLを理解--データ活用を組織文化として定着させたリブセンス - ZDNet Japan (https://japan.zdnet.com/article/35099445/) ● BPMF(Bayesian Probabilistic Matrix Factorization)によるレコメンド - LIVESENSE Data Analytics Blog (https://analytics.livesense.co.jp/entry/2017/12/05/105618)