Familiarization with the Data 2. Generating Initial Codes 3. Searching for Themes 4. Reviewing Themes 5. Defining and Naming Themes 6. Writing the Report 9 https://delvetool.com/blog/reflexive-thematic-analysis
➔ モデルレジストリ(e.g. HuggingFace)やフィーチャーストア( e.g. Vertex AI Feature Store)に よってガイドラインに頼らずモデルの連携方法を標準化する R2: Restructure teams to be cross-functional ➔ 専門チームで分業化せず横断で開発チームを組む R3: Pair data science and software engineers ➔ DevがDSとペアを組みコードレビューを行う R4: Translation work between the different roles and common understanding of the goal ➔ お互いに専門用語を説明するようなドキュメントを用意し DevとDSの共通言語化を進めるべき 18 ※R: Recommentations
producers ➔ データ提供者の社内外の広いスコープでの責務の具体化。利用者からデータの有用性や、 データが変更されることによる影響をフィードバックできる仕組みが重要。 R6: Central platform as a contract between producer and consumer ➔ データの共通基盤化。適切なメンテコストを持ってデータのドキュメント化や品質を担保する組 織体にすることが重要。 21
roles and get burned out ➔ 一般的な開発と比べ DSは結果が出づらく疲弊してしまう。 AP11: Tension between management and data science ➔ データやモデルといった DSの成果物が直接ROIにどう影響を与えているか (投資が回収できたか)が見えにくい。 多くのDS (Researcher) はROIという文字を嫌う。 26
Softwareと比べDS業務は不確定要素が多すぎる。そんな ML Projectの理 解が弱い経営層とDS側のやっていることの共有の難しさの両方が原因 C7: Communication mismatch between technical and non-technical people ➔ DS/Researchの成果を専門でないメンバーへわかりやすく説明できない 27
PoCのほとんどはプロダクトに導入されない( "PoC-Hell")。 性能指標にこだわり続けて社会実装にたどり着かない。 AP16: Perception of ‘Everything can benefit from ML!’ ➔ とにかくAIを使いたい、なんとかしてくれるという考え。 プロダクトのマネタイズ戦略を度外視して目的を履き違えてしまう。 AP17: Product is not feasible due to missing data or talent ➔ やりたいことはたくさんあるが、それができるデータや人材がいない。 プロダクトが動き出してからデータ集めから始めることも多い。 36