生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略・開発戦略 / my-career-and-development-strategies-for-ml-engineer-2024

© 2024 LayerX Inc. 生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略・開発戦略 2024/03/28 ML Career Night
#1｜生成AI時代の機械学習エンジニアのキャリア戦略株式会社LayerX Yuya Matsumura(@yu-ya4)

© 2024 LayerX Inc. 2 バクラク事業部機械学習グループマネージャー/機械学習エンジニア経歴京都大学大学院情報学研究科修士課程修了。情報検索や情報推薦に関する研究に取り
組む。 2018年ウォンテッドリー株式会社に新卒入社。レコメンドチームの立ち上げに携わる。その後、機械学習領域のテックリード、プロダクトマネージャー、エンジニアリングマネージャーを務める。 2022年9月に株式会社LayerXに入社。機械学習チームにて、法人支出管理SaaSバクラクのAI-OCR機能をはじめとする機械学習を活用した機能の開発およびマネジメントに従事。その他活動として、ウォンテッドリー株式会社の機械学習領域の技術顧問やスタートアップの技術支援、大学の非常勤講師、書籍の執筆など。画像を入れてね自己紹介松村優也（Yuya Matsumura） @yu__ya4

© 2024 LayerX Inc. 3 略歴 2018年3月京都大学大学院情報学研究科社会情報学専攻
修了 / 情報検索・情報推薦の研究２０１８年4月新卒で Wantedly に１人目のデータサイエンティストとして入社推薦システムチームの立ち上げ２０１9年9月同チームのリーダーとなり、機械学習活用・推薦システムの開発により一層力を入れる２０21年3月開発チームのマネージャーに就任 Wantedly Visit の PdM と組織全体の EM も兼任することに２０21年11月静岡大学非常勤講師（年に一度、推薦システムの講演）２０22年5月兵庫県立大学非常勤講師（年に一度、推薦システムの講演） / 『推薦システム実践入門』出版２０22年9月 LayerXに機械学習エンジニアとして入社 / Wantedly 技術顧問就任２０23年2月機械学習チームリーダー就任２０23年4月機械学習グループマネージャー就任

「生成AI時代」で何が変わった？

© 2024 LayerX Inc. 5 生成AIやLLMの普及により... • ChatGPTなどを利用することで機械学習の知識や実装なしで文書要約や情報抽出、質問応答など代表的な自然言語処理タスクを解くことができる。 •
OpenAI APIなどを利用することで簡単な機械学習の知識と実装のみで自然言語処理を活用した機能開発を行うことができる。 ◦ 文書要約、情報抽出, etc. ◦ チャットボット ◦ 文書の埋め込み表現を利用した検索システム AI・機械学習の民主化：誰でも容易に高性能な機械学習モデルを活用できるように「生成AI時代」で何か変わった？実装: ここではいわゆるプログラミングを指します。プロンプトエンジニアリングは別途必要になることが多いです。

生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略

© 2024 LayerX Inc. 7 機械学習エンジニアとして私が大切にしていること機械学習をコアに据えたプロダクト開発に携わる言い換えるならば... • 機械学習がプロダクトの価値を提供するための
“nice to have” ではなく “must have” なプロダクト • 機械学習を利用するからこそ十分な価値を提供できるプロダクト • 機械学習モデルの精度を0.1%改善すれば、プロダクトのNSM/KPI が◯%向上し、売り上げが□%増えるようなプロダクト ※「手段の目的化」ではない。AI・機械学習という技術を信じてbetしている。 https://note.com/yuya4/n/n0afe63dd4405

© 2024 LayerX Inc. 8 なぜ “must have” にこだわるのか “must
have” だからこそ機械学習エンジニアが活きる “nice to have” が悪ではない。あった方が良い。ただ、インパクト（提供価値や売り上げ）が限定的。 • 機械学習エンジニアならではの仕事（機械学習モデルの開発やその維持管理、継続的な精度の改善など...）には大きなコストがかかる。限定的なインパクトの機能にどこまでコストを払うべきか。 ◦ 経済合理性がないのに、仕事をするための仕事を作っていないか？ • AIの民主化により、ある程度の性能のものならばLLMなどを利用してシュッと作れるようにもなった。 “nice to have”なものならそれで十分なケースが多い。もちろん生成AIならではの難しさもあるが。 • インパクトが小さいので給料も上げにくい。自身もはもちろん、マネージャーはメンバーへの責任も。 • 自分の限られた人生を “nice to have” に捧げるのか？

© 2024 LayerX Inc. 9 なぜLayerXなのか？ “must have”な機能の例 AI-OCR機能をはじめとるする“must have”な機能群
AI-OCR機能：紙や画像形式で存在する帳票などから必要な情報を抽出しデータ化（構造化）する機能 • 顧客が行いたい支払い処理や仕訳処理など後続業務のためにはこのデータ化が必須。なければ価値を提供できない。 • 全体の“精度”が0.1%上がるごとに、十分な価値を提供できるようになる顧客が増える。 ◦ 契約前、一部の帳票をAI-OCR機能にかけて競合製品と比較するなどして検討される。それが読み取れるかどうかが勝負。 ◦ 極論、数種類の帳票しか扱っていない顧客にとってはそれが読み取れるかどうかで精度が 0% or 100%になる。

© 2024 LayerX Inc. 10 機械学習エンジニアとして私が大切にしていること機械学習を活用した“must have”が生まれ続けるか “must have”もひとつだけでは取り組み続けるこ
とに限界がある。 • LayerXはコンパウンドスタートアップの戦略を取る。バクラク事業部の中でも半年にひとつは新しいプロダクトが生まれる。 • プロダクトごとに様々な新しい価値が必要であり、プロダクト間の連携自体にも価値が必要。 • やるべきことが生まれ続け、それに応じて機械学習組織も拡大し続ける。 https://speakerdeck.com/layerx/company-deck?slide=23

生成AI・LLM時代における機械学習エンジニアとしての開発戦略

© 2024 LayerX Inc. 13 生成AI・LLM時代におけるAI-OCR機能の開発戦略質の高いデータセットの構築新しい公開LLMやAPIを利用した独自タスクの性能評価、ファインチューニングによる独自モデルの作成を実現するためのデータセットの重要性の再認識 •
新しいモデル(LLM)の採用を検討するにあたり、顧客への提供価値を正しく計測できるような評価設計およびデータセット構築は必須 • ベースとなるモデルが凄まじいスピードで進化する世の中において、モデル単体の性能差分は独自のデータセットによってのみ生まれる世界が来るかも？ • 人手によるアノテーション作業の効率向上のためのLLM活用も https://speakerdeck.com/yuya4/data-centric-ai-bakuraku-dataset

© 2024 LayerX Inc. 14 生成AI・LLM時代におけるAI-OCR機能の開発戦略信頼できるMLOps・LLMOpsの構築高速に新しいモデルを検証して顧客に安定した価値を届ける仕組み（MLOps・LLMOps）の重要性の再認識 • ファインチューニングや性能検証などモデルの開発、デプロイ、システムへの組み込み、リリース後のモ
ニタリングなど一連のワークフローを高速に安定して実現する仕組みがなければ、世の中の進化についていけなくなる • LLMという巨大でコストのかかるモデルだからこそ、より効率的なワークフローの構築が求められる • プロンプトの管理やRAGなどLLM特有の（重要性が増した）概念も

© 2024 LayerX Inc. 15 生成AI・LLM時代におけるAI-OCR機能の開発戦略 AI-UX: AIを前提とした理想のUXの追求 AI・LLMの活用が当たり前となった世の中におけるUXの重要性の再認識 •
AI・LLMで体験を構築すべき部分とそうでない部分の見極め • AIの精度が100%ではないという前提で、いかにその間違いを体験でカバーできるのか • AIの精度を上げていくため、データ・正解ラベルが自動で収集されるような仕組みの構築 https://comemo.nikkei.com/n/n72374ef7b2d9

© 2024 LayerX Inc. 16 生成AI・LLM時代におけるAI-OCR機能の開発戦略あえて内製を諦めない内製の過程で得られた知見や能力、資産は将来的に必ず役に立つであろう。Bet Technology https://tech.layerx.co.jp/entry/2023/10/02/132854
https://speakerdeck.com/shimacos/layerx-jsai-2023-77615b88-120 0-424e-b485-1021b0b7b55e

まとめ

© 2024 LayerX Inc. 18 まとめ生成AI・LLMが前提の世界における新しいキャリアや開発の戦略を立案し実行していくキャリア戦略 •
機械学習をコアに据えたプロダクト開発に携わる • 機械学習を活用した“must have”が生まれ続けるか開発戦略 • 質の高いデータセットの構築 • 信頼できるMLOps・LLMOpsの構築 • AI-UX: AIを前提とした理想のUXの追求 • あえて内製を諦めない https://tech.layerx.co.jp/entry/aiocr-in-llm-2023

生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略・開発戦略 / my-ca...

生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略・開発戦略 / my-career-and-development-strategies-for-ml-engineer-2024

Yuya Matsumura

More Decks by Yuya Matsumura

Other Decks in Technology

Featured

Transcript

© 2024 LayerX Inc. 生成AI・LLM時代における機械学習エンジニアとしてのキャリア戦略・開発戦略 2024/03/28 ML Career Night

© 2024 LayerX Inc. 2 バクラク事業部機械学習グループマネージャー/機械学習エンジニア経歴京都大学大学院情報学研究科修士課程修了。情報検索や情報推薦に関する研究に取り

© 2024 LayerX Inc. 3 略歴 2018年3月京都大学大学院情報学研究科社会情報学専攻

「生成AI時代」で何が変わった？

© 2024 LayerX Inc. 5 生成AIやLLMの普及により... • ChatGPTなどを利用することで機械学習の知識や実装なしで文書要約や情報抽出、質問応答など代表的な自然言語処理タスクを解くことができる。 •