Slide 1

Slide 1 text

【ESTYLE AI LOUNGE】 機械学習エンジニアの実情と AIキャリアの築き方

Slide 2

Slide 2 text

Profile ● 河合 俊典 - @vaaaaanquish ● 高専5年 → 大学3年次編入 → 大学院 → Sansan → Yahoo! JAPAN → エムスリー ● 調べてないけど多分この会場で一番フォロワーが多い

Slide 3

Slide 3 text

Agenda ● 自己紹介 ○ 私の経歴 ○ 転職について ■ 各社のMLエンジニアの働き方の違い ■ 転職の実態 ● キャリア感 ○ エモい方の話 ○ 多くの人がどうあると良さそうか ○ 私がどうありたいか

Slide 4

Slide 4 text

History ● Sansan ○ 画像認識APIの作成、運用 ○ 自然言語処理による企業情報の整理、分析 ○ 同僚と結婚し転職 ● Yahoo!JAPAN ○ 検索、レコメンドモデルの改善施策 ○ 機械学習モデリングのチームリーダーを経験 ○ ニセモノ検出モデル ○ 家も買ったし次の挑戦のため転職 ● エムスリー株式会社 ○ 医師向けのレコメンドエンジン ○ 医師のプロファイリング

Slide 5

Slide 5 text

Sansan株式会社 ● 新卒で「信頼できるエンジニア」の情報 しか信用できなかった中での 知人紹介 ○ 思い返せば大体各社都合良いこと言ってる ○ まあコイツがイキイキしてるならと思い入社 ● まだ機械学習プロジェクト立ち上げ時期 ○ 技術とデータを活用していきたい ○ 画像など専門のシニアエンジニアが多い ○ 機械学習専門は Kaggle Grand Masterが一人 ● 事業ニーズに合わせてゼロベースで開発、運用 ○ 自分でデータ収集、アノテーション、 データ加工、スクレイピングの仕組みを作る ○ スピード感重視のモデリング、チューニング ○ API開発、監視、運用、精度向上 【会場限定】 この後こちら側に出てくる内容は 有料noteにも書いてあるような内容なので ネットシェア厳禁でお願いします!

Slide 6

Slide 6 text

Yahoo! JAPAN ● 年収増加と結婚前後の緩やかな生活 ○ フリーアドレス ○ コアタイム有の裁量労働制 ○ 社会的信用 ● 規模の大きさ ○ 使えるデータの規模 ○ 人的リソース ○ 多種多様な福利厚生 (社食カフェから個人サポートまで) ● 大規模なhadoop、スパコン ○ コンピュータサイエンス全力 ○ 計算量、学習時間、分散、最適化 … ● 得られる情報量の多さ ○ EC機械学習のプロが多い ○ 満足度の高い社内勉強会、学会報告 ○ 多国籍なメンバー

Slide 7

Slide 7 text

エムスリー ● 年収増加とチャレンジ ○ 売上に繋がるプロダクト作り、 PM ● ドメイン知識の集中 ○ 日に日に増える医療知識 ○ 業界の仕組み ● 論理的、ギークなメンバー ○ 皆似た行動指針を持っている ○ 自主性が評価され楽しい ○ 自分で提案、考える必要 ○ 論文を読む、試す風土 ● Sansanより広くプロダクトの価値を作る所 から考えている ○ 何が求められているか、どう売るか ○ 売上目標もある

Slide 8

Slide 8 text

何故自分のバックグラウンドを 長々語ったのか

Slide 9

Slide 9 text

キャリアは 人生そのものだから

Slide 10

Slide 10 text

人生とキャリア ● 場所、年代、学校、研究室、会社、所属チーム、人、タイミング …全てがキャリアに影響 ○ 私で言えば上司や妻との出会い ■ 良いタイミング、悪いタイミングが沢山 ■ 誰しも「来週から転職活動はじめなきゃ!」 となる可能性がある ○ 研究室、企業も時代やフェーズによって変化している ■ 規模、レベル、スピード感、個人の見る範囲、待遇 …が同じとは限らない ● 例:私が話したSansanと同じ? → 上場もして人数もメンバーも変わってるので絶対違う ■ 背景によってタスクも変わる ● ゼロから生み出す ● モデルを改善する ● 顧客に売り込む ■ MLエンジニアは特にバブルかつ応用範囲が限定的なため影響を受けやすい

Slide 11

Slide 11 text

MLエンジニアのキャリア ● 「知の高速道路」が整備された段階 ○ 数年前に作っていたモデルより高精度なものが簡単に作れる ○ それこそ私が学生の頃 … ■ LightGBMもTensorFlowもPyTorchもなく、Kaggleも競プロも流行っていない ■ 機械学習自体が明るい分野ではない ○ 人材として突出するのが難しい ■ 人類皆Kaggle Master、人類皆CVPR …etc ■ 『何をどれだけアウトプットしたらどう評価されるの …?』 ○ 高速を作った人だとしても意見は話半分で聞かないとマズい ■ MLエンジニアのキャリアが大々的に語られ始めたのは最近 ■ キャリアについて集合知的に考えてこなかった世代も

Slide 12

Slide 12 text

2度転職してみて感じたMLエンジニア市場 ● まだピンキリな世界ではある ○ 複雑な機械学習、統計、データサイエンスが必要な場面、フェーズは限られている「はず」 ○ 必要な場面、フェーズに到達していない企業も多く募集しているバブル感 ■ 「とりあえずデータ見て欲しい」「 MLエンジニアの使い方これから考える」 …etc ■ 頼まれるタスクも簡単な調査から大規模な開発まで千差万別 ○ 経営層からマネージャ、エンジニア、人事まで機械学習の応用先として効く事を理解しているとベスト ■ ただしそんな会社は … ● バブルの頂点は終わりに向かいつつある ○ 「バブルが弾ける」というより「正当な評価をされ始めている」 ○ 他業界と同様「開発経験は未熟」「技術力は高いけど今会社に合わない」といった様々な軸の評価に ■ 自分と相手のフェーズを見抜く力が必要

Slide 13

Slide 13 text

つまりケース・バイ・ケースでは?

Slide 14

Slide 14 text

キャリアはケース・バイ・ケースだから こそ、日頃から多くの情報を収集、比 較し、自分の中で咀嚼して研鑽する 必要がある

Slide 15

Slide 15 text

ここまでの振り返り ● 急速に発展する技術 ○ キャリアにおいて人材として突出するのが難しい (技術における人材とはやや別の軸 ) ○ 知の高速道路が整備された状態ではエンジニアは技術のキャッチアップはして当たり前 ● 機械学習技術の変化の速さに追いつき始めた市場 ○ バブルも収束しつつあり適切な評価を得始めている ○ まだまだ玉石混交ではあるが ■ 明日転職する事になったとして見抜けるだけのキャッチアップしてますか? ■ 市場分析に伴った自己分析してますか?

Slide 16

Slide 16 text

エンジニア市場をキャリアに活かす ● 市場動向を把握しつつ自己分析 ○ 「自己分析」と「市場分析」とは違う ■ 安易な「〇〇さんなら✗✗くらい年収貰うべき」「あの会社は良い人多い」「環境モダン」は × ● 当人のバックグラウンド と志向と所属企業のフェーズ によって違う ● 年俸払える会社、環境、志向の違いは前半で述べた通り ● 情報を集めてサンプリングした上で「自分が今のタイミングだったらどうするか」 ○ どんなエンジニアになりたいのか ■ バックグラウンドと現状だけでなく、将来性も考える ○ 「人に面と向かって説明できない」状態はできているとは言えない ■ ネットで吐き出しただけで「自己分析できている」は × ■ 「それ採用面談で話しきれるの?」 ■ 技術と同じ ● 何かしらアウトプットとフィードバックが必要

Slide 17

Slide 17 text

キャリアの情報収集、アウトプット先は多い ● 1on1や振り返り、キャリアイベント、学会、勉強会などのチャンスを逃さない ○ 外から見た時の見え方は自分ではなかなか分からない ■ 気の合う仲間内でも良いので発信者側に ○ 半年に一回は見直しが必要 ■ 評価と振り返りを活用する ■ 他の会社のカジュアル面談を受けてみる ● ブログ、スライドで過去居た人の経験が見れてコメントできる時代 ○ 私が目指している世界観 ○ ※ 怪しい人も居るので話半分で

Slide 18

Slide 18 text

技術のアウトプット ● 私の理想は アウトプット:技術研鑽 == 3:7 くらい ○ 何故? → 私の尊敬する人達は大体それくらいだから ● 登壇でもブログでもOSSでもコンペ、学会に出るでも ○ 「業務にアウトプットしてます」は皆そう ○ 知識を整理する、高速道路を整備するだけでも良い ■ 技術者倫理に則っていればドキュメント整備からでも ■ 業務で得た技術、知見、ノウハウでも ○ アウトプット ≒ 研鑽 になっていると最も良い ■ 機械学習だと多くの場合長い期間が必要 (Kaggle, 学会発表 … etc) ■ 中途半端になりがち (ブーメラン) ● アウトプットのどこかで「成果」に繋がってないと転職市場では評価されにくい ○ 成果主義のアウトプットになっても良くないが、自分や企業にとっての中途半端が一番良くない ■ 自分が評価されたい所で評価される、自分が納得できる所までやりきる

Slide 19

Slide 19 text

私はどうありたいか

Slide 20

Slide 20 text

例えば 私が できること・できてないこと ● それなりにできる ○ 機械学習プロジェクトを様々なフェーズ、立場から推し進める ■ 他人やチームメンバーを導く、制度や仕組みを考える ○ 規模に合わせた機械学習応用、モデリング、実装 ○ 業界内外における情報収集、発信、コミュニティ貢献 ● できてない ○ コンテスト、学会などでの成果 ■ KaggleもまだExpert ○ OSSもやってるけどまあそれなり ○ 事業としての目的を発見する ■ 機械学習タスクより更に広い範囲 (PM) ■ 具体的に売上に繋げる

Slide 21

Slide 21 text

私が どうなりたいか ● 知識欲を満たしながら妻を 200%幸せにできるだけのお金が欲しい ● データ分析、データエンジニアというよりは MLエンジニア ○ モデルを作りAPI、SDK、Library、OSSという形で貢献する ○ 何故? → 顧客に届いてる様が好きだから ● 突出した人材に向けて ○ 業界内外への正しい情報を発信する力 ○ 論文を読み新しいモデルを実装しながら提案で企業の売上に貢献 ■ 何故? → 発信力と組み合わせられる ■ その点今の上司の @m_nishibaは尊敬できてプランの先に居る ■ 目的にフィットした場所で働けてはいるのでここで成果を出していく ○ 実力の証明として今年度中に Kaggle Masterになる

Slide 22

Slide 22 text

まとめ ● 各社、各人それぞれ働き方、考え方、フェーズが全く違う ○ その差がキャリアに影響する ○ 機械学習分野は特にその見極めが大事 ● 今の市場分析、自己分析、将来像構成は大事 ○ 情報を収集、サンプリングする ○ 内容を何らかの形で定期的に咀嚼、アウトプット、更新、研鑽する必要がある ● 最後「自分はどうありたいか」は大事