Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「『スモールビジネスを世界の主役に』を実現するための、freeeにおける機械学習エンジニアの役...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

 「『スモールビジネスを世界の主役に』を実現するための、freeeにおける機械学習エンジニアの役割と貢献」

1/28日【機械学習エンジニア特集】 データ活用の最前線と機械学習エンジニアの役割の登壇資料

Avatar for Naoyuki KIYOTA

Naoyuki KIYOTA

January 27, 2026
Tweet

Other Decks in Technology

Transcript

  1.   2 経歴 MLエンジニアとして⼊社 AIラボヨットの Engineering Manager AIラボ船 部⻑ • データベースエンジニア:3年

    • AI/MLエンジニア:5年 ◦ レコメンデーションエンジン‧パーソ ナライズ‧マーケティングメール (Push通知)最適化‧時系列予測 • Engineering Manager:6年 その他あえ共 • 趣味/Hobby ◦ 落語(⽴川談志、古今亭志ん朝、桂枝雀) naosuke AIラボ船 部長 Naoyuki KIYOTA
  2. 4
 freee Movement Deck
 10年前からスモールビジネスの
 生産性は上がっていない
 スモールビジネスの生産性の低さは、日本社会における大きな課 題です。freeeが創業された約10年前から、スモールビジネスの状 況は徐々に変わりつつありますが、依然として大企業との差は歴然 であり、まだまだ進化が必要です。

    
 
 
 大企業
 中小企業
 523万
 533万
 1123万
 1383万
 2011
 2021
 2011
 2021
 従業員一人当たり付加価値額(生産性) 
 freeeが目指す世界  スモールビジネスの課題
 2023年版「小規模企業白書」 第3節 生産性の現況

  3. 5
 freee Movement Deck
 スモールビジネスは
 人手不足が深刻
 大企業に比べ、規模の小さい企業ほど人材の未充足率が高い。 
 製造業と非製造業を比較すると、特に非製造業の人手不足が深刻。 


    0.4%
 0.8~3.2%
 2.1~3.5%
 5~999人
 1000人以上
 5~999人
 1000人以上
 1.6%
 freeeが目指す世界  スモールビジネスの課題 
 資料:厚生労働省「平成28年上半期雇用動向調査」再編加工
 2018年版 中小企業白書 2部「深刻化する人手不足と 中小企業の生産性革命」
 従業員規模別にみた、人材の未充足率 
 製造業
 非製造業

  4. 10   電子稟議
 経費精算
 債権債務
 管理
 人事労務
 電子契約
 固定資産
 請求管理


    会計
 工数管理
 販売管理 会計・人事労務・販売管理を核とした統合型経営プラットフォーム
  5. 11 ミッション 🎯 Mission AI/MLで、まだここにない価値を創造し、ユーザーに届ける。 Purpose Results 「統合flow」を実感するユーザー を拡⼤し、期待を超える「マジ価 値」を探求‧実現する

    「開発⽣産性2倍」と 「全社のAI活⽤」を牽引する AI/MLを活⽤した新しい機能‧ サービスを爆速で開発する 全社のAI活⽤を⽀え、安定性と 拡張性を両⽴したAI/ML基盤を 構築‧運⽤する
  6. 12 最先端の技術動向を調 査‧研究し、将来的な プロダクトへの応⽤可 能性を探索する研究開 発チーム freeeのプロダクトへ のAI機能開発を担う。 ユーザーの業務効率化 とマジ価値に貢献する

    チーム freee全体で活⽤する 基盤構築を担う。 安定した基盤提供と、 基盤の機能構築、導⼊ を推進するチーム AIラボのチーム紹介 Function Squad:機能開発 Innovation Hub:研究 Platform Pioneers:基盤 AI-PdM:keii 開発エンジニア マネージャー:naosuke マネージャー:naosuke マネージャー:delta
  7.   16 業務で取り組んだ内容に追加の研究を⾏い国際学会への発表 Two-Stage Classification of Bank Transaction with Decision

    Trees and MLP-Mixer https://developers.freee.co.jp/entry/bank-transaction-classification Enhancing Cost-Effective Large Language Models with Reinforcement Learning for Multi-Turn Text-based Environments https://www.graco.c.u-tokyo.ac.jp/~kaneko/papers/ Innovation Hub研究成果
  8. © 2025 freee K.K. All Rights Reserved. freeeのBizオペレーションの基盤である『Salesforce』『Zoom』『LLM基盤』を連携したシステム基盤全般 のことをつばめAUTOとしています より具体的には、『Zoom』で⾏われた架電‧商談の⽂字起こしデータをもとに『LLM基盤』で処理を⾏い、

    ⽇々のオペレーションを実⾏する『Salesforce』に反映されます ZoomMeeting LLM基盤 ZoomPhone Zoomでの架電‧商談後にSF上に ⾃動的に活動レコードが作成 (SF活動とZoomが紐づけされている状態) Salesforce内にLLMの 処理結果が更新 (サブプロジェクト参照) Salesforce つばめAUTOとは
  9.   23 評価とメトリクス/KPIの定義 (Define Evaluation Plan) 何が「良い」状態なのかを定義すること ビジネス⽬標、品質基準、主要なメトリクスを確⽴することを含む 評価テストケースの開発 (Develop

    Evaluation Test Cases) 質の⾼いテストデータを作ること 単純な単体テストを超え、エッジケース、複数ターンにわたるプロンプト、特定のシステムコンポーネン トのテストなど、現実世界の利⽤を反映した多様なシナリオを考える 評価駆動開発
  10.   24 オフラインおよびオンライン評価の実施 (Conduct Offline and Online Evaluations) オフライン評価:管理された条件(開発環境)で事前に実施される オンライン評価:本番環境でのリアルタイム監視とランタイム分析を含み、創発的な振る舞いや現実世界

    での障害を捉える 分析と改善 (Analyze and Improve) オフラインとオンライン両⽅の評価結果から改善ループを回すこと このフィードバックループはプロンプトの調整やモデルのファインチューニングだけでなく、アーキテク チャの改良、ツールの更新、パイプラインの変更など、広範な開発に寄与する 評価駆動開発
  11. 26 Culture of Developers 開発⽂化 freeeの開発⽂化は、開発をする上で実際に 全員が意識している判断基準です 何でもやれる、何でもやる チームで扱う課題について、特定の技術や領域に固執せずオールラウンドに取り組めているか。 アプリもインフラも、サーバサイドもフロントエンドも、早さも正確さも。

    世話を焼いていくスタイル チーム内外問わず周囲を⾃分の知⾒で助けられているか。 レビューしているか、システムor⼈間のアラートに疾⾵迅雷のごとく反応しているか。 必殺技 チームの中で⾃分が貢献できる特徴を理解して発揮しているか。 また、その特徴を増やしていけるか。 カッとしてシュッとやる 最低限はここまで、に満⾜せず⾃分がやりたいことを載せていけるか。 システムのボトルネック、負債に対する怒りをプラスの⽅向に関⼼を持ち、解決できるか。 失敗して攻めよう 学びのある失敗をして最速で成⻑しよう。 学びのある失敗とはチームやプロダクトの成⻑につながる失敗。 学びのある失敗をしていないのは挑戦が⾜りない。