Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Kaggleの経験が実務にどう活きているか / kaggle_findy

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.

Kaggleの経験が実務にどう活きているか / kaggle_findy

■ イベント
LLM性能改善の実践知 - Kaggleでの学びを現場に活かす思考法
https://findy.connpass.com/event/383571/

■ 発表者
技術本部 研究開発部 Data Analysisグループ
齋藤 慎一朗

■ 研究開発部 採用情報
https://media.sansan-engineering.com/randd

■ Sansan Tech Blog
https://buildersbox.corp-sansan.com/

Avatar for Sansan R&D

Sansan R&D

March 04, 2026
Tweet

More Decks by Sansan R&D

Other Decks in Technology

Transcript

  1. 齋藤 慎⼀朗 Sansan株式会社技術本部 研究開発部 シニアリサーチャー - 契約書、⼈事異動情報、ニュースからの情報抽出 - 趣味 -

    Kaggle(2x Master) - ランニング(サブ5.5) - 書籍 - Kaggleではじめる⼤規模⾔語モデル⼊⾨ - Polarsとpandasで学ぶ データ処理アイデアレシピ55 - 最近 - LLMの検証・運⽤に取り組めて仕事が楽しい! @sinchir0 X(旧Twitter)
  2. - Sansanのビジネスの紹介 - 研究開発部の⽴ち位置 - ⼤規模(視覚)⾔語モデルの活⽤ - Kaggleを通して得たもの(LLMの社内活⽤の観点に限定) - Kaggleの経験が実務にどう活きているか

    - 1. LLMを実務で⽤いて成果を出せる確信が得られた。 - 2. LLMのプロダクト活⽤を⾼速にする社内レポジトリに、 最新⼿法を導⼊できている。 アジェンダ
  3. Sansanのビジネスの紹介 ⽣産性を向上させ、企業のAI活⽤を最⼤化するデータベースとしても貢献できる 「働き⽅を変えるAXサービス」を提供します。 データクオリティマネジメント 請求 名刺 管理 営業 契約 名刺管理から、収益を最⼤化する

    AI契約データベースが、利益を守る 「なくせる」をつくり、全社の働き⽅を変える 名刺アプリ 経理DXサービス 取引管理サービス ビジネスデータベース 各サービスの活⽤で変わる働き⽅ 情報を分析・活⽤しやすく データに基づいた判断ができる 情報の管理がしやすく すぐに共有できる 必要な情報を すぐに⾒つけられる 個⼈向け 法⼈向け
  4. vLLM ⼤規模(視覚)⾔語モデルの活⽤ ⾼精度なデータ化のための⼿法の⼀つとして、⼤規模(視覚)⾔語モデルを活⽤ している。 モデル - tokyotech-llm/Swallow-7b- instruct-v0.1 - google/gemma-2-2b

    - Qwen/Qwen2.5-VL-7B-Instruct - Qwen/Qwen3-VL-2B-Instruct ⼊⼒ ファインチューニング 運⽤ 請求書 契約書 メール ⼈事異動ニ ュース
  5. ファインチューニングしたLLMの検証を⾼速化する社内レポジトリを 開発している - ファインチューニングしたLLMの導⼊をより推進するためには、 プロダクトにリリースするまでの時間を⾼速かつ低コストに実施することが重要である。 - リリースするまでの⼯程として、提案 → 検証 →

    開発 → リリースの4つが存在する。 - このうち、検証の時間を⾼速かつ低コストに実施するために、 LLMのファインチューニング・推論を⾏う社内レポジトリrandd_llm_trainerを、 有志メンバーで開発している。