Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
SmartHRのデータ戦略 ─非構造化 データが拓く人的資本経営の未来─
Search
Kotaro Inoue
February 12, 2026
Technology
100
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
SmartHRのデータ戦略 ─非構造化 データが拓く人的資本経営の未来─
@AI時代のデータ活用 ── リアルなデータの面白さとツラミと可能性
https://ivry.connpass.com/event/377161/
Kotaro Inoue
February 12, 2026
More Decks by Kotaro Inoue
See All by Kotaro Inoue
敵対生成プロンプト同時探索による内省型プロンプト最適化
kinoue_smarthr
0
110
Other Decks in Technology
See All in Technology
ポケモンの型をTypeScriptの型システムで表現してみた
subroh0508
0
350
個人の発見を、組織の知恵に 〜生成AI活用を"探索"から"組織の仕組み"へ〜
kintotechdev
2
1k
Platform engineering for developers, architects & the rest of us (AI agents)
danielbryantuk
0
190
TypeScript Compiler APIとPHP-Parserを活用し、TypeScriptとPHPで型を共有する
shuta13
0
370
ChatworkとBPaaS 異なる特性で学んだAI機能開発の ベストプラクティス
kubell_hr
2
3k
Claude Code×Terraform IaC テンプレート駆動開発
itouhi
1
430
実装は速くなった、レビューはどうする? ― 自身のレビューをAIで再現させるサーヴァントエンジニアリングのすゝめ / Implementation got faster. So what about reviews? — An invitation to Servant Engineering: Recreating your own code reviews with AI
nrslib
7
4.1k
Mastering Ruby Box
tagomoris
3
150
「嘘をつくテスト」の失敗例から学ぶ 良いテストコード #frontend_phpcon_do
asumikam
0
540
Oracle Cloud Infrastructure IaaS 新機能アップデート 2026/3 - 2026/5
oracle4engineer
PRO
1
210
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.8k
Djangoユーザが知っ得なPostgreSQL機能 - 設計の選択肢を増やす / Djang-use-PostgreSQL
soudai
PRO
0
200
Featured
See All Featured
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
240
Taking LLMs out of the black box: A practical guide to human-in-the-loop distillation
inesmontani
PRO
3
2.3k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
35
2.5k
Un-Boring Meetings
codingconduct
0
310
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
600
Embracing the Ebb and Flow
colly
88
5.1k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
Believing is Seeing
oripsolob
1
140
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
200
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
480
Discover your Explorer Soul
emna__ayadi
2
1.1k
Transcript
SmartHR のデータ戦略 非構造化データが拓く人的資本経営の未来 株式会社SmartHR 井上 耕太朗 2026/02/12 © SmartHR, Inc.
話すこと 1. SmartHR って何の会社? 2. SmartHR のAI 時代のデータ戦略 3. 非構造化データのリアルと活用
4. 非構造化データ AI における課題 5. SmartHR の目指すデータの先
自己紹介 井上 耕太朗(ML エンジニア) 【工学博士】 前職は画像処理ML 系SaaS プロダクトの開発、PoC 、 客先導入支援などに従事
2025 年4 月からSmartHR に入社 AI-OCR の開発や評価基盤の構築、AI 類似従業員検索 の立ち上げなど担当 ☕ コーヒーとarXiv の知識を入れるのが日課 3
SmartHR って何の会社?
None
None
SmartHR のAI 時代のデータ戦略
SmartHR にある非構造化データ フォーマットが一意でない / 毎年変わるデータが山盛り! キャリア: 履歴書, 職務経歴書 契約書類: 雇用契約書,
誓約書, 請求書 手続き: 保険料控除証明書, 給与所得者の基礎控除申告書 兼 配偶者控除等 申告書 兼 所得金額調整控除申告書 人事評価: 評価シートの評価者および被評価者のコメント その他: 資格やスキル, アンケート回答など 8
これまでの非構造化データの山登り 順番にデータ山を登るしかなかった。職人が構造化ロジックを手作り… ! 9
AI 時代の非構造化データ山の登り方は多様 LLM の登場でデータ山にロープウェイができた 10
SmartHR の非構造化データ山の登り方 蓄積データを軸とした2 ステップ構成+α 11
SmartHR のデータ戦略: データで作るハーベストループ 12
非構造化データのリアルと活用
非構造化データを利用したアプリケーション AI-OCR 様々な履歴書や保険料控除証明書の内容を 読み取り、項目への入力を自動化します。 AI アシスタント 就業規則などのドキュメントを参照して、 従業員の問い合わせ回答を自動化します。 AI 類似従業員検索
従業員データから近しいスキルや経歴の人 材を検索できます。 14
非構造化データの例: 保険料控除証明書 日本生命[1] 第一生命[2] 住友生命[3] 15 [1] https://www.nissay.co.jp/keiyaku/oshirase/hokenryokojo/simulation/img/img-02.jpg [2] https://www.dai-ichi-life.co.jp/examine/deduction/tool/image_v2/img_deduction_02.gif
[3] https://www.sumitomolife.co.jp/infolist/revise/sinkokutool/images/image2.png
非構造化データのデータ蓄積: AI-OCR マルチモーダルLLM とルールベースの組み合わせで柔軟性と品質を担保 構造化されたデータは蓄積され、SmartHR の人的資本データを豊かにする 16
非構造化データのプロダクト活用: AI 類似従業員検索 蓄積されたデータで人的資本経営の示唆を与える 17
非構造化データの概念実証への応用: 申請データの模造 申請には差し戻しがつきものだが、どのような解決策が効果的なのか不明確 そこで既存の申請傾向を分析し、生成AI で構築した申請シミュレーション環境 で解決策の適用可能性を定量評価。 妥当性の高い示唆が得られている。 18
非構造化データ AI における課題
非構造化データ活用における課題は山積み 事業活用面では法律/ モラルと品質保証の大きく2 つの課題がある 法律/ モラル的課題 ( 非構造化データに限らない) 見知らぬところで自身/ 自社のデータが利用されるのは当然不安
→ ユーザ許諾はもちろん、法務・セキュリティ部門のレビューを徹底 データガバナンスの整備も重要 品質保証の課題 AI 出力は常に一意とはならないが、説明性が求められる場合がある → 何でもプロンプトやモデルで解決しない, 品質監視基盤も必要 20
不確実な出力と価値提供に向き合う基本の「き」 リリース判断用のデータと、その健康状態を定量的に測定できる指標を予め用 意して監視。特に前者はドメインエキスパートのノウハウが重要。 21
実際にあったこと 監視体制が有ったため難を逃れた事例が多い。 解決策はAI 部分だけとも限らないのでチーム全体での課題認識も大切。 ある日を境に突如AI 出力の傾向に変化が! → オンライン評価で発覚し調査、ルールベース追加で対応 利用モデルのサポート終了期限が! →
オフライン評価でリリース判断、オンライン評価で性能監視 なんでこうなるの?系問い合わせが! → トレースログから問題を特定、対象ケースでのUI 改善 22
SmartHR の目指すデータの先
大変だけど面白い世界も広がっている SmartHR に眠る大量のコンテキストはまだ掘り出し切れていない! 24
SmartHR の目指すデータの先 目指すは唯一無二の人的資本経営プラットフォーム! 各プロダクトで生まれた構造化・非構造化データを意味のある形で蓄積 プロダクトを使うほどデータが溜まり、できることがさらに多機能に SmartHR のデータ活用に興味があれば、ぜひカジュアル面談から! 25