Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
NIKKEI Tech Talk#38
Search
cipepser
October 23, 2025
Programming
1.2k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
NIKKEI Tech Talk#38
cipepser
October 23, 2025
More Decks by cipepser
See All by cipepser
long-running-tasks
cipepser
3
480
layerx-fde-practices
cipepser
6
3k
LayerXにおけるFDEについて
cipepser
3
3.1k
20250725-bet-ai-day
cipepser
3
660
Criterion-rs
cipepser
0
170
Practical Anonify
cipepser
2
910
procedural-macros
cipepser
0
210
Move for Libra written in Rust
cipepser
2
3.3k
How IBLT Works
cipepser
0
270
Other Decks in Programming
See All in Programming
net-httpのHTTP/2対応について
naruse
0
440
jQueryをバージョンアップする前に使いたいjQuery Migrate
matsuo_atsushi
0
190
PHPで使える日時の表現と、その知り方 #frontend_phpcon_do
o0h
PRO
0
190
AIとASP.NET Coreで雑Webアプリを作った話
mayuki
0
320
ふつうのFeature Flag実践入門
irof
7
3.6k
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
290
Inside Stream API
skrb
1
640
Datadog × OpenTelemetry 入門と実践のあいだ
kn_to_maxpno
1
140
気づいたらRubyで100作品 ー クリエイティブコーディングが生活の一部になるまで / 100 Ruby Sketches Later: How Creative Coding Became Part of My Life
chobishiba
3
540
JJUG CCC 2026 Spring: JSpecify で実現する Kotlin フレンドリーな Java API 設計
ternbusty
1
140
「AIで開発し、AIを届ける」をEvalでつなぐ 〜AIネイティブに始めるプロダクト開発の実践〜 / Connecting "Develop with AI, deliver AI" with Eval
rkaga
4
2.4k
CLIであることを活かしたGitHub Copilot CLI活用術 / GitHub Copilot CLI Pro Tips & Tricks
nao_mk2
1
1.2k
Featured
See All Featured
GraphQLとの向き合い方2022年版
quramy
50
15k
A brief & incomplete history of UX Design for the World Wide Web: 1989–2019
jct
2
390
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
How to train your dragon (web standard)
notwaldorf
97
6.7k
brightonSEO & MeasureFest 2025 - Christian Goodrich - Winning strategies for Black Friday CRO & PPC
cargoodrich
3
720
Faster Mobile Websites
deanohume
310
31k
Art, The Web, and Tiny UX
lynnandtonic
304
22k
Rails Girls Zürich Keynote
gr2m
96
14k
How to build an LLM SEO readiness audit: a practical framework
nmsamuel
1
770
Large-scale JavaScript Application Architecture
addyosmani
515
110k
RailsConf 2023
tenderlove
30
1.5k
Transcript
© LayerX Inc. 1 Forward Deployed Engineerが最速でドメインを キャッチアップするツールでのエージェント活⽤ 2025/10/23 NIKKEI
Tech Talk 株式会社LayerX Ai Workforce事業部 恩⽥壮恭
2 Confidential © 2025 LayerX Inc. 自己紹介 • 恩田壮恭(おんだまさのり) ◦
cipepser/cipe(さいぺ) • LayerX Ai Workforce事業部 • これまで ◦ 新卒で大手証券系SIerでネットワークエンジニア ◦ 暗号資産分野で新規事業立ち上げ ◦ TEEやPrivacyTechなど、技術を軸にした新規プロ ダクトの開発(LayerX歴5年半) • 現在 ◦ FDE(Forward Deployed Engineer)
© LayerX Inc. 3
4 Confidential © 2025 LayerX Inc. 出典: 3M. (2024). 3M
2023 Annual Report. U.S. Securities and Exchange Commission. https://www.sec.gov/Archives/edgar/data/66740/000130817924000309/mmm4298631-ars.pdf
5 Confidential © 2025 LayerX Inc. FDE = Forward Deployed
Engineer • 最前線(Forward)に配置された(Deployed)エンジニア • お客さまとの最前線に立ち、顧客課題を真に理解し、プロダクトの実装・導入を推進する エンジニア • Palantir曰く「スタートアップのCTOに似ている」 • 詳細は筆者が書いた以下ブログにて(魂込めてJD書きました) ◦ Forward Deployed Engineerの募集を開始しました - LayerX エンジニアブログ ◦ https://tech.layerx.co.jp/entry/ai-llm-fde (出典) Palantir Technologies - Forward Deployed Software Engineer https://jobs.lever.co/palantir/dab396d4-2f14-4796-aac0-0d82883dccf0
最前線で ドメインへディープダイブする
7 Confidential © 2025 LayerX Inc. ドメインを知らずして、価値は提供できない • お客さまはどういった業務をしている? ◦
実業務で扱うドキュメントをお預かりし、徹底的に読み解く ▪ 何がインプットで、何をアウトプットすべきか ▪ LLMで処理すべきか、ルールベースで処理すべきか ◦ マスターファイルの更新頻度は?古くなった資料も当時の証跡として残したい? • 関係するステークホルダーは? ◦ 関連会社、ベンダー、他部署からの入力資料 ▪ メールで来る?基幹システムから出力? ◦ 出力はどのようなステークホルダーに展開される?所定のフォーマットはある?
8 Confidential © 2025 LayerX Inc. 内製ツール「Onboard Lens」 デモをします
9 Confidential © 2025 LayerX Inc. エージェントをうまく動かすための工夫 品質保証‧予測可能性 エッジケースへの対応 •
決定論的な動作をするものはtoolとして定義 ◦ 何でもかんでもLLMにやらせない • toolの品質はソフトウェア工学の肩に乗る (CI/CDなど) • エージェントのプロンプトの作り込み • タスクリストを人間とエージェントの二人 で更新 • ファイルをメッセージからすぐ開いて確 認できるUI コンテキストエンジニアリング • 必要なコンテキストを検索して選択させるUI
なぜ、現在AIやLLM、エージェントは 我々の業務を代替してくれないのか
11 Confidential © 2025 LayerX Inc. クリアするために膨大なStep数が必要なベンチマーク 2025年8月 ポケモンクリスタル [3]
factorio [2] ポケモン⾚ [1] 2025年3月 2025年2月 [1] Claude's extended thinking \ Anthropic https://www.anthropic.com/news/visible-extended-thinking [2] Hopkins, Jack, Mart Bakler, and Akbir Khan. "Factorio learning environment." arXiv preprint arXiv:2503.09617 (2025). [3] Clad3815 - X https://x.com/Clad3815/status/1955980772575268897 GPT-5 Deepseek-v3, GPT-4-mini, LLaMA-70B, Gemini-2, GPT-4, Claude 3.5 Sonnet Claude 3.5,3.7 Sonnet レッドに勝利👏 (バッジ16個+ラストダンジョン) どのモデルでも複雑度5以上のリソースを 生成できる割合は0% 3.7 Sonnetがマチスに勝利 (バッジ3つ)
12 Confidential © 2025 LayerX Inc. どれだけのStep数をこなせるかは今後重要なKPIになりえる (出典) Measuring AI
Ability to Complete Long Tasks - METR https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/
13 Confidential © 2025 LayerX Inc. Next Step • 多段Stepでエージェントを安定的に動かすためには「エンジニアリング」が必要
• 本質的に確率的な挙動を持つLLMを予測可能なコンポーネントに落とし込めるか ◦ CSやソフトウェア工学の問題に帰着できることも • 現実の業務に溢れているエッジケースへの対処 ◦ 個人的にはLLMが人間の業務を代替できていない主要因と考えている ◦ すべてのエッジケースをプロンプトに網羅的に記載するとLLMの出力が安定しない →動的に必要十分なコンテキストを渡す仕組み ◦ 本日のようにアプリケーションでカバーできる範囲の切り分け
© 2025 LayerX Inc. 14 FDEチーム • FDEはものすごくチャレンジングな職種 • ぶっちゃけ全部やり切るのすごく大変だし、
それを組織として作っていくのも難易度鬼高 いです • だからこそ一緒に働ける仲間を募集していま す!! R&Dチーム • FDE・Ai Workforceの可能性を10xにす るチームとしてR&Dチームが誕生! • 11月11日(火)にイベントやります! ◦ connpassからご登録ください We’re hiring