Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
株式会社BLUEISH 「情報収集をAI Agentに任せるため、 プロンプトもLLMが更新す...
Search
Ryo Kanazawa
February 27, 2025
0
370
株式会社BLUEISH 「情報収集をAI Agentに任せるため、 プロンプトもLLMが更新するようにした話
Ryo Kanazawa
February 27, 2025
Tweet
Share
More Decks by Ryo Kanazawa
See All by Ryo Kanazawa
株式会社Elith「AI エージェントは何に使うべきか」
ryo1443
1
490
久保田 崇文氏「Cloud Run, Firestore, LangGraph を使ったAgentic Chatbot」
ryo1443
0
370
株式会社ABEJA「GENIAC2期におけるABEJAの取り組み」
ryo1443
0
370
SambaNova Systems「SambaNova Cloud: 超高速な推論APIでAIエージェント開発を加速」
ryo1443
0
370
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
Making the Leap to Tech Lead
cromwellryan
133
9.1k
Agile that works and the tools we love
rasmusluckow
328
21k
Rails Girls Zürich Keynote
gr2m
94
13k
It's Worth the Effort
3n
184
28k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.3k
Side Projects
sachag
452
42k
Site-Speed That Sticks
csswizardry
4
430
Designing for humans not robots
tammielis
250
25k
Fireside Chat
paigeccino
37
3.2k
Git: the NoSQL Database
bkeepers
PRO
429
65k
Automating Front-end Workflow
addyosmani
1369
200k
Transcript
情報収集をAI Agentに任せるため、 プロンプトもLLMが更新するようにした話 戸塚 翔太 2025.02.19 ©Blueish 2024. All rights
reserved.
AIがリアクション(だけ)する時代は終わった。 これからはアクションさせよう! ©Blueish 2024. All rights reserved.
興味がありそうなNewsを通知してくれるbot (深夜も構わず送ってくる) ©Blueish 2024. All rights reserved.
01 最近考えていること 02 botの構成 03 技術構成 04 課題 05 今後やりたいこと
目次 ©Blueish 2024. All rights reserved.
自己紹介 ©Blueish 2024. All rights reserved. 戸塚 翔太 Shota Totsuka
・Software Engineer(Go/Python/TypeScript) ・生成AI, 機械学習 ・趣味: ウィンタースポーツ, LLM Agents ・静岡県(浜松)に住んでます 近くの方がいれば、一緒に勉強会しましょう! Xアカウント @totsukash
会社紹介 ©Blueish 2024. All rights reserved. 会社名 株式会社BLUEISH 代表者 為藤アキラ
設立 2018年2月9日 所在地 〒106-0046 東京都港区元麻布3丁目1-35 VORT元麻布 5F 事業内容 ・WEBシステム開発 ・スマートフォンアプリケーション開発 資本金 10,000,000円
©Blueish 2024. All rights reserved.
01 最近考えていること ©Blueish 2024. All rights reserved.
©Blueish 2024. All rights reserved. • RSSは流し読みでも量が多い • 「この記事を要約して」など毎回指示するのがめんどくさい ◦
プロンプト入力はもちろん、URLなどinputを渡すこともめんどくさい • LLMが自発的に稼働して勝手に進めてくれないか • 人間がサボるとAIもサボる(稼働しない) 情報収集がめんどくさい ① 最近考えていること
©Blueish 2024. All rights reserved. • LLMを使用して自律的にタスク を行うシステム • LLMが計画を立て、ツール(関
数)を使い、タスクをこなす AI Agentとは ① 最近考えていること https://www.pinecone.io/learn/langgraph-research-agent/
©Blueish 2024. All rights reserved. • 人間とAIの違いは何か? ◦ 実は人間も、日々の大量のinputをもとにリアクションしているだけでは? ◦
AIにも大量のinputを常に与え続ければそれっぽくなるのでは? ◦ 自分と同じ量のinputを与えてみよう ◦ 自分の行動を記録して真似(実装)しよう • 100%の精度は不要。60%でもいいからAIから人間に提案して欲しい ◦ 人間はそのタスクを始めるまでの一歩に時間がかかる ◦ Human-in-the-Loopのように人間のフィードバック/作業を含めることが前提 どうやってActionさせるか? ① 最近考えていること
©Blueish 2024. All rights reserved. botの構成 02
©Blueish 2024. All rights reserved. ② botの構成 プロンプト (.txt) Good
/ Bad
©Blueish 2024. All rights reserved. 技術構成 03
©Blueish 2024. All rights reserved. • Python • gemini-2.0-flash ◦
LiteLLMにて各ProviderのAPI呼び出しInterfaceを統一 ◦ LangGraph • Firecrawl/JinaAI(Reader) • LangSmithでログ収集 • 今後取り入れたい,検証したいもの ◦ Slack連携以外をDifyに切り出す 言語・モデル ③ 技術構成
©Blueish 2024. All rights reserved. 課題 04
©Blueish 2024. All rights reserved. • LLMのRateLimit ◦ RSSアプリの都合上瞬間的に大量に送られることがあるため、現在はキューイ ングで対応。割り当て上限の引き上げも検討
• 料金 ◦ Geminiが安いが、それでも1万円/月 は超えそう • 精度 ◦ 通知されたNewsしか確認しておらず、全てを評価できていない ◦ 個人に最適化されており、複数人での使用に最適化できていない 現在の課題 ④ 課題
©Blueish 2024. All rights reserved. • LLMが不要と判断した情報が「本当に不要だったか」の評価 • LLMの呼び出し回数が多すぎる場合にどこまで評価できるか •
自分に必要となる情報が変わった時に取得する情報も切り替えられる仕組み 今後の課題 ④ 課題
©Blueish 2024. All rights reserved. 今後やりたいこと 05
©Blueish 2024. All rights reserved. • Slack/LINE/Discord/メール などのテキストメッセージ • Xのタイムライン情報
• PCの操作ログ • …etc 人間が取得している情報をできるだけ多くLLMへ渡し、先回りして行動できるAgentを 作りたいと思っています。 人間と同じ量のイベントをLLMに ⑤ 今後やりたいこと
©Blueish 2024. All rights reserved. • 0→1フェーズの事業立ち上げ ◦ 2024年〜新規事業:業界特化型AIワークフローBPaaS 「Omni
Workspace」の開発をスタート ◦ IVS2024 KYOTO「Generative AI 起業家ピッチ」準優勝 ◦ シードラウンドで3億円の資金調達を実施 • 経験豊富なメンバーで開発 ◦ 役員の5/8がCTO・CIO経験者 ◦ Google、マイクロソフト出身のメンバーを迎え、更に体制強化中 • 最先端のAI技術を積極的に活用 AIエンジニア、フルスタックエンジニア、コーポレート エンジニア、SREなどのポジションで積極的に採用中! 採用について 【Wantedly】
ご清聴ありがとうございました。 ©Blueish 2024. All rights reserved.