Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Har1101
February 13, 2026
Technology
2
480
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
第47回 JAWS-UG札幌 勉強会 コンテナ特集!での登壇資料です。誰なんと言おうとコンテナの話です()
Har1101
February 13, 2026
Tweet
Share
More Decks by Har1101
See All by Har1101
今日から始めるAmazon Bedrock AgentCore
har1101
4
450
My First Year as a Community Builder
har1101
3
120
EventBridge API Destination × AgentCore Runtimeで実現するLambdaレスなイベント駆動エージェント
har1101
7
320
AgentCoreとHuman in the Loop
har1101
5
310
スケジュール駆動なエージェントを作ろう!
har1101
4
810
AIエージェントの設計で注意するべきポイント6選
har1101
7
3.7k
Now, go out
har1101
4
260
AWS re:Inventから考える、2026年のAIエージェント開発
har1101
2
670
CBとして行く初re:Invent 挑戦と失敗
har1101
2
360
Other Decks in Technology
See All in Technology
男(監査)はつらいよ - Policy as CodeからAIエージェントへ
ken5scal
5
720
Datadog Cloud Cost Management で実現するFinOps
taiponrock
PRO
0
130
AI Coding Agentの地殻変動 ~ ai-coding.info の定点観測 ~
kotauchisunsun
1
510
AI時代にエンジニアはどう成長すれば良いのか?
recruitengineers
PRO
1
120
AI Agentにおける評価指標とAgent GPA
tsho
1
280
primeNumber DATA MANAGEMENT CAMP #2:
masatoshi0205
1
680
Introduction to Bill One Development Engineer
sansan33
PRO
0
380
DX Improvement at Scale
ntk1000
2
240
LLM活用の壁を超える:リクルートR&Dの戦略と打ち手
recruitengineers
PRO
1
220
Introduction to Sansan Meishi Maker Development Engineer
sansan33
PRO
0
360
「データとの対話」の現在地と未来
kobakou
0
1.3k
Devinを導入したら予想外の人たちに好評だった
tomuro
0
860
Featured
See All Featured
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
60
42k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Unlocking the hidden potential of vector embeddings in international SEO
frankvandijk
0
190
Fireside Chat
paigeccino
42
3.8k
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
4.2k
How to train your dragon (web standard)
notwaldorf
97
6.5k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Future Trends and Review - Lecture 12 - Web Technologies (1019888BNR)
signer
PRO
0
3.3k
DBのスキルで生き残る技術 - AI時代におけるテーブル設計の勘所
soudai
PRO
62
51k
The Language of Interfaces
destraynor
162
26k
Rails Girls Zürich Keynote
gr2m
96
14k
Transcript
社内システムもOKな ブラウザエージェントを作ってみた! 2026/02/13 (金) 第47回 JAWS-UG札幌 勉強会 コンテナ特集! 福地開
(技術的には)社内システムもOKな ブラウザエージェントを作ってみた! 2026/02/13 (金) 第47回 JAWS-UG札幌 勉強会 コンテナ特集! 福地開
Who am I ? 福地 開 (ふくち はるき) @har1101mony 所属:NECソリューションイノベータ/JAWS-UG東京
年次:3年目 業務:Agent Builder 実績:AWS Community Builders (AI Engineering) 2025 Japan AWS Jr.Champions 2025 Japan All AWS Certifications Engineers
今日話すこと ◆Bedrock AgentCoreを用いたブラウザ操作エージェントについて • きっかけ:社内re:Capにてこんな質問が… • 解決策:Chrome拡張機能 • 設計・実装解説 •
デモ • まとめ ※資料中で「AI」と記載しているものは「生成AI」とりわけ「LLM」のことを指します ※所属組織とは一切関係ない、私個人の意見・考えとなります
きっかけ:社内re:Capにて こんな質問が…
社内Webシステムへの入力を自動化できないの? ◆恐らく勤怠登録・PJ登録などを自動化したいという願望がある エージェントで 入力自動化 できないんか?
社内Webシステムへの入力を自動化できないの? ◆AWSにおけるAIエージェント×ブラウザ操作といえば以下3つ • Amazon Bedrock AgentCore Browser: リモートブラウザ環境 • Amazon
Nova Act : ブラウザエージェントを作って運用するサービス • Strands Agents: AWSが提供するエージェント作成フレームワーク • 組み合わせると、リモートブラウザ上でセキュアにエージェントを動かせる https://aws.amazon.com/jp/nova/act/ https://github.com/awslabs/amazon-bedrock-agentcore-samples/tree/main/01- tutorials/05-AgentCore-tools/02-Agent-Core-browser-tool
弊社だと現状は厳しそう… ◆しかしAgentCore Browser上で社内システムにアクセスしようと しても色んな制約で上手く行かない • 社内ネットワークとの接続、ログイン方法、証明書など…
弊社だと現状は厳しそう… ◆しかしAgentCore Browser上で社内システムにアクセスしようと しても色んな制約で上手く行かない • 社内ネットワークとの接続、ログイン方法、証明書など… ◆Browser自体は近日のアップデートで徐々に機能拡充が進む • Amazon Bedrock
AgentCore Browser now supports custom browser extensions →Chrome拡張機能をセッション起動時に自動インストールできるように • Amazon Bedrock AgentCore Browser now supports browser profiles →ログイン状態を保存して、別セッションでも再利用できるように • とはいえVPC内にBrowserを配置して社内ネットワークと繋いで… とするのは大変…
(でもそろそろできるようになりそう…) ◆2日前に出たばっかりのやつなので一旦見なかったこととします
解決策:Chrome拡張機能
Chrome拡張 with エージェント ◆今開いているブラウザを操作するエージェントがあればできそう • 以下ブログを参考に、エージェントをChrome拡張のバックエンドで動かす • 会社用PC上でChromeを開いて拡張機能を有効にする形 • 開いているWebページを自然言語で操作するAIエージェントを作ったよ(Zenn)
◆これで以下の課題を解決する • エージェントが動作し、かつ社内ネットワークにも接続できる安全な環境を 用意するのが面倒 • ログインした状態でエージェントに操作を任せたい • エージェントには自律的に、でも暴走しないようにコントロールしたい • ローカルのエージェント+Chromeでもできるが人を選ぶので、 Web上で認証さえ通れば社内の誰でも使えるような汎用性がほしい
(余談)ローカルのエージェント×MCPの場合 ◆使うまでのハードルが高すぎる • コーディングエージェント使用の申請出して… • ローカルにコーディングエージェント入れて… • uvやnode入れて… • Playwright/Chrome
DevTools MCPサーバー or Agent Browser設定して… • 使い方をSkillsなどで設定して… • 社内プロキシ回避の設定入れて… • エージェントに指示すればOK! だったら自分 でやるわ 簡単でしょ? (X民の感覚)
設計・実装解説
設計:使われるAIエージェントを目指すために ◆接点を増やすため、できるだけ普段使うツールに寄せることが大事 • Chromeなら毎日使うし、拡張機能ワンクリックで使えるのが大きい • 他にもSlack/TeamsなどのコミュニケーションツールやIDEなど • 人によってはExcelやスプレッドシート?(Claude in Excelに期待)
• 最近だと物理デバイスをエージェント化するケースも? ◆逆に独自アプリだと1つハードルが上がる • わざわざそのサイトにアクセスしないといけない時点でハードルがありそう • とはいえチャット以外の機能も求めると、アプリ化は必須 • 人とエージェントのインターフェース設計が重要 • AgentCoreは割と色んなところに生やせるので色んな方法を試していきたい
アーキテクチャ ◆Chrome拡張機能からエージェントを呼び出す形 • API Gateway+Lambda+AgentCore Runtime(Docker)+Bedrockの王道構成 • ストリーミングレスポンスのため、API GatewayはREST APIで
LambdaはNode.jsを用いる • Strands Agentsには画面操作用のツールと、日付やカレンダーを取得する ツールを使えるようにしている
エージェントとChrome拡張の実装 ◆エージェントがセキュアに画面を操作する仕組み • エージェントに直接画面を操作させると、万が一暴走した時にリスクあり • エージェントは必要に応じてブラウザ操作ツールを使う →ただし直接ブラウザを操作するのではなく、jsonを返すだけ • Chrome拡張機能側でそのコマンドをプログラムとして実行する
デモ ◆朝、勤怠登録を自動化するイメージ • 人が勤怠登録を依頼 • エージェントは現在の日付を取得し 前の労働日が何月何日なのかを把握する • 該当する日付を対象に、カレンダーで スケジュールを取得する
• そのスケジュールを元に勤怠登録を行う
None
まとめ ◆AgentCore BrowserやNova Act、個人的には期待大 • 昨年11月頃までは日本語がBrowser上で表示されなかったが、 今では表示されるようになっている • ただ、場合によっては既存で用意されている機能やサービス以外を 使う選択肢もありそう
◆エージェントを使うスキルと作るスキル、両方が求められる • 日常からエージェントに触れることでどんなことができる/できないのかを 正しく認識する必要がある • 手を動かして色んな手法を模索していきましょう • どうすればより使ってもらえるのかも模索していきます!
まとめ ◆AgentCore BrowserやNova Act、個人的には期待大 • 昨年11月頃までは日本語がBrowser上で表示されなかったが、 今では表示されるようになっている • ただ、場合によっては既存で用意されている機能やサービス以外を 使う選択肢もありそう
◆エージェントを使うスキルと作るスキル、両方が求められる • 日常からエージェントに触れることでどんなことができる/できないのかを 正しく認識する必要がある • 手を動かして色んな手法を模索していきましょう • どうすればより使ってもらえるのかも模索していきます! • ちなみに会社のルール的に勝手にブラウザ操作自動化ツールなど使っちゃ ダメらしいので、御蔵入りです!