Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
Search
Har1101
February 13, 2026
Technology
540
2
Share
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
第47回 JAWS-UG札幌 勉強会 コンテナ特集!での登壇資料です。誰なんと言おうとコンテナの話です()
Har1101
February 13, 2026
More Decks by Har1101
See All by Har1101
AgentCore×VPCでの設計パターンn選と勘所
har1101
4
350
AgentCore RuntimeからS3 Filesをマウントしてみる
har1101
4
530
AgentCore Session Storageで激安RAG作るためのあれやこれや
har1101
4
300
今日から始めるAmazon Bedrock AgentCore
har1101
4
510
My First Year as a Community Builder
har1101
3
320
EventBridge API Destination × AgentCore Runtimeで実現するLambdaレスなイベント駆動エージェント
har1101
7
350
AgentCoreとHuman in the Loop
har1101
5
430
スケジュール駆動なエージェントを作ろう!
har1101
4
900
AIエージェントの設計で注意するべきポイント6選
har1101
7
4.1k
Other Decks in Technology
See All in Technology
独断と偏見で試してみる、 シングル or マルチエージェント どっちがいいの?
shichijoyuhi
1
210
AzureのIaC管理からログ調査まで、随所に役立つSkillsとCustom-Instructions / Boosting IaC and Log Analysis with Skills
aeonpeople
0
340
ハーネスエンジニアリングの概要と設計思想
sergicalsix
9
6.4k
Microsoft 365 / Microsoft 365 Copilot : 自分の状態を確認する「ラベル」について
taichinakamura
0
410
今年注目する!データ分析プラットフォームでのAIの活用
nayuts
0
170
Modernizing Your HCL Connections Experience: Visual Report to chain, Profile Enhancements, and AI Integration
wannesrams
0
190
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (後半)
oracle4engineer
PRO
1
130
目的ファーストのハーネス設計 ~ハーネスの変更容易性を高めるための優先順位~
gotalab555
9
3.4k
AI時代 に増える データ活用先
takahal
0
340
基盤を育てる 外部SaaS連携の運用
gamonges_dresscode
1
120
Practical TypeProf: Lessons from Analyzing Optcarrot
mame
1
1.4k
AIが自律的に働く時代へ Amazon Quick で実現するAIエージェント紹介
koheiyoshikawa
0
150
Featured
See All Featured
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
520
Rails Girls Zürich Keynote
gr2m
96
14k
A Tale of Four Properties
chriscoyier
163
24k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
122
21k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
180
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
470
ラッコキーワード サービス紹介資料
rakko
1
3.1M
Designing Experiences People Love
moore
143
24k
Facilitating Awesome Meetings
lara
57
6.8k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
The Cult of Friendly URLs
andyhume
79
6.9k
Transcript
社内システムもOKな ブラウザエージェントを作ってみた! 2026/02/13 (金) 第47回 JAWS-UG札幌 勉強会 コンテナ特集! 福地開
(技術的には)社内システムもOKな ブラウザエージェントを作ってみた! 2026/02/13 (金) 第47回 JAWS-UG札幌 勉強会 コンテナ特集! 福地開
Who am I ? 福地 開 (ふくち はるき) @har1101mony 所属:NECソリューションイノベータ/JAWS-UG東京
年次:3年目 業務:Agent Builder 実績:AWS Community Builders (AI Engineering) 2025 Japan AWS Jr.Champions 2025 Japan All AWS Certifications Engineers
今日話すこと ◆Bedrock AgentCoreを用いたブラウザ操作エージェントについて • きっかけ:社内re:Capにてこんな質問が… • 解決策:Chrome拡張機能 • 設計・実装解説 •
デモ • まとめ ※資料中で「AI」と記載しているものは「生成AI」とりわけ「LLM」のことを指します ※所属組織とは一切関係ない、私個人の意見・考えとなります
きっかけ:社内re:Capにて こんな質問が…
社内Webシステムへの入力を自動化できないの? ◆恐らく勤怠登録・PJ登録などを自動化したいという願望がある エージェントで 入力自動化 できないんか?
社内Webシステムへの入力を自動化できないの? ◆AWSにおけるAIエージェント×ブラウザ操作といえば以下3つ • Amazon Bedrock AgentCore Browser: リモートブラウザ環境 • Amazon
Nova Act : ブラウザエージェントを作って運用するサービス • Strands Agents: AWSが提供するエージェント作成フレームワーク • 組み合わせると、リモートブラウザ上でセキュアにエージェントを動かせる https://aws.amazon.com/jp/nova/act/ https://github.com/awslabs/amazon-bedrock-agentcore-samples/tree/main/01- tutorials/05-AgentCore-tools/02-Agent-Core-browser-tool
弊社だと現状は厳しそう… ◆しかしAgentCore Browser上で社内システムにアクセスしようと しても色んな制約で上手く行かない • 社内ネットワークとの接続、ログイン方法、証明書など…
弊社だと現状は厳しそう… ◆しかしAgentCore Browser上で社内システムにアクセスしようと しても色んな制約で上手く行かない • 社内ネットワークとの接続、ログイン方法、証明書など… ◆Browser自体は近日のアップデートで徐々に機能拡充が進む • Amazon Bedrock
AgentCore Browser now supports custom browser extensions →Chrome拡張機能をセッション起動時に自動インストールできるように • Amazon Bedrock AgentCore Browser now supports browser profiles →ログイン状態を保存して、別セッションでも再利用できるように • とはいえVPC内にBrowserを配置して社内ネットワークと繋いで… とするのは大変…
(でもそろそろできるようになりそう…) ◆2日前に出たばっかりのやつなので一旦見なかったこととします
解決策:Chrome拡張機能
Chrome拡張 with エージェント ◆今開いているブラウザを操作するエージェントがあればできそう • 以下ブログを参考に、エージェントをChrome拡張のバックエンドで動かす • 会社用PC上でChromeを開いて拡張機能を有効にする形 • 開いているWebページを自然言語で操作するAIエージェントを作ったよ(Zenn)
◆これで以下の課題を解決する • エージェントが動作し、かつ社内ネットワークにも接続できる安全な環境を 用意するのが面倒 • ログインした状態でエージェントに操作を任せたい • エージェントには自律的に、でも暴走しないようにコントロールしたい • ローカルのエージェント+Chromeでもできるが人を選ぶので、 Web上で認証さえ通れば社内の誰でも使えるような汎用性がほしい
(余談)ローカルのエージェント×MCPの場合 ◆使うまでのハードルが高すぎる • コーディングエージェント使用の申請出して… • ローカルにコーディングエージェント入れて… • uvやnode入れて… • Playwright/Chrome
DevTools MCPサーバー or Agent Browser設定して… • 使い方をSkillsなどで設定して… • 社内プロキシ回避の設定入れて… • エージェントに指示すればOK! だったら自分 でやるわ 簡単でしょ? (X民の感覚)
設計・実装解説
設計:使われるAIエージェントを目指すために ◆接点を増やすため、できるだけ普段使うツールに寄せることが大事 • Chromeなら毎日使うし、拡張機能ワンクリックで使えるのが大きい • 他にもSlack/TeamsなどのコミュニケーションツールやIDEなど • 人によってはExcelやスプレッドシート?(Claude in Excelに期待)
• 最近だと物理デバイスをエージェント化するケースも? ◆逆に独自アプリだと1つハードルが上がる • わざわざそのサイトにアクセスしないといけない時点でハードルがありそう • とはいえチャット以外の機能も求めると、アプリ化は必須 • 人とエージェントのインターフェース設計が重要 • AgentCoreは割と色んなところに生やせるので色んな方法を試していきたい
アーキテクチャ ◆Chrome拡張機能からエージェントを呼び出す形 • API Gateway+Lambda+AgentCore Runtime(Docker)+Bedrockの王道構成 • ストリーミングレスポンスのため、API GatewayはREST APIで
LambdaはNode.jsを用いる • Strands Agentsには画面操作用のツールと、日付やカレンダーを取得する ツールを使えるようにしている
エージェントとChrome拡張の実装 ◆エージェントがセキュアに画面を操作する仕組み • エージェントに直接画面を操作させると、万が一暴走した時にリスクあり • エージェントは必要に応じてブラウザ操作ツールを使う →ただし直接ブラウザを操作するのではなく、jsonを返すだけ • Chrome拡張機能側でそのコマンドをプログラムとして実行する
デモ ◆朝、勤怠登録を自動化するイメージ • 人が勤怠登録を依頼 • エージェントは現在の日付を取得し 前の労働日が何月何日なのかを把握する • 該当する日付を対象に、カレンダーで スケジュールを取得する
• そのスケジュールを元に勤怠登録を行う
None
まとめ ◆AgentCore BrowserやNova Act、個人的には期待大 • 昨年11月頃までは日本語がBrowser上で表示されなかったが、 今では表示されるようになっている • ただ、場合によっては既存で用意されている機能やサービス以外を 使う選択肢もありそう
◆エージェントを使うスキルと作るスキル、両方が求められる • 日常からエージェントに触れることでどんなことができる/できないのかを 正しく認識する必要がある • 手を動かして色んな手法を模索していきましょう • どうすればより使ってもらえるのかも模索していきます!
まとめ ◆AgentCore BrowserやNova Act、個人的には期待大 • 昨年11月頃までは日本語がBrowser上で表示されなかったが、 今では表示されるようになっている • ただ、場合によっては既存で用意されている機能やサービス以外を 使う選択肢もありそう
◆エージェントを使うスキルと作るスキル、両方が求められる • 日常からエージェントに触れることでどんなことができる/できないのかを 正しく認識する必要がある • 手を動かして色んな手法を模索していきましょう • どうすればより使ってもらえるのかも模索していきます! • ちなみに会社のルール的に勝手にブラウザ操作自動化ツールなど使っちゃ ダメらしいので、御蔵入りです!