Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon BedrockでClaude 3.5 Sonnet v2のComputer u...
Search
Champ
October 29, 2024
Technology
110
0
Share
Amazon BedrockでClaude 3.5 Sonnet v2のComputer useを試す
Champ
October 29, 2024
More Decks by Champ
See All by Champ
MCPサーバー、AWSのどこに置く?
champ
0
71
Kiro CLI 徹底解剖
champ
0
8
Amazon Bedrockの自動推論チェックを検証!
champ
0
7
【re:Invent 2024 アプデ】 Prompt Routing の紹介
champ
1
540
【Bedrock×Athena】生成系AIでSlackデータの分析に挑戦
champ
0
220
Amazon Qの全体像を掴んでみよう!
champ
0
79
神アプデ?Amazon Comprehendで 生成系AIの毒性検出に挑戦!
champ
0
370
Bedrockで挑戦! 生成系AIで Slackコミュニケーションの活性化!
champ
0
460
Other Decks in Technology
See All in Technology
インフラを Excel 管理していた組織が 3 ヶ月で IaC 化されるまで
geekplus_tech
3
190
ある製造業の会社全体のAI化に1エンジニアが挑んだ話
kitami
2
990
Rebirth of Software Craftsmanship in the AI Era
lemiorhan
PRO
2
690
CloudSec JP #005 後締め ~ソフトウェアサプライチェーン攻撃から開発者のシークレットを守る~
lhazy
0
210
インターネットの技術 / Internet technology
ks91
PRO
0
110
暗黙知について一歩踏み込んで考える - 暗黙知の4タイプと暗黙考・暗黙動へ
masayamoriofficial
0
1.7k
明日からドヤれる!超マニアックなAWSセキュリティTips10連発 / 10 Ultra-Niche AWS Security Tips
yuj1osm
0
480
Introduction to Sansan Meishi Maker Development Engineer
sansan33
PRO
0
390
DevOpsDays2026 Tokyo Cross-border practices to connect "safety" and "DX" in healthcare
hokkai7go
0
160
猫でもわかるKiro CLI(CDKコーディング編)
kentapapa
1
110
ハーネスエンジニアリングの概要と設計思想
sergicalsix
3
430
システムは「動く」だけでは 足りない - 非機能要件・分散システム・トレードオフの基礎
nwiizo
29
9.1k
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
25
1.8k
Building AI with AI
inesmontani
PRO
1
880
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.9k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
svc-hook: hooking system calls on ARM64 by binary rewriting
retrage
2
210
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
190
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
234
17k
The World Runs on Bad Software
bkeepers
PRO
72
12k
Optimising Largest Contentful Paint
csswizardry
37
3.6k
Rebuilding a faster, lazier Slack
samanthasiow
85
9.5k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
210
Transcript
Amazon Bedrock で Claude 3.5 Sonnet v2 の Computer use
を試す
自己紹介
1. Computer Use API とは Claude 3.5 Sonnet V2 の新機能(ベータ版)
生成系 AI が画面のスクショを見て、マウスカーソルの移動、クリック、キーボー ド入力などの操作を実行可能 以下から利用可能: Anthropic API Amazon Bedrock 主な特徴: スクリーンショットベース操作 マウス・キーボード制御 ブラウザ操作
2. Computer Use Demo について Anthropic が提供する公式サンプルコード: GitHub: anthropics/anthropic-quickstarts Computer
Use API を簡単に試せる環境を提供 デモ環境の特徴: Docker コンテナで起動 Streamlit による Web UI が用意されており、Computer Use API を利用した画面操作 の様子が見れる
3. デモ <別画面で動画を開く>
3. デモ すごい!うごいた! でも、どうやっているの?
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 ユーザーからの指示(プロンプト) 画面のスクリーンショット
Anthropic が定義したツール Computer Tool(マウス・キーボード操作) Text Editor Tool(テキスト編集) Bash Tool(コマンド実行) 2. Claude の処理 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 スクリーンショットの解析 ユーザーからの指示を理解 適切なツールの選択 アクションのシミュレーションし実行すべき操 作を生成 3. 実行
4. Computer Use API の処理の流れ 処理の流れ: 1. 入力 2. Claude
の処理 3. 実行 Claude から実行すべきコマンド・操作を受信 アプリケーション側で実際の操作を実装・実行 結果を新しいスクリーンショットとして取得
5. まとめ 1. Computer Use Demo を使うことで簡単に Computer Use API
を試せる 2. Claude がやってくれるのはコマンドやアクションの生成まで 3. コマンドやアクションを実行するには自分たちが実装する必要があるが、サンプ ルコードが充実しているのでそこまで難しくない