Upgrade to Pro — share decks privately, control downloads, hide ads and more …

MicrosoftのOSSだけでAIによるブラウザテストを構成する

 MicrosoftのOSSだけでAIによるブラウザテストを構成する

.NETラボ 勉強会 2025年1月の登壇資料です。
https://dotnetlab.connpass.com/event/341044/

スライド内のリンク
OpenAIからついにキタ!Operator
https://openai.com/index/introducing-operator/

AnthropicからはComputer use (beta)
https://docs.anthropic.com/en/docs/build-with-claude/computer-use

Google DeepMindからはProject Mariner
https://deepmind.google/technologies/project-mariner/

browser-use
https://docs.browser-use.com/introduction

Prompty
https://prompty.ai/

AOAIDevDay Recap!簡単便利にプロンプト管理できると噂のPromptyをわいがや試す会
https://azure-waigaya.connpass.com/event/326461/

Promptyに入門したい
https://zenn.dev/ymd65536/articles/prompty_get_started_1

SemanticKernel
https://learn.microsoft.com/ja-jp/semantic-kernel/

Fast and reliable end-to-end testing for modern web apps | Playwright .NET https://playwright.dev/dotnet/

Microsoft Playwrightで始めるブラウザテスト https://speakerdeck.com/ymd65536/microsoft-playwrightdeshi-meruburauzatesuto

SeleniumなしでWebDriverを操作するには - GenAI編
https://zenn.dev/ymd65536/articles/webdriver_without_selenium_genai

【AWS】Amazon Bedrockを使ってブラウザをプロンプトだけで操作してみた(bedrock_browser_agentの開発)
https://qiita.com/ymd65536/items/5f747a9a7c9e0deda84d

【VBA】IEモードでHTMLDocument を取得したり操作したりするための関数を書いた
https://qiita.com/ymd65536-ms/items/320f889e9fc35fe375f1

[2501.09674] Authenticated Delegation and Authorized AI Agents
https://www.arxiv.org/abs/2501.09674

Auth0 AI
https://www.auth0.ai/

Kento.Yamada

January 24, 2025
Tweet

More Decks by Kento.Yamada

Other Decks in Technology

Transcript

  1. 今日話すこと • 自己紹介 • 何をやるか(最初に宣言) • browser-useの話その他の話 • AIによるブラウザ操作とは •

    Microsoftが提供するOSSだけでAIによるブラウザテストは実装できる説 • 今回使うOSSの紹介(Prompty、SemanticKernel、Playwright) • 実現方法の概略 • 実際に動かしてみよう • 他の手法(GeminiやAmazon Bedrockで実装する) • まとめ 4
  2. 山田顕人(Kento.Yamada) @ymd65536 自己紹介 5 仕事:MSP向けシステムの開発(次世代監視基盤の開発、クラウド運用分析) ロール:テックリード・マルチクラウドエンジニア/デベロッパー 活動:.NETラボ勉強会運営、Azure PoC部 Google Cloud

    Partner Top Engineer 2025 DataAnalytics(2024年〜) Google Cloud Partner Tech Blog Challenge 2023 Cloud AI/ML 部門 LINE API Expert(2024年〜) Microsoft MVP for Developer Technologies(2024年〜) LAPRAS OUTPUT AWARD 2024 01 最近のトピック • .NETラボ勉強会のdiscord、123人!(2025年1月15日) • あと3ヶ月でMVP更新月 • 家の給湯器が壊れて死ぬかと思った
  3. 補足:ブラウザを操作する技術 旧来よりさまざまな手法が試されてきた。 • Playwrightを使ったブラウザ操作 • Seleniumと特定のプログラミング言語を使ったブラウザ操作 • WebDriverエンドポイントを使ったブラウザ操作 • VBAとCOMを使ったInternet

    Explorer(IE)ブラウザの操作 • UWSCを使ったInternet Explorer(IE)ブラウザの操作 • Windows32 APIを使ったブラウザ操作 • ヘッドレス専用のブラウザ(PhantomJSなど)を使ったブラウザ操作 • Autoitを使ったブラウザ操作 15
  4. Vertex AI Geminiを使った場合 • Vertex AI SDKで簡単に実装できる 1. 関数定義 2.

    FunctionDeclarationで定義した関数を登録 3. generate_contentでレスポンスを取得 ※実装するんだったらFlash系のモデルがイイ 48
  5. Amazon Bedrockを使った場合 • AWS SDKで簡単に実装できる 1. 関数定義 2. 関数のtoolSpecを作成 3.

    Converse APIを渡して実行 ※model_Id、プロンプト、toolconfig、inferrence_configが必要 53
  6. 63